मैं आरएसएस फ़ीड से विभिन्न विवरण प्राप्त करने के लिए पायथन में फीडपार्सर लाइब्रेरी का उपयोग कर रहा हूं। मान लीजिए कि मैंने एक समाचार चैनल के आरएसएस फ़ीड से 25 शीर्षकों के खिताब निकाले हैं। एक घंटे के बाद मैं 25 नई शीर्षकों के शीर्षक की नवीनतम सूची प्राप्त करने के लिए फिर से फीडपार्सर कमांड चलाता हूं। दूसरी बार जब मैं feedparser कमांड चलाता हूं तो सूची को अद्यतन या अद्यतन नहीं किया जा सकता है। कुछ शीर्षकों में समान हो सकता है और कुछ नए हो सकते हैं। मुझे यह जांचने में सक्षम होना चाहिए कि क्या किसी भी समाचार की शीर्षकों में अपडेट किया गया है, जो कि पहले के समय में खींचा गया था। केवल नए शीर्षकों को डेटाबेस में धक्का दिया जाना चाहिए। यह डुप्लिकेट डेटाबेस में डंप होने से बचने के लिए है।पायथन में एक आरएसएस फ़ीड अपडेट किया गया है या नहीं?
import feedparser
d = feedparser.parse('www.news.example.xml')
for item in d.entries:
hndlr.write(item.title) #data being dumped into a database
मैं अगर वहाँ सुर्खियों (शीर्षक) में किसी भी अद्यतन था जाँच उपरोक्त कोड हर घंटे चलाने के लिए और करने में सक्षम होने की जरूरत है: नीचे की तरह
कोड लग रहा है। और यदि पहले घंटे निकाले गए डेटा के साथ कोई बदलाव आया था, तो केवल नए डेटा को डेटाबेस में डाला जाना चाहिए।
क्या कोई मेरी मदद कर सकता है?