2010-10-16 13 views
19

मुझे आश्चर्य है कि Google रीडर, ब्लॉगलाइन, टेक्रोनटी काम करता है, और एक समय में क्रॉन नौकरी का उपयोग करके लाखों आरएसएस फ़ीड का विश्लेषण करने के लिए वे किस तकनीक का पालन करते हैं?कितना बड़ा आरएसएस रीडर काम करता है (netvibes, Google reader ...)

उत्तर

39

विभिन्न तकनीकों के लॉट है ... "सबसे खराब" एक जिसे आप वर्णन करते हैं। (समय आधारित मतदान)।

पहली बात यह है कि आपको विचार करने की आवश्यकता है कि वे सर्वर सर्वर पर पार्सिंग नहीं कर सकते हैं। उदाहरण के लिए, मुझे पता है कि नेटविब्स क्लाइंट साइड पर पार्सिंग कर रहा था (लेकिन सर्वर पर सामग्री को कैश किया गया था), इसलिए इससे उन्हें बहुत सारे संसाधन बचाए गए। इस तरह वे केवल तभी फ़ीड करते हैं जब उपयोगकर्ता उनसे पूछा जाता है, इसलिए उन्हें किसी प्रकार का समय लूप चलाने की आवश्यकता नहीं है।

समय-समय पर मतदान अभी भी सबसे अधिक समाधान है। चुनाव करने के लिए सबसे अच्छा समय कब निर्धारित करने के लिए कई तकनीकें हैं। पिछले अपडेट की आवृत्ति के आधार पर, जो संदेह करने वाले उपयोगकर्ताओं की संख्या के आधार पर ... आदि। पुराने एक्सएमएल-आरपीसी पिंग सर्वर का भी इन लोगों द्वारा उपयोग किया जा सकता है।

सबसे कुशल तकनीक PubSubHubbub का उपयोग करना है, जो Google रीडर, नेटविब्स और कुछ हज़ार अन्य ऐप्स (जैसे Digg.com, Twitterfeed, Friendfeed ...) द्वारा उपयोग किया जाने वाला एक खुला प्रोटोकॉल है। यह एक खुला प्रोटोकॉल है जो फ़ीड प्रकाशक को एप्लिकेशन की सदस्यता लेने के लिए फ़ीड की सामग्री को सीधे धक्का देता है। यह बहुत ही कुशल है, लेकिन प्रकाशक को इसे लागू करने की आवश्यकता है। मौके से, सभी बड़े ब्लॉगिंग प्लेटफॉर्म (टंबलर, पोस्टर्स, वर्डप्रेस, ब्लॉगर, सिक्सअपर ... आदि) ने इसे कार्यान्वित किया है। अन्य फ़ीड प्रकाशन ऐप्स (जैसे फीडबर्नर, गोवाल्ला, ...) ने इसे भी कार्यान्वित किया। यदि आप फ़ीड प्रकाशित करते हैं, तो मैं इस भीड़ में शामिल होने के लिए प्रोत्साहित करता हूं, और यदि आप कुछ उपभोग करने की योजना बनाते हैं, तो कृपया, सब्सक्राइबर पक्ष को भी लागू करें।

अंतिम समाधान तीसरे पक्ष के आवेदन का उपयोग करना है, इस डेटा एकत्रण (उपरोक्त सभी तकनीकों का उपयोग करके) और इन फीड्स में वास्तव में नई सामग्री होने पर आपको पिंग करें। मैंने एक बनाया: Superfeedr और मेरा मानना ​​है कि हम इसके साथ अच्छा काम करते हैं। हम सामग्री को सामान्य बनाते हैं और कुछ अन्य चीजें करते हैं ताकि आप फ़ीड डेटा को सरल और सस्ता तरीके से उपभोग कर सकें (मतदान महंगा पागल हो सकता है)। इसके अलावा, हम किसी भी फ़ीड से सामग्री को धक्का देने के लिए सटीक उसी PubSubHubbub प्रोटोकॉल का उपयोग करते हैं, जो हमारे उपयोगकर्ताओं के लिए उपलब्ध हब्स की सदस्यता लेने के अलावा हमारी सेवा का उपयोग करना बहुत आसान बनाता है।

इसके अलावा

, मैं जोड़ने चाहिए कि मैं आपके सवाल का जल्दी से उत्तर देने में सक्षम था, क्योंकि मैं एक ऐप्लिकेशन है जो मुझे प्रश्नों के लिए फ़ीड की सामग्री धक्का टैग किए गए आरएसएस :) का उपयोग

+2

एक दिलचस्प अनुकूलन गूगल रीडर भी करता है जब मतदान की फीड होती है: "Google रीडर एक घंटे में अपडेट के लिए आपकी सदस्यता जांचता है। कुछ सब्सक्राइबर वाले फ़ीड के लिए अपडेट थोड़ा कम हो सकते हैं।" [संदर्भ] (http://google.com/support/reader/bin/answer.py?hl=hi&answer=70642) यह आधिकारिक बयान है, हालांकि मैंने कुछ फ़ीड्स के लिए अधिक बार अपडेट (हर 5 मिनट?) देखा है (गिज्मोदो, स्लेशडॉट)। फ़ीड के लिए जहां मैं एकमात्र ग्राहक हूं, दिन में केवल 1 या 2 अपडेट देखना आम है। अन्य लोगों द्वारा इसकी पुष्टि की गई थी, लेकिन यह आधिकारिक नहीं है। – ptdev

संबंधित मुद्दे