मैं अजगर में एक प्रोजेक्ट का निर्माण कर रहा हूं जिसे ट्विटर डेटा की विशाल और बड़ी मात्रा में स्क्रैप करने की आवश्यकता है। कुछ मिलियन उपयोगकर्ताओं और उनकी सभी ट्वीट्स को स्क्रैप करने की आवश्यकता है।ट्वीट्स की एक बड़ी मात्रा को कैसे स्क्रैप करें
पहले मैंने ट्वीपी और ट्विथन का उपयोग किया है, लेकिन ट्विटर की सीमा को बहुत तेजी से मारा है।
भाव विश्लेषण कंपनियों आदि कैसे अपना डेटा प्राप्त करते हैं? वे उन सभी ट्वीट्स कैसे प्राप्त करते हैं? क्या आप इसे कहीं खरीदते हैं या कुछ ऐसा बनाते हैं जो अलग-अलग प्रॉक्सी या कुछ के माध्यम से पुनरावृत्त होता है?
इन्फोकिम्प्स जैसी कंपनियां उदाहरण के लिए ट्रस्ट रैंक कैसे अपना डेटा प्राप्त करती हैं? * http://www.infochimps.com/datasets/twitter-census-trst-rank
यदि आप सीमा को बहुत तेजी से हिट करते हैं, तो आपको अपने काम को कई दिनों में वितरित करना चाहिए, और अपना डेटाबेस अधिक धीरे-धीरे बनाना चाहिए। मुझे लगता है कि कंपनियां यह कैसे करती हैं। – heltonbiker