मेरे पास 0.7 जीबी मोंगोडीबी डेटाबेस है जिसमें ट्वीट्स हैं जो मैं डेटाफ्रेम में लोड करने की कोशिश कर रहा हूं। हालांकि, मुझे एक त्रुटि मिलती है।पांडस और पायमोंगो का उपयोग करके डेटाफ्रेम पर मोंगोडीबी डेटा लोड करने का एक बेहतर तरीका?
MemoryError:
मेरे कोड इस तरह दिखता है:
cursor = tweets.find() #Where tweets is my collection
tweet_fields = ['id']
result = DataFrame(list(cursor), columns = tweet_fields)
मैं निम्नलिखित जवाब में तरीकों, जो कुछ बिंदु पर यह लोड करने से पहले डेटाबेस के सभी तत्वों की एक सूची बना कोशिश की है।
हालांकि,) एक और जवाब जो सूची (बारे में बात करती है, उस व्यक्ति ने कहा है कि यह, छोटे डेटा सेट के लिए अच्छा है, क्योंकि सब कुछ स्मृति में भरी हुई है।
मेरे मामले में, मुझे लगता है कि यह त्रुटि का स्रोत है। यह स्मृति में लोड होने के लिए बहुत अधिक डेटा है। मैं किस और विधि का उपयोग कर सकता हूं?