क्या बड़ी सीएसवी फाइलें पढ़ने से निपटने के लिए कोई अच्छा कार्यक्रम है? मेरे द्वारा सौदा किए गए कुछ डेटाफाइल 1 जीबी रेंज में हैं। एक्सेल के साथ भी निपटने के लिए उनके पास बहुत सी रेखाएं हैं। एक्सेस का उपयोग थोड़ा धीमा हो सकता है, क्योंकि आपको वास्तव में उन्हें सीधे उनके साथ काम करने के लिए डेटाबेस में आयात करना होगा। क्या कोई ऐसा प्रोग्राम है जो बड़ी सीएसवी फाइलें खोल सकता है और डेटा को आसानी से और तेज़ी से स्कैन करने में आपकी सहायता के लिए आपको एक सरल स्प्रेडशीट लेआउट दे सकता है?बड़ी सीएसवी फाइलों के साथ काम करने के लिए प्रोग्राम
उत्तर
MySQL LOAD DATA INFILE
कमांड का उपयोग कर टेबल पर बहुत जल्दी CSV फ़ाइलों को आयात कर सकता है। यह CSV storage engine का उपयोग कर, किसी भी आयात प्रक्रियाओं को छोड़कर सीएसवी फ़ाइलों से सीधे पढ़ सकता है।
LOAD DATA INFILE
के साथ देशी तालिकाओं पर इसे आयात करना एक प्रारंभिक लागत है, लेकिन इसके बाद आप INSERT/UPDATE
बहुत तेजी से, साथ ही सूचकांक फ़ील्ड भी कर सकते हैं। सीएसवी स्टोरेज इंजन का उपयोग करना लगभग पहले तात्कालिक है, लेकिन केवल अनुक्रमिक स्कैन तेज़ होगा।
अद्यतन: This article (शीर्षक त्वरित डेटा लोड अनुभाग तक नीचे स्क्रॉल) का उपयोग कर के बारे में बात दोनों MySQL पर लोड हो रहा है सीएसवी आंकड़ों के पास जाते है, और उदाहरण देता है।
मैंने रियल एस्टेट एमएलएस डेटासेट के साथ काम किया जिसमें 15-30 एमबी सीएसवी फ़ाइल शामिल थी। MySQL लोड इन्फाइल के बिना, प्रत्येक फ़ीड को प्रक्रिया के लिए एक घंटे या अधिक समय लगेगा .... लेकिन MySQL और कच्चे तालिकाओं का उपयोग करके मैंने बड़े डेटा सेट के लिए 5-6 मिनट तक प्रोसेसिंग काट दिया। – David
vEdit इसके लिए बहुत अच्छा है। मैं नियमित रूप से 100+ मेग खोलता हूं (मुझे पता है कि आपने एक गिग तक कहा है, मुझे लगता है कि वे अपनी साइट पर विज्ञापन करते हैं, यह दो बार संभाल सकता है) इसके साथ फाइलें। इसमें regex समर्थन और अन्य सुविधाओं का भार है। 70 डॉलर उस राशि के लिए सस्ता है जो आप इसके साथ कर सकते हैं।
vEdit बहुत अच्छा है, लेकिन यह न भूलें कि आप हमेशा "मूल बातें" पर वापस जा सकते हैं Cygwin देखें और greping शुरू करें।
मददगार
- ग्रेप आदेश
- सिर
- पूंछ पाठ्यक्रम पर्ल की
- !
जीवीआईएम उन फ़ाइलों को संभाल सकता है जो निःशुल्क हैं यदि आप एक वास्तविक स्प्रेडशीट स्थिर क्षेत्र आकार दृश्य से जुड़े नहीं हैं।
यह इस बात पर निर्भर करता है कि आप वास्तव में डेटा के साथ क्या करना चाहते हैं। एक बड़ी टेक्स्ट फ़ाइल को देखते हुए आप आमतौर पर किसी भी समय डेटा का एक छोटा सबसेट चाहते हैं, इसलिए उन टुकड़ों को खींचने के लिए 'grep' जैसे टूल को नज़रअंदाज़ न करें जिन्हें आप देखना चाहते हैं और साथ काम करना चाहते हैं।
यदि आप डेटा को मेमोरी में फिट कर सकते हैं और आपको अजगर पसंद है तो मैं Augustus के यूनीटेबल हिस्से को देखने की सलाह देता हूं। (अस्वीकरण: अगस्तस ओपन सोर्स (जीपीएलवी 2) है लेकिन मैं उस कंपनी के लिए काम करता हूं जो इसे लिखता है।)
यह बहुत अच्छी तरह से प्रलेखित नहीं है लेकिन इससे आपको जाने में मदद मिलनी चाहिए।
from augustus.kernel.unitable import *
a = UniTable().from_csv_file('filename')
b = a.subtbl(a['key'] == some_value) #creates a subtable
यह सीधे आप इंटरफ़ेस की तरह एक एक्सेल नहीं देंगे लेकिन काम का एक छोटा सा के साथ तुम बाहर जल्दी से कई आंकड़े देख सकते हैं।
मुझे reCSVeditor बड़ी सीएसवी फाइलों को संपादित करने के लिए एक अच्छा कार्यक्रम है। अनावश्यक कॉलम को अलग करने के लिए यह आदर्श है। मैंने इसे 1,000,000 रिकॉर्ड फ़ाइलों को आसानी से फाइलों के लिए उपयोग किया है।
+1 reCSVeditor ने लगभग 2 जीबी फाइलों के साथ 2,000,000 पंक्तियों के साथ काम किया –
हे, मैंने ज़िप डाउनलोड किया लेकिन मैं इसका उपयोग कैसे नहीं कर सकता, क्या आप कृपया मुझे मार्गदर्शन कर सकते हैं? – aasthetic
@ richi_18007 रिकस्वेडिटर सामग्री को अनजिप करते हैं तो इंस्टॉलर चलाते हैं –
- 1. sed - बड़ी सीएसवी फाइलों में उद्धरणों के भीतर उद्धरण हटाएं
- 2. सीएसवी के नाम के साथ स्तंभ उत्पन्न करने के लिए आर में सीएसवी आयात करते समय?
- 3. टुकड़ों में सीएसवी फाइलों में पढ़ने के लिए रणनीतियां?
- 4. पाइथन बड़ी सीएसवी फ़ाइल (numpy)
- 5. स्प्रेडशीट अनुप्रयोगों में खोलने के लिए सीएसवी फाइलों के लिए माइमटाइप के रूप में सेट करने के लिए क्या करें
- 6. सीएसवी के लिए वैकल्पिक?
- 7. डब्ल्यूसीएफ बड़ी फाइलों के लिए कोई एंडपॉइंट नहीं सुन रहा
- 8. सीएसवी फाइलों को अलग-अलग
- 9. बहुत बड़ी सीएसवी पढ़ने के लिए एक्सेल में वीबीए चाहते हैं और सीएसवी
- 10. पहुँच मैं आईओएस पर फाइलों के साथ काम करने के लिए कोशिश कर रहा हूँ Phonegap
- 11. डीबीस हेडर फाइलों के साथ संकलन सी प्रोग्राम
- 12. बड़ी संख्या में फाइलों के लिए Django फाइल सिस्टम स्टोरेज
- 13. 2 सीएसवी फाइलों का संयोजन
- 14. जावा लाइब्रेरी ज़िप फ़ाइलों के साथ काम करने के लिए
- 15. सीएसवी फाइलों को अलग करने के लिए प्रत्येक शीट को कार्यपुस्तिका में सहेजें
- 16. आईओएस: बड़ी पीएनजी फाइलों के आकार को कम करने के लिए कैसे करें
- 17. प्रति आइटम सीएसवी फाइलों को अलग करने के लिए स्केपर निर्यात आइटम कैसे कर सकते हैं
- 18. यूनिक्स के एफएचएस का सम्मान करने के लिए distutils के साथ विन्यास फाइलों को कैसे संभालें?
- 19. PostgreSQL के साथ समस्या एक बड़ी सीएसवी फ़ाइल को तालिका में लोड करना
- 20. एक बड़ी सीएसवी फ़ाइल बनाने के लिए जावा आईओ के लिए सर्वोत्तम अभ्यास
- 21. विजुअल स्टूडियो सी ++ मेनिफेस्ट फाइलों के साथ काम करना
- 22. गिट के साथ फाइलों के कई अलग-अलग संस्करणों पर एक साथ काम कैसे करें?
- 23. मर्क्यूरियल हुक बड़ी बाइनरी फाइलों को करने की अनुमति देने के लिए
- 24. सी ++ कमांड लाइन तर्क के साथ एक और प्रोग्राम निष्पादित करने के लिए प्रोग्राम
- 25. PHP में बड़ी संख्या के साथ कैसे काम करें?
- 26. महाउट: वेक्टर से सीएसवी और प्रोग्राम चलाने
- 27. मैं पर्ल से जल्दी से कई बड़ी सीएसवी फाइलों में डेटा कैसे एक्सेस कर सकता हूं?
- 28. फेसबुक के साथ काम करने के लिए ऑफ़लाइन_एसीसी प्राप्त करना
- 29. बड़ी फाइल S3 के लिए
- 30. कोई प्रोग्राम के साथ सी प्रोग्राम में जेवीएम एम्बेड करने के लिए अनुशंसित तरीका?
हां, वहां है। आप [ओपनरफिन] [1] (या Google परिष्कृत) का उपयोग कर सकते हैं। ओपनरफिन स्टेरॉयड पर स्प्रेडशीट की तरह है। फ़ाइल आकार जिसे आप कुशल बना सकते हैं, आपके कंप्यूटर की स्मृति पर निर्भर करता है। [1]: http://openrefine.org –