क्या फ़ाइल को पूरी तरह से निकाले बिना पायथन का उपयोग करके जीजी-संपीड़ित टेक्स्ट फ़ाइल से एक रेखा को पढ़ना आसान है? मेरे पास text.gz फ़ाइल है जो 200 एमबी है। जब मैं इसे निकालता हूं, तो यह 7.4 जीबी बन जाता है। और यह एकमात्र फाइल नहीं है जिसे मुझे पढ़ना है। कुल प्रक्रिया के लिए, मुझे 10 फाइलें पढ़नी होंगी। यद्यपि यह एक अनुक्रमिक नौकरी होगी, मुझे लगता है कि यह पूरी जानकारी को निष्कासित किए बिना ऐसा करने के लिए एक स्मार्ट चीज होगी। मुझे यह भी नहीं पता कि यह संभव है। पाइथन का उपयोग करके यह कैसे किया जा सकता है? मुझे एक टेक्स्ट फ़ाइल लाइन-दर-रेखा पढ़ने की जरूरत है।पायथन: संपीड़ित पाठ फ़ाइलों से लाइनें पढ़ें
32
A
उत्तर
12
क्या आपने gzip.GzipFile का उपयोग करने का प्रयास किया है? तर्क open
के समान हैं।
38
आप पाइथन में मानक gzip मॉड्यूल का उपयोग कर सकते हैं। बस उपयोग करें:
gzip.open('myfile.gz')
फ़ाइल को किसी अन्य फ़ाइल के रूप में खोलने और इसकी रेखाओं को पढ़ने के लिए।
अधिक यहाँ जानकारी: Python gzip module
22
का उपयोग gzip.GzipFile:
import gzip
with gzip.open('input.gz','r') as f:
for line in f:
print('got line', line)
नोट : python3 के लिए आप है फ़ाइल निर्दिष्ट करने के लिए द्विआधारी पढ़ने के लिए 'rt'
में खोलने के लिए, 'r'
चूक के रूप में, या अन्यथा line.decode(...)
का उपयोग करें।
नोट : gzip.open(filename, mode)
gzip.GzipFile(filename, mode)
के लिए उपनाम है। मैं पूर्व को पसंद करता हूं, क्योंकि यह असम्पीडित फ़ाइलों को खोलने के लिए with open(...) as f:
जैसा दिखता है।
संबंधित मुद्दे
- 1. संपीड़ित पाठ फ़ाइलों में तेज खोज
- 2. BufferedReader: एक स्ट्रिंग में एकाधिक लाइनें पढ़ें
- 3. डेल्फी में पाठ फ़ाइल से पढ़ें 2009
- 4. सी ++: पाठ फ़ाइल से पढ़ें और चर
- 5. एक पाठ फ़ाइल से कई टेबल पढ़ें?
- 6. पढ़ें निश्चित चौड़ाई पाठ फ़ाइल
- 7. डेटाबेस में संग्रहीत करने से पहले पाठ को संपीड़ित करना
- 8. पायथन फ़ाइल पढ़ें + लिखें
- 9. पायथन गुण फ़ाइल से सेलेरी कॉन्फ़िगरेशन पढ़ें
- 10. पायथन विशिष्ट स्थिति से बाइनरी पढ़ें
- 11. यूनिकोड फ़ाइलों को पढ़ें C++
- 12. कैश से बचाने से पहले पायथन ऑब्जेक्ट्स को संपीड़ित करें
- 13. फ़ोल्डर्स और फ़ाइलों को संपीड़ित/डिकंप्रेस करना
- 14. फ़ाइलों को संपीड़ित करने के लिए
- 15. एक पाठ फ़ाइल से लाइनों पढ़ें लेकिन पहली दो पंक्तियों
- 16. एक सरणी में पाठ फ़ाइल पढ़ें
- 17. पीडीएफ और शब्द फ़ाइलों से पाठ निकालें
- 18. फ़ाइल से खाली लाइनें हटाएं
- 19. किसी छवि से पाठ पढ़ना
- 20. पायथन: सीएसवी फाइलों पर विश्लेषण 100,000 लाइनें x 40 कॉलम
- 21. संपीड़ित फ़ाइल
- 22. XmlReader से XElement पढ़ें
- 23. Zend_Http_Client - स्ट्रीम से पढ़ें?
- 24. .m फ़ाइलों को उत्कृष्ट पाठ
- 25. घुमावदार लॉग फ़ाइलों को संपीड़ित करने के लिए एक उपयोगिता?
- 26. YUIcompressor के साथ एकाधिक जावास्क्रिप्ट फ़ाइलों को संपीड़ित करना?
- 27. पायथन: शब्दकोशों की सूची में फ़ाइलों को पढ़ें और विभाजित करें
- 28. सी # पढ़ें पाठ फ़ाइल युक्त डाटा सीमांकित तक टैब्स
- 29. Django कंप्रेसर संपीड़ित सीएसएस
- 30. इंडेंट रिक्त लाइनें (इंटेलिजे आईडीईए)
जिज्ञासा से बाहर यह पूरी फ़ाइल को स्मृति में लोड करता है? या क्या यह आवश्यकतानुसार लाइनों को लोड करने के लिए पर्याप्त स्मार्ट है? –
@Sachin_ruk यह फ़ाइल लोड नहीं करता है जो इसे खोलता है। वास्तव में फ़ाइल से डेटा लोड करने के लिए आपको एक समय में लाइन पढ़ने के लिए '' f.readline() '' '' करने की आवश्यकता है। या 'f.readlines (N)' '' '' '' ''''' उन पंक्तियों की संख्या है जिन्हें आप पढ़ना चाहते हैं। – Tom