HTML में डेटा मैं वर्तमान में नीचे के रूप में Gzipped वेब पेज पढ़ने के लिए मशीनीकरण का उपयोग करें:Convert gzipped urllib2 द्वारा दिलवाया
br = mechanize.Browser()
br.set_handle_gzip(True)
response = br.open(url)
data = response.read()
मुझे आश्चर्य है कि HTML पाठ के लिए urllib2 द्वारा दिलवाया Gzipped डेटा को संपीड़ित करने के लिए कैसे?
req = urllib2.Request(url)
opener = urllib2.build_opener()
response = opener.open(req)
data = response.read()
if response.info()['content-encoding'] == 'gzip':
HOW TO DECOMPRESS DATA TO HTML
आप बस 'gzip.decompress (डेटा)' भी कर सकते हैं। –
यह वास्तव में इस आलेख में वर्णित इस मामले में काम नहीं कर रहा है: http://rationalpie.wordpress.com/2010/06/02/python-streaming-gzip-decompression/ तो आपको gzip – gabuzo
के बजाय zlib का उपयोग करना होगा @ gabuzo असल में, यह आलेख _streaming_ gzip डिकंप्रेशन से संबंधित है, जो वास्तव में इस प्रश्न के विषय से बहुत अलग है, क्योंकि यह विशेष रूप से उल्लेख करता है कि डेटा पहले से ही प्राप्त किया गया था, जबकि एक स्ट्रीमिंग स्थिति में आप इसे प्राप्त करने के रूप में डिकंप्रेस करना चाहते हैं। –