2011-12-15 9 views
7

से पहले मैं एक मसालेदार वस्तु विंडोज पर बनाया गया था कि और जाहिरा तौर पर द्विआधारी मोड में नहीं (यानी, पाठ के रूप में भरी हुई एक फ़ाइल को बचाया (उस में कुछ NumPy सरणी के साथ एक सूची) मिला है। open(filename, 'wb') के बजाय open(filename, 'w') के साथ)। नतीजा यह है कि अब मैं इसे अनपिक नहीं कर सकता (विंडोज़ पर भी नहीं) क्योंकि यह \r वर्णों (और संभवतः अधिक) से संक्रमित है? मुख्य शिकायतअजगर अचार: ठीक r पात्रों लोड हो रहा है

ImportError: No module named multiarray 

माना जाता है कि क्योंकि यह numpy.core.multiarray\r है, जो निश्चित रूप से मौजूद नहीं है की तलाश में है। सीधे शब्दों में चाल नहीं किया \r वर्ण निकाल दें (दोनों sed -e 's/\r//g' और अजगर s = file.read().replace('\r', '') में, कोशिश की, लेकिन दोनों फ़ाइल तोड़ने के लिए और बाद में एक cPickle.UnpicklingError उपज)

समस्या है कि मैं वास्तव में से बाहर डेटा प्राप्त करने की आवश्यकता है वस्तुओं। फाइलों को ठीक करने के लिए कोई विचार? अनुरोध पर, मेरी फाइल के पहले कुछ सौ बाइट्स, ऑक्टल:

संपादित

\x80\x02]q\x01(}q\x02(U\r\ntotal_timeq\x03G?\x90\x15r\xc9(s\x00U\rreaction_timeq\x04NU\x0ejump_directionq\x05cnumpy.core.multiarray\r\nscalar\r\nq\x06cnumpy\r\ndtype\r\nq\x07U\x02f8K\x00K\x01\x87Rq\x08(K\x03U\x01<NNNJ\xff\xff\xff\xffJ\xff\xff\xff\xffK\x00tbU\x08\x025\x9d\x13\xfc#\xc8?\x86Rq\tU\x14normalised_directionq\r\nh\x06h\x08U\x08\xf0\xf9,\x0eA\x18\xf8?\x86Rq\x0bU\rjump_distanceq\x0ch\x06h\x08U\x08\x13\x14\xea&\xb0\x9b\[email protected]\x86Rq\rU\x04jumpq\x0ecnumpy.core.multiarray\r\n_reconstruct\r\nq\x0fcnumpy\r\nndarray\r\nq\x10K\x00\x85U\x01b\x87Rq\x11(K\x01K\x02\x85h\x08\x89U\x10\x87\x16\xdaEG\xf4\xf3?\x06`OC\xe7"\[email protected]\x0emovement_speedq\x12h\x06h\x08U\x08\\p\xf5[2\xc2\xef?\x86Rq\x13U\x0ctrial_lengthq\[email protected]\t\x98\x87\xf8\x1a\xb4\xbaU\tconditionq\x15U\x0bhigh_mentalq\x16U\x07subjectq\x17K\x02U\x12movement_directionq\x18h\x06h\x08U\x08\xde\x06\xcf\x1c50\xfd?\x86Rq\x19U\x08positionq\x1ah\x0fh\x10K\x00\x85U\x01b\x87Rq\x1b(K\x01K\x02\x85h\x08\x89U\x10K\xb7\xb4\x07q=\x1e\xc0\xf2\xc2YI\xb7U&\xc0tbU\x04typeq\x1ch\x0eU\x08movementq\x1dh\x0fh\x10K\x00\x85U\x01b\x87Rq\x1e(K\x01K\x02\x85h\x08\x89U\x10\xad8\x9c9\x10\xb5\xee\xbf\xffa\xa2hWR\xcf?tbu}q\x1f(h\[email protected]\t\xba\xbc\xb8\xad\xc8\x14h\x04G?\xd9\x99%]\xadV\x00h\x05h\x06h\x08U\x08\xe3X\xa9=\xc1\xb1\xeb?\x86Rq h\r\nh\x06h\x08U\x08\x88\xf7\xb9\xc1\t\xd6\xff?\x86Rq!h\x0ch\x06h\x08U\x08v\x7f\xeb\x11\xea5\[email protected]\x86Rq"h\x0eh\x0fh\x10K\x00\x85U\x01b\x87Rq#(K\x01K\x02\x85h\x08\x89U\x10\xcd\xd9\x92\x9a\x94=\[email protected]]C\xaf\xef\xeb\xef\[email protected]\x12h\x06h\x08U\x08-\x9c&\x185\xfd\xef?\x86Rq$h\[email protected]\r\xb8W\xb2`V\xach\x15h\x16h\x17K\x02h\x18h\x06h\x08U\x08\x8e\x87\xd1\xc2 

तुम भी डाउनलोड कर सकते हैं whole file (22k)।

उत्तर

11

यह मानकर कि फ़ाइल डिफ़ॉल्ट प्रोटोकॉल = 0 ASCII-संगत विधि के साथ बनाया गया था, तो आप open('pickled_file', 'rU') का उपयोग करके इसे कहीं भी लोड करने के लिए सक्षम होना चाहिए यानी सार्वभौमिक न्यूलाइन।

अगर यह काम नहीं करता है, हमें पहले कुछ सौ बाइट्स दिखाने: print repr(open('pickled_file', 'rb').read(200)) और अपने प्रश्न का एक संपादन में परिणाम पेस्ट करें।

अद्यतन के बाद फ़ाइल की सामग्री प्रकाशित किए गए थे:

आपकी फ़ाइल '\x80\x02' साथ शुरू होता है; इसे प्रोटोकॉल 2, नवीनतम/सर्वोत्तम के साथ डंप किया गया था। प्रोटोकॉल 1 और 2 बाइनरी प्रोटोकॉल हैं। आपकी फ़ाइल को टेक्स्ट मोड में विंडोज़ में लिखा गया था। इसके परिणामस्वरूप प्रत्येक '\n' को सी रनटाइम द्वारा '\r\n' में परिवर्तित किया गया है। फ़ाइलें इस तरह द्विआधारी मोड में खोला जाना चाहिए:

with open('result.pickle', 'wb') as f: # b for binary 
    pickle.dump(obj, f, pickle.HIGHEST_PROTOCOL) 

with open('result.pickle', 'rb') as f: # b for binary 
    obj = pickle.load(f) 

डॉक्स here हैं। यह कोड विंडोज और गैर-विंडोज सिस्टम दोनों पर पोर्टेबल काम करेगा।

आप फ़ाइल को बाइनरी मोड में पढ़कर मूल अचार छवि को पुनर्प्राप्त कर सकते हैं और '\n' द्वारा '\r\n' की सभी घटनाओं को प्रतिस्थापित करके क्षति को उलट सकते हैं। नोट: यह वसूली प्रक्रिया आवश्यक है कि आप इसे विंडोज़ पर पढ़ने की कोशिश कर रहे हैं या नहीं।

+0

+1। @ नकोसिनाथी, आपको इसे उत्तर के रूप में चिह्नित करना चाहिए। –

0

आप नहीं कर सकते - विंडोज पर - बस पाठ मोड में फ़ाइल, उसी तरह यह लिखा गया था, को खोलने में इसे पढ़ा और फिर एक और फाइल करने के लिए इसे बाहर लिखने बाइनरी स्वरूप में सही खोला?

0

आप की कोशिश की पाठ मोड में unpickling है? यही कारण है,

x = pickle.load(open(filename, 'r')) 

(विंडोज़ पर, निश्चित रूप से।)

+0

नहीं, जाहिर है विंडोज़ को अपनी लाइन अंतराल पसंद नहीं है ...? पिकलिंग प्रोटोकॉल संस्करण पर जानकारी के लिए –

5

विंडोज़ में न्यूलाइन सिर्फ '\r' नहीं है, यह सीआरएलएफ है, या '\r\n' है।

file.read().replace('\r\n', '\n') एक प्रयास दें। आप पहले कैरिज रिटर्न हटा रहे थे जो वास्तव में न्यूलाइन का हिस्सा नहीं हो सकता था।

+0

+1: आपको मिल गया! यह मैक ओएस एक्स पर काम करता है। अचार की फ़ाइल में वास्तव में अलग '\ r' वर्ण हैं। – EOL

+0

शानदार, जिसने इसे हल किया! धन्यवाद दस लाख, आपने बहुत ही महंगे काम के 4 घंटे बचाए (और नहीं, निश्चित रूप से मेरे वेतन के कारण नहीं ... ;-) –

संबंधित मुद्दे