2010-09-03 5 views
6

में एसपीएसएस डेटासेट आयात करना क्या पाइथन में एसपीएसएस डेटासेट आयात करने का कोई तरीका है, अधिमानतः NumPy recarray प्रारूप? मैंने चारों ओर देखा है लेकिन कोई जवाब नहीं मिला।पायथन

जून

उत्तर

1

हो सकता है कि इस में मदद मिलेगी: अजगर रीडर + SPSS SAV फ़ाइलों के लिए लेखक (लिनक्स, मैक & विंडोज) http://code.activestate.com/recipes/577811-python-reader-writer-for-spss-sav-files-linux-mac-/

+0

बहुत बहुत धन्यवाद! यह वही चीजें हैं जिन्हें मैं ढूंढ रहा था .. यह बहुत उपयोगी लग रहा है। – joon

2

दावों को विभिन्न प्रारूपों में SPSS और निर्यात आयात करने के लिए, R statistical suite करता है। मैंने एसपीएसएस डेटा से कभी निपटा नहीं है, इसलिए वे अपने रिश्तेदार गुणों से बात नहीं कर सकते हैं।

3

एसपीएसएस के पास पायथन के साथ एक व्यापक एकीकरण है, लेकिन इसका उपयोग एसपीएसएस (अब आईबीएम एसपीएसएस सांख्यिकी के रूप में जाना जाता है) के साथ किया जाना है। एक एसपीएसएस ओडीबीसी ड्राइवर है जिसे एक sav फ़ाइल पढ़ने के लिए पायथन ओडीबीसी समर्थन के साथ उपयोग किया जा सकता है।

+0

या आप बस एसपीएसएस के अंदर से पाइथन का उपयोग करके जो भी प्रारूप पसंद करते हैं उसे सहेज सकते हैं, मुझे लगता है? दोनों समाधानों की आवश्यकता है कि 'जून' के पास एसपीएसएस तक पहुंच हो (हालांकि यह काफी महंगी AFAIK है)। – JanC

1

स्पष्ट होने के लिए, एसपीएसएस ओडीबीसी ड्राइवर को एसपीएसएस स्थापना की आवश्यकता नहीं है।

1

आप अजगर spssread, एक पर्ल स्क्रिप्ट कि जिस तरह से आप चाहते हैं में SPSS फ़ाइलों की सामग्री आउटपुट के लिए एक बाहरी फोन करना पड़ सकता है।

3

विकल्प 1 रूप rkbarney ने बताया, वहाँ अजगर savReaderWriter pypi के माध्यम से उपलब्ध है। मैंने दो मुद्दों में भाग लिया है:

  1. यह प्रतीत होता है कि शुद्ध-पायथन कार्यान्वयन से परे कई अतिरिक्त पुस्तकालयों पर निर्भर करता है। एसबीएसएस फाइलों को आईबीएम द्वारा एसपीएसएस आई/ओ मॉड्यूल प्रदान किए जाने के लगभग हर मामले में पढ़ और लिखा जाता है। ये मॉड्यूल प्लेटफार्म से अलग हैं और मेरे अनुभव में "पीआईपी इंस्टॉल savReaderWriter" उन्हें बॉक्स (ओएस एक्स पर) से बाहर नहीं चलाता है।
  2. savReaderWriter पर विकास, मृत नहीं होने पर, कम से कम अद्यतित उम्मीद कर सकता है। यह पहली समस्या को जटिल बनाता है। यह गति को बढ़ाने के लिए कुछ बहिष्कृत पैकेजों पर निर्भर करता है और जब भी आप उपलब्ध नहीं होते हैं तो आप savReaderWriter आयात करते समय कुछ चेतावनियां देते हैं। आज कोई बड़ा मुद्दा नहीं है लेकिन भविष्य में यह समस्या हो सकती है क्योंकि आईबीएम नए एसपीएसएस प्रारूपों को सौंपने के लिए एसपीएसएस आई/ओ मॉड्यूल अपडेट करना जारी रखता है (वे मेमोरी परोसने पर पहले से ही 21 या 22 संस्करण पर हैं)।

विकल्प 2 मैं एक मध्यम आदमी के रूप में आर उपयोग करने के लिए चुन लिया है। Rpy2 का उपयोग करके, मैंने फ़ाइल को आर डेटा फ्रेम में पढ़ने के लिए एक सरल फ़ंक्शन सेट किया है और इसे फिर से CSV फ़ाइल के रूप में आउटपुट किया है जिसे मैं बाद में पायथन में आयात करता हूं। यह थोड़ा सा रब-गोल्डबर्ग है लेकिन यह काम करता है। बेशक, इसके लिए आर की आवश्यकता होती है जो आपके पर्यावरण में स्थापित करने में परेशानी हो सकती है (और विभिन्न प्लेटफार्मों के लिए अलग-अलग बाइनरी हैं)।

+0

जॉन, क्या आप पोस्ट करने के लिए बहुत दयालु होंगे (गिटहब गिस्ट में या पेस्टबिन में।कॉम) आपके rpy2- आधारित दृष्टिकोण में कोड? मैं इस मुद्दे http://stackoverflow.com/q/36287936/1389110 से संघर्ष कर रहा हूं, और आपका दृष्टिकोण मदद कर सकता है। – Pyderman