मेरे पास 100,000 x 40
पंक्तियों
कॉलम के बारे में 100 सीएसवी फाइलें हैं। मैं इसके बारे में कुछ सांख्यिकीय विश्लेषण करना चाहता हूं, कुछ नमूना डेटा खींच सकता हूं, साजिश के सामान्य रुझानों को बदल सकता हूं, भिन्नता और आर-स्क्वायर विश्लेषण कर सकता हूं, और कुछ स्पेक्ट्रा आरेखों को साजिश कर सकता हूं। अभी के लिए, मैं विश्लेषण के लिए numpy पर विचार कर रहा हूँ।पायथन: सीएसवी फाइलों पर विश्लेषण 100,000 लाइनें x 40 कॉलम
मैं सोच रहा था कि ऐसी बड़ी फ़ाइलों के साथ मुझे किन मुद्दों की अपेक्षा करनी चाहिए? मैंने पहले से ही गलत डेटा की जांच की है। सांख्यिकीय विश्लेषण करने पर आपकी सिफारिशें क्या हैं? क्या यह बेहतर होगा अगर मैं सिर्फ फाइलों को विभाजित करता हूं और पूरी चीज एक्सेल में करता हूं?
वे बहुत बड़ी फाइलें नहीं हैं। तुम क्यों पूछ रहे हो? क्या आपने वास्तव में यह देखने के लिए सरल पठन करने की कोशिश की है कि पाइथन कितनी तेजी से होगा? –
जब तक आप पाइथन से शादी नहीं कर लेते हैं, तो आप एक समर्पित आंकड़े भाषा जैसे आर - देखें http://www.r-project.org का उपयोग कर बेहतर हो सकते हैं। –
आमतौर पर टेबल और पंक्तियों के बारे में बात करते समय समानार्थी शब्द होते हैं। मुझे लगता है कि आपका मतलब 40 कॉलम है? –