मैं pandas.read_excel()
फ़ंक्शन के साथ एक पांडा डेटाफ़्रेम में एक्सेल फ़ाइल आयात कर रहा हूं।पायथन पांडा: एक्सेल फ़ाइल पढ़ने के दौरान डेटा प्रकार कैसे निर्दिष्ट करें?
कॉलम में से एक तालिका तालिका की प्राथमिक कुंजी है: यह सभी संख्या है, लेकिन यह टेक्स्ट के रूप में संग्रहीत है (एक्सेल कोशिकाओं के ऊपरी बाईं ओर थोड़ा हरा त्रिभुज इसकी पुष्टि करता है)।
हालांकि, जब मैं फ़ाइल को पांडा डेटाफ्रेम में आयात करता हूं, तो कॉलम को फ्लोट के रूप में आयात किया जाता है। इसका मतलब है कि, उदाहरण के लिए, '0614' 614 बन जाता है।
क्या कॉलम आयात करते समय डेटाटाइप निर्दिष्ट करने का कोई तरीका है? मैं समझता हूं कि सीएसवी फाइलों को आयात करते समय यह संभव है लेकिन read_excel()
के सिंटैक्स में कुछ भी नहीं मिला।
एकमात्र समाधान जिसे मैं सोच सकता हूं, टेक्स्ट में शुरुआत ('0614' को 'ए0614' में परिवर्तित करना) में यह सुनिश्चित करने के लिए है कि कॉलम को टेक्स्ट के रूप में आयात किया गया है, और फिर बंद करना पायथन में 'ए', इसलिए मैं इसे अन्य सारणी से मिलान कर सकता हूं जो मैं SQL से आयात कर रहा हूं।
मुझे 'कन्वर्टर्स' को कॉलम पर लागू करने के लिए एक फ़ंक्शन निर्दिष्ट किया गया था। जाहिर है, मैं गलत था - इसे इंगित करने के लिए धन्यवाद, यह बहुत उपयोगी है! –
मुझे स्वीकार्य कनवर्टर कार्यों की सूची कहां मिल सकती है? मुझे यहां 'str' दिखाई देता है, लेकिन संभवतः वहां' int' और कुछ और इसके अलावा - स्रोत दस्तावेज़ों के लिए कहीं भी एक लिंक है जो उपलब्ध कनवर्टर कार्यों को उपलब्ध कराता है? –
मुझे कोई सूची नहीं मिली है। चूंकि "कन्वर्टर्स" कार्यों को स्वीकार करता है, मुझे संदेह है कि आपकी कल्पना सीमा है, बस आप "कन्वर्टर्स" कार्यक्षमता की सीमाओं के भीतर रहते हैं (यानी यह उन कार्यों का उपयोग करने के लिए डिज़ाइन किया गया था जिनके लिए केवल एक इनपुट चर की आवश्यकता है!)। – tnknepp