2014-07-05 15 views
6

में शीर्षलेख के बिना टैब-सीमांकित डेटा पढ़ना मुझे हेडर के बिना टैब-सीमांकित डेटा खोलने के लिए pandas का उपयोग करने में समस्या हो रही है।पांडा

Tag19184 CTAAC hffef 1 a 36 - chr1 10006 0 36M 36 
Tag19184 CTAAC hffef 1 a 36 - chr1 10012 0 36M 36 
Tag19184 CTAAC hffef 1 a 36 - chr1 10018 0 36M 36 
Tag19184 CTAAC hffef 1 a 36 - chr1 10024 0 36M 36 
Tag19184 CTAAC hffef 1 a 36 - chr1 10030 0 36M 36 
Tag19184 CTAAC hffef 1 a 36 - chr1 10036 0 36M 36 
Tag19184 CTAAC hffef 1 a 36 - chr1 10042 0 36M 36 
Tag20198 CTAAC hffef 1 a 36 - chr1 10048 0 36M 36 
Tag20198 CTAAC hffef 1 a 36 - chr1 10054 0 36M 36 
Tag45093 CTAAC hffef 1 a 36 - chr1 10060 0 36M 36 

मेरे कोड:

मेरे परीक्षण डाटा (वास्तव में 200 लाइनों, जिनमें से मैं पहली बार 10 दिखा रहा होता है)

import pandas as pd 
df = pd.read_csv('in_test.txt',sep='\t',header=None) 
print df 

हालांकि, मैं निम्नलिखित उत्पादन मिलता है, जो मैं नहीं लगता कि मैं आगे की प्रक्रिया डेटा का उपयोग कर सकते (?):

<class 'pandas.core.frame.DataFrame'> 
Int64Index: 200 entries, 0 to 199 
Data columns: 
X.1  200 non-null values 
X.2  200 non-null values 
X.3  200 non-null values 
X.4  200 non-null values 
X.5  200 non-null values 
X.6  200 non-null values 
X.7  200 non-null values 
X.8  200 non-null values 
X.9  200 non-null values 
X.10 200 non-null values 
X.11 200 non-null values 
X.12 200 non-null values 
dtypes: int64(5), object(7) 

tutorial here पता चलता है कि print df मुझे सिर्फ इसी डेटा फ्रेम देना चाहिए। मैं क्या गलत कर रहा हूं?

उत्तर

2

मुझे लगता है कि आप इसे सही ढंग से पढ़ रही है, लेकिन:

  1. देखें: change pandas 0.13.0 "print dataframe" to print dataframe like in earlier versions, यह क्या पांडा पुराने संस्करणों में क्या करते हैं। तो, अद्यतन इसे हल करेगा।
  2. आप ipython notebook का उपयोग कर सकते हैं, जहां DataFrames HTML तालिका के रूप में दिखाई देगा।
  3. आप df.head(5) (r के head के समान) का उपयोग कर सकते हैं ताकि यह सुनिश्चित किया जा सके कि आपकी DataFrame सही है।
+0

फिर से धन्यवाद। मुझे एक ही तरह का सारांश मिल रहा है, इस बार '200'^-^के बजाय' 5' के मानों के साथ ;;; मुझे कुछ और – biohazard

+0

आज़माएं, आपको प्रारंभिक संस्करण का उपयोग करना होगा, यह पोस्ट देखें: http://stackoverflow.com/questions/21482546/change-pandas-0-13-0-print-dataframe-to-print-dataframe- जैसे-पहले-संस्करण –

+0

मैंने स्टैक ओवरफ्लो लिंक दोनों की कोशिश की लेकिन यह हमेशा मुझे 'विशेषता Error:' मॉड्यूल 'ऑब्जेक्ट' की कोई त्रुटि नहीं देता है 'ऑब्जेक्ट' 'या' कोई विशेषता set_option' नहीं है '। मैंने 'apt-get install 'का उपयोग करके' पायथन-पांडा 'स्थापित किया जिसे मैंने अभी पाया है, केवल एक बहुत पुराना संस्करण स्थापित करता है:' pandas .__ version__ = 0.7.0'। मुझे यह पता लगाने के बाद कि मैं इसे कैसे अपडेट करूँगा, मैं आपकी पोस्ट पर वापस आऊंगा। :) – biohazard