2013-07-18 7 views
7

मैं एक सामान्य लिपि लिखने की कोशिश कर रहा हूं, जिसमें से एक आयात फाइलें हैं जो या तो अल्पविराम से अलग या सफेद-स्थान से अलग होती हैं। मैं स्क्रिप्ट को किसी भी प्रकार को पहचानना चाहता हूं। वहाँ की तरहnumpy.genfromtxt: अस्पष्ट delimiters?

arrayobj = np.genfromtxt(file.txt, delimiter=(',' OR '\t'), names=None, dtype=None) 

मैं रेगुलर एक्सप्रेशन (',|\t') का उपयोग कर की कोशिश की लेकिन है कि या तो काम नहीं करता है कुछ निर्दिष्ट करने के लिए एक रास्ता है।

+4

मेरा मानना ​​है कि आप इस के लिए np.genfromtxt उपयोग कर सकते हैं नहीं है। Delimiter तर्क सीधे पाइथन मानक पुस्तकालय 'str.split (delimiter)' पारित किया जाता है। – Daniel

उत्तर

1

जैसा कि मैंने बताया है कि मुझे विश्वास नहीं है कि np.genfromtxt के साथ ऐसा करने का एक तरीका है; हालांकि आप हमेशा पाइथन पांडा का उपयोग कर सकते हैं।

example.txt: 
1,2,3 #Header 
1,2,3 
4,5'tab'6 
7'tab'8'tab'9 

का उपयोग करते हुए पांडा read_csv:

print pd.read_csv('example.csv',sep='\t|,').values 
[[1 2 3] 
[4 5 6] 
[7 8 9]] 
संबंधित मुद्दे