numpy.genfromtxt: अस्पष्ट delimiters?

मैं एक सामान्य लिपि लिखने की कोशिश कर रहा हूं, जिसमें से एक आयात फाइलें हैं जो या तो अल्पविराम से अलग या सफेद-स्थान से अलग होती हैं। मैं स्क्रिप्ट को किसी भी प्रकार को पहचानना चाहता हूं। वहाँ की तरहnumpy.genfromtxt: अस्पष्ट delimiters?

arrayobj = np.genfromtxt(file.txt, delimiter=(',' OR '\t'), names=None, dtype=None)

मैं रेगुलर एक्सप्रेशन (',|\t') का उपयोग कर की कोशिश की लेकिन है कि या तो काम नहीं करता है कुछ निर्दिष्ट करने के लिए एक रास्ता है।

स्रोत

2013-07-18 PikalaxALT

मेरा मानना है कि आप इस के लिए np.genfromtxt उपयोग कर सकते हैं नहीं है। Delimiter तर्क सीधे पाइथन मानक पुस्तकालय 'str.split (delimiter)' पारित किया जाता है। – Daniel

जैसा कि मैंने बताया है कि मुझे विश्वास नहीं है कि np.genfromtxt के साथ ऐसा करने का एक तरीका है; हालांकि आप हमेशा पाइथन पांडा का उपयोग कर सकते हैं।

example.txt: 
1,2,3 #Header 
1,2,3 
4,5'tab'6 
7'tab'8'tab'9

का उपयोग करते हुए पांडा read_csv:

print pd.read_csv('example.csv',sep='\t|,').values 
[[1 2 3] 
[4 5 6] 
[7 8 9]]

स्रोत

2013-08-22 02:41:20 Daniel

numpy.genfromtxt: अस्पष्ट delimiters?

उत्तर

संबंधित मुद्दे