मेरे पास प्रत्येक तत्व में बड़े स्ट्रिंग वाले एक-आयामी सरणी है। मैं टेक्स्ट डेटा को संख्यात्मक वैक्टर में बदलने के लिए CountVectorizer
का उपयोग करने का प्रयास कर रहा हूं।CountVectorizer: विशेषताइंटर: 'numpy.ndarray' ऑब्जेक्ट में कोई विशेषता नहीं है 'निचला'
AttributeError: 'numpy.ndarray' object has no attribute 'lower'
mealarray
तत्वों में से प्रत्येक में बड़े तार शामिल हैं: हालांकि, मैं एक त्रुटि कहावत हो रही है। 5000 ऐसे नमूने हैं।
vectorizer = CountVectorizer(
stop_words='english',
ngram_range=(1, 1), #ngram_range=(1, 1) is the default
dtype='double',
)
data = vectorizer.fit_transform(mealarray)
पूर्ण स्टैकट्रेस:
File "/Library/Python/2.7/site-packages/sklearn/feature_extraction/text.py", line 817, in fit_transform
self.fixed_vocabulary_)
File "/Library/Python/2.7/site-packages/sklearn/feature_extraction/text.py", line 748, in _count_vocab
for feature in analyze(doc):
File "/Library/Python/2.7/site-packages/sklearn/feature_extraction/text.py", line 234, in <lambda>
tokenize(preprocess(self.decode(doc))), stop_words)
File "/Library/Python/2.7/site-packages/sklearn/feature_extraction/text.py", line 200, in <lambda>
return lambda x: strip_accents(x.lower())
AttributeError: 'numpy.ndarray' object has no attribute 'lower'
कोई (पूर्ण स्टैक ट्रेस के बिना, यह कहना मुश्किल है कि कौन, या तो विज्ञान या नम्पी) एक स्ट्रिंग ('" FOO ".lower()' रिटर्न '" foo "के रूप में एक अम्पी सरणी का इलाज करने की कोशिश कर रहा है। । क्या आप निश्चित हैं कि 'भोजन के प्रकार' की सामग्री तार हैं, या 'countVectorizer' स्ट्रिंग की सरणी चाहता है? –
@ अहमदफसीह, अभी प्रश्न के लिए पूर्ण स्टैक ट्रेस जोड़ा गया है! – ashu