से स्टॉपवर्ड को हटा रहा है, मैं अपनी फ़ाइल में डेटा कॉलम से स्टॉपवर्ड को हटाना चाहता हूं। मैंने अंतिम उपयोगकर्ता बोलने के लिए लाइन को फ़िल्टर किया। लेकिन यह usertext.apply(lambda x: [word for word in x if word not in stop_words])
के साथ स्टॉपवर्ड को फ़िल्टर नहीं करता है, मैं गलत क्या कर रहा हूं?फ़ाइल
import pandas as pd
from stop_words import get_stop_words
df = pd.read_csv("F:/textclustering/data/cleandata.csv", encoding="iso-8859-1")
usertext = df[df.Role.str.contains("End-user",na=False)][['Data','chatid']]
stop_words = get_stop_words('dutch')
clean = usertext.apply(lambda x: [word for word in x if word not in stop_words])
print(clean)
पहले y कहां 1) 'stop_words' प्रिंट करें, 2)' clean = usertext.apply (lambda x: []) 'यह देखने के लिए कि क्या यह सभी शब्दों को हटा देता है? (बस परीक्षण करने के लिए) –
डेटा [] चैटिड [] dtype: ऑब्जेक्ट ['एन', 'अल', 'एलिस', 'अलस', 'altijd', 'andere', 'ben', 'bij' , 'दायर', 'दान', 'डेटा', 'डी', 'डेर', 'डीज', 'मर', 'डिट', 'डच', 'डॉन', 'दरवाजा', 'डस', ' ईन ',' ईन्स ',' एन ',' एर ',' जीई ',' जीन ',' गीवेस्ट ',' हायर ',' था ',' हेब ',' हेबबेन ',' हेफ्ट ',' हेम ' , 'हेट', 'हायर', 'हिज', 'हो', 'हुन', 'आईमांड', 'आईट्स', 'ik', 'इन', 'है', 'जे', 'जे', ' कान ',' कोन ',' कुनेन ',' मार ',' मी ',' मीर ',' मेन ',' मेट ',' मिज ',' मिज ',' मोएट ',' ना ',' नायर ' , 'niet', 'niets', 'nog', 'nu', 'of', 'om', 'omdat', ...] यह – DataNewB