अपने प्रोजेक्ट अरबी भाषा में एक भावना तो सकारात्मक या नकारात्मक (भावना विश्लेषण) की पहचान करने, इस कार्य को मैं NLTK और अजगर का इस्तेमाल किया करने के लिए, जब मैं अरबी में ट्वीट्स दर्ज एक त्रुटि तब होती हैमैं अपने पायथन कोड में अरबी पाठ कैसे इनपुट करूं?
>>> pos_tweets = [(' أساند كل عون أمن شريف', 'positive'),
('ما أحلى الثورة التونسية', 'positive'),
('أجمل طفل في العالم', 'positive'),
('الشعب يحرس', 'positive'),
('ثورة شعبنا هي ثورة الكـــرامة وثـــورة الأحــــرار', 'positive')]
Unsupported characters in input
है मैं कैसे कर सकते हैं इस समस्या का समाधान निकले?
आप अपने सिस्टम के बारे में अधिक जानकारी दे सकते हैं? – pram
मेरी परियोजना अरबी भाषा के लिए एक भावना विश्लेषण टूलकिट बनाने के लिए है, जब मैंने नेट ब्राउज़ किया था तो मुझे पता चला कि यह कार्य अंग्रेजी भाषा से अधिक कठिन है, मुझे एक उदाहरण मिला जो एनएलटीके और पायथन से भावना का विश्लेषण करने के लिए सौदा करता है और यह एक अच्छा परिणाम देता है [उदाहरण] (http://www.laurentluce.com/posts/twitter-sentiment-analysis-using-python-and-nltk/), मुझे आश्चर्य है कि क्या मैं अरबी भाषा के लिए एक ही चीज़ कर सकता हूं –
क्षमा करें, मैं मतलब आप इंटरैक्टिव शैल से या एक स्क्रिप्ट से चल रहे हैं? आप किस पायथन खोल का उपयोग करते थे, आपका ओएस क्या है, आदि – pram