मेरे पास बड़ी संख्या में याल्प डेटा है और मुझे समीक्षाओं को 8 अलग-अलग श्रेणियों में वर्गीकृत करना है।
श्रेणियाँ
कौन सा वर्गीकरण चुनने के लिए?
Cleanliness
Customer Service
Parking
Billing
Food Pricing
Food Quality
Waiting time
Unspecified
समीक्षा कई श्रेणियों तो मैं multilable वर्गीकरण का इस्तेमाल किया है शामिल हैं। लेकिन मैं उलझन में हूं कि मैं सकारात्मक/नकारात्मक कैसे संभाल सकता हूं। उदाहरण समीक्षा खाद्य गुणवत्ता के लिए सकारात्मक हो सकती है लेकिन ग्राहक सेवा के लिए नकारात्मक हो सकती है। पूर्व- food taste was very good but staff behaviour was very bad. so review contains positive food quality but negative Customer service
मैं इस मामले को कैसे संभाल सकता हूं? क्या मुझे वर्गीकरण से पहले भावनात्मक विश्लेषण करना चाहिए? कृपया मेरी मदद करें
इस प्रकार की समस्या को पहलू आधारित भावना विश्लेषण कहा जाता है। आप उस नाम के साथ कागजात के लिए Google कर सकते हैं। इसके अलावा, पहलू आधारित भावना विश्लेषण के लिए सेमेवल कार्य देखें। –
आप कस्टम लेबल जैसे (अच्छी खाद्य समीक्षा, खराब भोजन समीक्षा, अच्छी ग्राहक सेवा, खराब ग्राहक सेवा इत्यादि) बना सकते हैं। शायद यह मदद कर सकता है: - http://scikit-learn.org/stable/modules/multiclass.html#multioutput-classification –
पूछने के लिए गलत स्थान, बल्कि https://stats.stackexchange.com पर जाएं – Sentry