का उपयोग कर डेटा वर्गीकृत करें मैं एक सरल वर्गीकरण समस्या को हल करने का प्रयास कर रहा हूं।Apache Mahout
समस्या:
मेरे पास टेक्स्ट का एक सेट है और मुझे सामग्री के आधार पर उन्हें वर्गीकृत करना होगा।
महोत्सव का उपयोग समाधान:
मुझे समझ में आया कि मुझे इनपुट उत्पन्न करने के लिए इनपुट को अनुक्रम फ़ाइल में परिवर्तित करना है। हाँ, मैं यह करने में सक्षम था। अब, मैं अपने टेस्ट डेटा को वर्गीकृत कैसे करूं? 20 न्यूज़ उदाहरण केवल शुद्धता के लिए परीक्षण करता है। लेकिन, मैं वास्तविक वर्गीकरण करना चाहता हूं।
मुझे यकीन नहीं है कि मुझे कोड लिखने की आवश्यकता है या परीक्षण सेट को वर्गीकृत करने के लिए उपलब्ध कुछ मौजूदा वर्गों का उपयोग करना है।
IMO पर पूर्व-रिलीज़ संस्करण प्राप्त कर सकते हैं, किताब में वर्गीकरण पर वर्गों सुधार किया जा सकता। वर्गीकरण पर वर्ग शब्दशः, अस्पष्ट और अक्सर, गैर अनुक्रमक है। अधिक जावा कोडिंग उदाहरण और कम बैश खोल उदाहरण हो सकते हैं। वर्गीकरण अनुभाग बेहतर हो सकता है अगर इसे परिचय अध्यायों की तरह लिखा गया हो: वर्गीकरण फ़ाइलों के प्रारूप को दिखाएं, उन्हें कैसे पढ़ा जाए, उन्हें अपने वर्गीकृत में कैसे लोड करें, एक बार प्रशिक्षित, एक नए नमूने वर्गीकृत करने के लिए वर्गीकरण का उपयोग कैसे करें। –
मेरी इच्छा है कि महाउट में अधिक और बेहतर दस्तावेज़ीकरण हो। जो लोग मशीन लर्निंग में विशेषज्ञ हैं, उन्हें प्रोसेसिंग पाइपलाइन और कोड आर्किटेक्चर की संरचना को समझने में मुश्किल होती है। यहां तक कि javadocs अनुचित शब्दावली का उपयोग करते हैं (setGramSize setNGramSize होना चाहिए) छोटे अर्थशास्त्र अवधारणाओं और कोड को समझने में एक बड़ा अंतर बनाते हैं। –