2011-02-22 7 views
7

का उपयोग कर दस्तावेजों को फ़िल्टर करने के लिए वीका में एक एसवीएम बनाने की आवश्यकता है, मैं एक पूर्ण शुरुआतकर्ता हूं। जावा का उपयोग करके कभी भी वर्गीकृत या वीका में कुछ भी नहीं बनाया है मैंने पहले इंटरफ़ेस का उपयोग किया है। असल में मैं खो गया हूं मैंने वीका के लिए फ़िल्टर क्लास को देखा है और इसके साथ थोड़ा सा खेला है। मेरे दस्तावेज़ टेक्स्ट दस्तावेज़ हैं और मुझे उन्हें 2 श्रेणियों में अलग करने की आवश्यकता है।मुझे जावा

मुझे यकीन है कि मैं कैसे श्रेणियों को परिभाषित या नहीं कर रहा हूँ कि कैसे मैं एक IDE

में वर्गीकृत करने के

किसी भी मदद/ट्यूटोरियल या संकेत बहुत सराहना की जाएगी :-(में दस्तावेज लोड।

उत्तर

2

मैं इस जावा ट्यूटोरियल बहुत उपयोगी पाया है, हालांकि बहुत कम संसाधनों ऑनलाइन उपलब्ध हैं (है कि मैं पाया है)

http://www.cs.waikato.ac.nz/ml/weka/index_documentation.html

आशा है कि यह

2

पहली बार वीका का उपयोग करना दर्द है, लेकिन आपको इसके माध्यम से जाना होगा।

इसके अलावा, मैंने वीका की कोशिश की, लेकिन मुझे स्मृति अपवादों से जेवीएम के कारण इसे डंप करना पड़ा। मैंने अपना खुद लिखा रुबी का उपयोग करके छोटे क्लस्टरिंग अलगो, इसका प्रदर्शन तरीका था बेहतर।

  1. आप कैसे Weka में SVM उपयोग करने के लिए की इस ट्यूटोरियल का पालन कर सकते हैं::

    किसी भी तरह से, यहाँ WEKA में SVM उपयोग करने के लिए कैसे है www.stat.nctu.edu.tw/~misg/WekaInC .ppt

  2. अब, आपको एआरएफएफ प्रारूप में डेटा की आवश्यकता होगी (और मैं आपको अपने एक्सप के अनुसार इसका उपयोग करने की सलाह देता हूं, यह मदद करता है, डेटा WEKA के परिप्रेक्ष्य से अधिक संरचित दिखता है)। तो, आप XML2ARFF-Converter का उपयोग करके ऐसा कर सकते हैं जिसे मैंने स्वयं के लिए लिखा था। आप टेक्स्ट फ़ाइलों को पढ़ने और अपनी टेक्स्ट फ़ाइल को एआरएफएफ में बदलने के लिए इसे संशोधित कर सकते हैं।

+0

तुम बाहर पर विस्तृत कर सकते हैं मदद करता है स्मृति अपवादों का? मैं जांच कर रहा हूं कि क्या वीका मेरे लिए एक अच्छा फिट है, ये समस्याएं कितनी बुरी हैं? क्या आपने ढेर को बढ़ाने पर देखा? http://weka.wikispaces.com/OutOfMemoryException – Blub

+0

मैंने बहुत कुछ नहीं खोजा। लेकिन वीका व्यापक रूप से उपयोग की जाने वाली लाइब्रेरी है, मुझे यकीन है कि आपको कुछ स्मार्ट वर्कअराउंड मिलेगा। मैंने इसका उपयोग नहीं किया क्योंकि मुझे रुबी का उपयोग करने का एक कारण मिला जिसे मैं सीखने की कोशिश कर रहा था। – zengr

+0

यदि आप बड़े डेटासेट के साथ काम कर रहे हैं तो आप आमतौर पर मेमोरी सीमाओं के खिलाफ आते हैं - यदि आप वीका का उपयोग करके इन्हें मार रहे हैं तो एक्सएमएक्स ध्वज के साथ जेवीएम ढेर आकार को बढ़ाने का प्रयास करें: "जावा-एक्सएमएक्स 8000 एम -जर वीका.जर" आवंटित 8000 एमबीएस के ढेर के साथ वेका चलाएं। –

संबंधित मुद्दे