2016-12-19 5 views
5

मैं अपने प्रशिक्षित विषय मॉडल MALLET के आधार पर किसी दस्तावेज़ के विषयों का अनुमान लगाने की कोशिश कर रहा हूं। मैं माल्लेट dirMALLET विषय-अनुमान

./mallet infer-topics --inferencer topic-model --input indata.mallet --output-doc-topics infered_docs

में निम्न आदेश का उपयोग कर रहा है, लेकिन यह डाली अपवाद में अटक जाती है:

java.lang.ClassCastException: cc.mallet.topics.ParallelTopicModel cannot be cast to cc.mallet.topics.TopicInferencer कैसे मैं इस का समाधान कर सकते हैं?

+0

क्या मुझे पता है कि इसमें 'बाश' क्यों टैग किया गया है? – sjsam

+0

ऐसा लगता है कि 'विषय-मॉडल' '--inferencer' पैरामीटर के लिए मान्य प्रकार नहीं है। – Berger

+1

@ एसजेएसएएम क्योंकि मैं mallet.sh का उपयोग कर रहा हूं जो एक बैश स्क्रिप्ट है और बैश प्रारूप –

उत्तर

3

मॉडल और एक इंफ्रेंसर के बीच एक अंतर है। train-topics कमांड में --output-model FILENAME विकल्प एक फ़ाइल (एक मॉडल) बनाता है जिसमें सभी अनुमानित पैरामीटर के साथ प्रशिक्षण डेटा होता है। --inferencer-filename FILENAME एक बहुत छोटी फ़ाइल (एक इंफ्रेंसर) उत्पन्न करता है जिसमें केवल नए दस्तावेज़ों के लिए विषयों का अनुमान लगाने के लिए आवश्यक पैरामीटर शामिल होते हैं।

infer-topics कमांड को एक विषय मॉडल की आवश्यकता है, पूर्ण मॉडल नहीं। --num-iterations 0 के साथ --input-model FILENAME और --inferencer-filename FILENAME विकल्पों के साथ train-topics चलाकर मौजूदा मॉडल फ़ाइल से एक इंफ्रेंसर बना सकते हैं।