2014-04-12 7 views
5

मुझे पता है कि gensim के लिए झील प्राधिकरण मॉडल प्रशिक्षण के बाद, हम द्वारा एक अदृश्य दस्तावेज़ के लिए विषय हो सकता है:Gensim एक दस्तावेज़ (देखा दस्तावेज़) के लिए विषय मिल

lda = LdaModel(corpus, num_topics=10) 
doc_lda = lda[doc_bow] 

लेकिन यह कैसे दस्तावेजों कि पहले से ही कर रहे हैं के बारे में प्रशिक्षण के लिए इस्तेमाल? मेरा मतलब है वहाँ एक रास्ता कोष में एक दस्तावेज है कि एक नया दस्तावेज़ की तरह यह इलाज के बिना प्रशिक्षण में इस्तेमाल किया गया था के लिए विषय पाने के लिए है?

उत्तर

4

सं

व्यक्तिगत दस्तावेजों की जानकारी मॉडल में आसवित है, फिर भूल गई है। कोई प्रति-दस्तावेज़ जानकारी रखी जाती है (अधिक आम तौर पर: कोई जानकारी नहीं है कि O(#docs) स्मृति की आवश्यकता होगी रखा जाता है)।

+0

लेकिन अगर मैं प्रशिक्षित दस्तावेज़ के लिए विषय वितरण प्राप्त करना चाहते हैं, तो मैं क्लस्टरिंग आपरेशन के कुछ प्रकार हो सकता है, तो मैं क्या कर सकता है? – storen

संबंधित मुद्दे