मुझे स्पार्क एमएलआईबीआईबी का उपयोग करके एलडीए विषय मॉडलिंग लागू करने में दिलचस्पी है। मैंने here में कोड और स्पष्टीकरण की जांच की है, लेकिन मुझे एक नए अदृश्य दस्तावेज़ में विषय वितरण खोजने के लिए मॉडल का उपयोग करने का तरीका नहीं मिला।स्पार्क एमएलआईबीबी एलडीए, नए अदृश्य दस्तावेज के विषयों के वितरण का अनुमान कैसे लगाया जाए?
13
A
उत्तर
13
स्पार्क 1.5 इस कार्यक्षमता के रूप में DistributedLDAModel
के लिए लागू नहीं किया गया।
newDocuments: RDD[(Long, Vector)] = ...
val topicDistributions = distLDA.toLocal.topicDistributions(newDocuments)
: क्या आप क्या करने की जरूरत के लिए जा रहे एक
LocalLDAModel
करने के लिए अपने मॉडल को परिवर्तित
toLocal
पद्धति का उपयोग करके और फिर
topicDistributions(documents: RDD[(Long, Vector])
विधि जहां
documents
नई (यानी बाहर के प्रशिक्षण) दस्तावेजों, कुछ इस तरह कर रहे हैं कहते हैं
यह ईएम एल्गोरिथ्म कि this paper पता चलता है की तुलना में कम सटीक होने जा रहा है, लेकिन यह काम करेंगे। वैकल्पिक रूप से, आप केवल नए ऑनलाइन विविधता ईएम प्रशिक्षण एल्गोरिदम का उपयोग कर सकते हैं जो पहले से ही LocalLDAModel
में परिणाम देता है। तेजी से होने के अलावा, इस नए एल्गोरिथ्म भी सच है कि यह, फिटिंग DistributedLDAModels
के लिए बड़े ईएम एल्गोरिथ्म के विपरीत, Dirichlet के मापदंडों (alphas) विषय मिश्रण दस्तावेज़ों के लिए वजन से अधिक के अनुकूलन है पूर्व की वजह से बेहतर है। Wallach, et. al. के अनुसार, अच्छे विषयों को प्राप्त करने के लिए जोर का अनुकूलन बहुत महत्वपूर्ण है।
संबंधित मुद्दे
- 1. स्पार्क एमएलआईबीबी और स्पार्क एमएल
- 2. अपाचे स्पार्क एमएलआईबीबी: पीएमएमएल
- 3. नए अक्षरों के लिए एपीआई दस्तावेज कैसे पढ़ा जाए?
- 4. ऊंचाई रास्टर से वेक्टर समोच्च का अनुमान कैसे लगाया जाए?
- 5. एलडीए के लिए विषयों की संख्या निर्धारित करने के लिए कैसे?
- 6. पूर्ण प्रवाह के बिना, पूर्णांक विमान पर यूक्लिडियन दूरी का अनुमान कैसे लगाया जाए?
- 7. ऋणात्मक enum सदस्यों का अनुमान लगाया गया है कि आखिरी बार अनुमान लगाया गया है?
- 8. यूनरी प्रकार के कन्स्ट्रक्टर के साथ आंतरिक प्रकार के बेकार रिकॉर्ड मान का अनुमान कैसे लगाया जाए?
- 9. टीएफएस के साथ फाइल संशोधनों का पता कैसे लगाया जाए?
- 10. उपनाम से किसी व्यक्ति की राष्ट्रीयता का अनुमान कैसे लगाया जाए?
- 11. स्पार्क
- 12. gensim में एलडीए विषय में शब्दों के पूर्ण वितरण को मुद्रित करने के लिए कैसे?
- 13. एलडीए
- 14. यहां जेनेरिक प्रकार का अनुमान लगाया जा रहा है?
- 15. लघु ग्रंथों के लिए एलडीए का नुकसान क्या है?
- 16. एलडीए जेन्सिम कार्यान्वयन, दो अलग-अलग दस्तावेज़ों के बीच दूरी
- 17. फॉर्म को अधिकतम करने के दौरान कैसे पता लगाया जाए?
- 18. jQuery और डेटाटेबल के साथ संख्यात्मक क्रम कैसे लगाया जाए?
- 19. निनजेक्ट के साथ पहचान वर्ग कैसे लगाया जाए?
- 20. रीयलटाइम पर कैसे पता लगाया जाए IOS
- 21. जंग के परिणामस्वरूप प्रकार के Iterator :: sum का अनुमान क्यों नहीं लगाया जा सकता है?
- 22. स्कैला में अनंत मूल्यों का पता कैसे लगाया जाए?
- 23. विंडोज सिस्टम ट्रे में परिवर्तनों का पता कैसे लगाया जाए?
- 24. फेसबुक शेयर सफलता का पता कैसे लगाया जाए? जावास्क्रिप्ट
- 25. मेक फ़ाइल में ओएस का पता कैसे लगाया जाए?
- 26. मोबाइल के मॉडल दिखाने के लिए डिवाइस का पता कैसे लगाया जाए?
- 27. मल्टी-भाषा प्रोजेक्ट के लिए डेल्फी में सिस्टम भाषा का पता कैसे लगाया जाए?
- 28. मेरी आईओएस सदस्यता को नवीनीकृत करने के बाद, क्या मेरे नए ऐप्स को नए वितरण प्रमाणपत्र के साथ हस्ताक्षरित नए वितरण प्रोफाइल के साथ अपडेट करना आवश्यक है?
- 29. अनुमान समापन समय/अनुमान लगाने का अनुमान
- 30. gensim एलडीए
धन्यवाद। जवाब बहुत उपयोगी है! यदि संभव हो, तो क्या आप अधिक विस्तृत परिणामों के लिए विषय वितरण के आउटपुट को निकालने के तरीके में विस्तार से विस्तार कर सकते हैं? – HappyCoding
मैं इस क्रियान्वित किया है और पता चला topicDistributions [यहां] (https://gist.github.com/alex9311/774089d936eee505d7832c6df2eb597d) – alex9311
कुछ भी 1.6 के लिए बदल दिया मुद्रित करने के लिए कैसे? –