मैंने एलडीए पढ़ा है और मैं गणित को समझता हूं कि दस्तावेज़ों के संग्रह को इनपुट करते समय विषय कैसे उत्पन्न होते हैं।एलडीए विषय मॉडलिंग - प्रशिक्षण और परीक्षण
संदर्भों का कहना है कि एलडीए एक एल्गोरिदम है, जिसमें दस्तावेजों का संग्रह दिया गया है और कुछ भी नहीं (कोई पर्यवेक्षण आवश्यक नहीं है), उस संग्रह में दस्तावेजों द्वारा व्यक्त किए गए "विषयों" को उजागर कर सकता है। इस प्रकार एलडीए एल्गोरिदम और गिब्स नमूने (या वैरिएबल बेयस) का उपयोग करके, मैं दस्तावेजों का एक सेट इनपुट कर सकता हूं और आउटपुट के रूप में मैं विषय प्राप्त कर सकता हूं। प्रत्येक विषय असाइन की गई संभावनाओं के साथ शर्तों का एक सेट है।
जो मुझे समझ में नहीं आता है, अगर उपर्युक्त सत्य है, तो कई विषय मॉडलिंग ट्यूटोरियल डेटासेट को प्रशिक्षण और परीक्षण सेट में अलग करने के बारे में क्यों बात करते हैं?
क्या कोई मुझे मॉडल को प्रशिक्षित करने के लिए एलडीए का उपयोग कैसे किया जा सकता है, इसके बारे में कुछ कदम (बुनियादी अवधारणा) समझा सकता है, जिसका उपयोग किसी अन्य परीक्षण डेटासेट का विश्लेषण करने के लिए किया जा सकता है?
एक अच्छा सवाल है! – KillBill