प्रश्न सरल है। सीबीओ & स्किप-ग्राम किस बड़े डेटासेट के लिए बेहतर काम करता है? (और छोटे डेटासेट के लिए इस सवाल का जवाब इस प्रकार है।)word2vec: सीबीओ और स्किप-ग्राम प्रदर्शन wrt प्रशिक्षण डेटासेट आकार
मैं, के बाद से भ्रमित कर रहा हूँ खुद Mikolov द्वारा, [Link]
छोड़ें ग्राम: प्रशिक्षण डेटा की छोटी राशि के साथ अच्छी तरह से काम करता है, अच्छी तरह से भी दुर्लभ का प्रतिनिधित्व करता है शब्द या वाक्यांश।
CBOW: कई गुना तेजी से छोड़ ग्राम, लगातार शब्द
के लिए थोड़ा बेहतर सटीकता से प्रशिक्षित लेकिन, गूगल TensorFlow के अनुसार, [Link]
CBOW का एक बहुत से अधिक कोमल बनाता है करने के लिए वितरण संबंधी जानकारी (पूरे संदर्भ को एक अवलोकन के रूप में उपयोग करके)। अधिकांश भाग के लिए, यह छोटे डेटासेट के लिए उपयोगी चीज साबित होता है।
हालांकि, स्किप-ग्राम प्रत्येक संदर्भ-लक्ष्य जोड़ी को एक नए अवलोकन के रूप में मानता है, और यह बेहतर होता है जब हमारे पास बड़े डेटासेट होते हैं। हम इस ट्यूटोरियल के बाकी हिस्सों में स्किप-ग्राम मॉडल पर ध्यान केंद्रित करेंगे।
यहाँ एक Quora पोस्ट जो पहला विचार [Link] का समर्थन करता है, और फिर वहाँ अन्य Quora पोस्ट जो दूसरे सोचा [Link] --both ऊपर उल्लिखित विश्वसनीय सूत्रों से व्युत्पत्ति लगते हैं पता चलता है। सबसे अच्छा अभ्यास कुछ प्रयोगों कोशिश करते हैं और देखते हैं कि क्या आपके लिए सबसे अच्छा काम करता है, के रूप में विभिन्न अनुप्रयोगों के विभिन्न आवश्यकताओं के लिए है,
कुल मिलाकर:
या की तरह क्या Mikolov ने कहा कि यह है।
लेकिन निश्चित रूप से इस मामले पर एक अनुभवजन्य या विश्लेषणात्मक फैसले या अंतिम कहानियां हैं?