मुझे पता है कि हानि की गणना करने के लिए tensorflow में नकारात्मक नमूनाकरण के बारे में दो कार्य हैं (sampled_softmax_loss और nce_loss)। इन दो कार्यों के पैरामीटर समान हैं, लेकिन मैं वास्तव में जानना चाहता हूं कि दोनों के बीच क्या अंतर है?tensorflow में sampled_softmax_loss और nce_loss के बीच क्या अंतर है?
उत्तर
नमूनाकृत सॉफ्टमैक्स आपके आउटपुट में सभी नमूनों पर सामान्यीकृत करने की कोशिश करता है। एक गैर-सामान्य वितरण (आपके लेबल पर लॉगरिदमिक) होने के कारण यह एक इष्टतम हानि कार्य नहीं है। ध्यान दें कि यद्यपि उनके पास समान पैरामीटर हैं, वैसे ही आप फ़ंक्शन का उपयोग करते हैं। यहाँ प्रलेखन पर एक नज़र डालें: https://github.com/calebchoo/Tensorflow/blob/master/tensorflow/g3doc/api_docs/python/functions_and_classes/shard4/tf.nn.nce_loss.md और इस लाइन पढ़ें:
डिफ़ॉल्ट रूप से यह एक लॉग-वर्दी का उपयोग करता है (Zipfian) नमूने के लिए वितरण, इसलिए अपने लेबल की बारंबारता कम अच्छे परिणाम प्राप्त करने के लिए क्रम में सॉर्ट किया जाना चाहिए । अधिक जानकारी के लिए, log_uniform_candidate_sampler देखें। http://papers.nips.cc/paper/5165-learning-word-embeddings-efficiently-with-noise-contrastive-estimation.pdf
आशा इस मदद करता है:
इस पत्र पर एक नज़र, जहां वे स्पष्टीकरण दें कि वे शब्द embeddings के लिए इसका इस्तेमाल करते हैं लो!
नमूना सॉफ्टमैक्स दिए गए नंबर का नमूना चुनने और सॉफ्टमैक्स हानि प्राप्त करने का प्रयास करने के बारे में है। यहां मुख्य उद्देश्य हमारे सच्चे सॉफ्टमैक्स के बराबर नमूनाकृत सॉफ्टमैक्स का परिणाम बनाना है। इसलिए एल्गोरिदम मूल रूप से दिए गए वितरण से उन नमूनों को चुनने पर बहुत ध्यान केंद्रित करता है। दूसरी ओर एनसीई हानि शोर के नमूने का चयन करने और सच्चे सॉफ्टमैक्स की नकल करने की कोशिश करने के लिए अधिक है। इसमें केवल एक सच्ची कक्षा और के शोर वर्ग होंगे।
- 1. tensorflow dynamic_rnn और rnn के बीच क्या अंतर है?
- 2. tf.estimator.Estimator और tf.contrib.learn.Estimator के बीच अंतर क्या है TensorFlow
- 3. वेन्सेबल और get_variable के बीच अंतर TensorFlow
- 4. क्या $ @ और "$ @" के बीच कोई अंतर है?
- 5. # {} $ {} और% {} के बीच क्या अंतर है?
- 6. * और * के बीच क्या अंतर है?
- 7. के बीच क्या अंतर है:। और: आर !?
- 8. [अपरिभाषित] और [,] के बीच क्या अंतर है?
- 9. वेरिलोग के बीच क्या अंतर है! और ~?
- 10. `&` और `ref` के बीच क्या अंतर है?
- 11. $ और $$ के बीच क्या अंतर है?
- 12. भिन्नता और '-' के बीच क्या अंतर है?
- 13. "$^एन" और "$ +" के बीच क्या अंतर है?
- 14. के बीच क्या अंतर है?
- 15. MATLAB में & &&& के बीच क्या अंतर है?
- 16. अंतर और कहां के बीच क्या अंतर है?
- 17. क्या fit_generator में "samples_per_epoch" और "steps_per_epoch" के बीच अंतर
- 18. WinAPI में हैंडल और एचएफआईएलई के बीच क्या अंतर है?
- 19. सिम्फनी में रीडायरेक्ट और आगे के बीच क्या अंतर है?
- 20. PHP में iconv() और mb_convert_encoding() के बीच क्या अंतर है?
- 21. वेरिलोग में $ स्टॉप और $ फिनिश के बीच क्या अंतर है?
- 22. ember.js में, मिश्रण और विस्तार के बीच क्या अंतर है?
- 23. पर्ल में 'eq' और '= ~' के बीच क्या अंतर है?
- 24. गेब में, प्रदर्शित और वर्तमान के बीच क्या अंतर है?
- 25. गिट में लेखक और कमिटर के बीच क्या अंतर है?
- 26. आर में, अनलिंक और file.remove के बीच क्या अंतर है?
- 27. प्रोलॉग में == और = के बीच क्या अंतर है?
- 28. पर्ल में खुले और सिसोपेन के बीच क्या अंतर है?
- 29. रेगेक्स में() और [] के बीच क्या अंतर है?
- 30. प्रोजेक्ट.जेसन में 'निर्भरता' और 'फ्रेमवर्कएस्सेब्ली' के बीच क्या अंतर है?
पहले लिंक टूट गया है, का उपयोग करें: https://github.com/calebchoo/Tensorflow/blob/master/tensorflow/g3doc/api_docs/python/functions_and_classes/shard4/tf.nn.nce_loss.md –
धन्यवाद! लिंक फिक्स्ड – rmeertens