सबसे पहले आपको यह तय करना होगा कि आप वास्तव में क्या सिफारिश कर रहे हैं और किस परिस्थितियों में। खाते में ध्यान देने के लिए कई चीजें हैं। क्या आप "अन्य उपयोगकर्ताओं को खरीदा है जिन्होंने एक्स खरीदा है वाई भी खरीदा है?" क्या आप केवल उन वस्तुओं की अनुशंसा करने जा रहे हैं जिनके पास एक दूसरे के समान प्रकृति है? क्या आप ऐसी वस्तुओं की सिफारिश कर रहे हैं जिनके साथ-साथ-एक-अधिक-उपयोगी-एक-एक प्रकार का रिश्ता है?
मुझे यकीन है कि कई और निर्णय हैं, और उनमें से प्रत्येक के मन में अपने लक्ष्य हैं। उपर्युक्त सभी को संभालने के लिए एक विशाल नेटवर्क को प्रशिक्षित करना बहुत मुश्किल होगा।
तंत्रिका नेटवर्क सभी एक ही चीज़ पर उबालते हैं। आपके पास इनपुट का एक निर्धारित सेट है। आपके पास नेटवर्क टोपोलॉजी है। आपके पास एक सक्रियण कार्य है। आपके पास नोड्स के इनपुट पर वजन है। आपके पास आउटपुट हैं, और आपके पास त्रुटि को मापने और सही करने का साधन है। प्रत्येक प्रकार के तंत्रिका नेटवर्क में उन सभी चीजों को करने का अपना तरीका हो सकता है, लेकिन वे हर समय मौजूद होते हैं (मेरे सीमित ज्ञान के लिए)। फिर, आप आउटपुट परिणामों के बारे में ज्ञात इनपुट सेट की एक श्रृंखला में भोजन करके नेटवर्क को प्रशिक्षित करते हैं। आप इस ट्रेनिंग सेट को जितना चाहें उतना अधिक या प्रशिक्षण के बिना चलाते हैं (जो आपका अनुमान है कि यह अगले व्यक्ति के रूप में है), और फिर आप रोल करने के लिए तैयार हैं।
अनिवार्य रूप से, आपके इनपुट सेट को उन गुणों के एक निश्चित समूह के रूप में वर्णित किया जा सकता है, जो आपको लगता है कि अंतर्निहित कार्य में प्रासंगिकता है (उदाहरण के लिए: वर्षा, आर्द्रता, तापमान, बीमारी, आयु, स्थान, लागत, कौशल, समय दिन का दिन, सप्ताह का दिन, कार्य की स्थिति, और लिंग यह तय करने में महत्वपूर्ण भूमिका निभा सकता है कि व्यक्ति किसी दिए गए दिन गोल्फ़िंग करेगा या नहीं)। इसलिए आपको यह तय करना होगा कि आप वास्तव में क्या सिफारिश कर रहे हैं और किस स्थितियों के तहत। आपके नेटवर्क इनपुट प्रकृति में बूलियन हो सकते हैं (0.0 झूठ और 1.0 सत्य होने के लिए, उदाहरण के लिए) या एक छद्म-निरंतर अंतरिक्ष में मैप किया गया है (जहां 0.0 का मतलब यह नहीं हो सकता है, .45 का मतलब कुछ हद तक है ,8 का मतलब है, और 1.0 का मतलब है हाँ)। यह दूसरा विकल्प आपको एक निश्चित इनपुट के लिए आत्मविश्वास के स्तर को मैप करने के लिए टूल दे सकता है, या एक गणित गणना सरल है जो आपको लगता है कि प्रासंगिक है।
आशा है कि इससे मदद मिलेगी। आपने आगे जाने के लिए बहुत कुछ नहीं दिया :)
स्रोत
2010-02-23 00:25:14
अपने संपादित संबंध से विषय के बारे में लिखा का वर्णन करता है पर एक नजर है: नहीं, आप भूल रहे हैं बिंदु। एनएन का बिंदु सांख्यिकीय गुणों के आधार पर वर्गीकरण है।वे प्रकृति में Bayesean नहीं हैं, लेकिन आप इस तरह से सोच सकते हैं अगर यह आपकी मदद करता है: "जब मेरे पास एक निश्चित मूल्य का इनपुट ए है, एक निश्चित मूल्य के इनपुट बी, एक निश्चित मूल्य के इनपुट सी ... क्या है संभावना है कि यह विशिष्ट इनपुट सेट एक निश्चित समूह से संबंधित है (अधिक सटीक रूप से, आप पूछते हैं कि यह किस समूह से संबंधित है)? यह एनएन का उद्देश्य है। आप इस मॉडल को सरल वर्गीकरण से अधिक में इस्तेमाल करने के लिए फ्लेक्स कर सकते हैं, लेकिन इसके दिल में, यह वही है। –
धन्यवाद, आपका उत्तर स्पष्ट रूप से बताता है कि डेटा को कैसे इनपुट किया जाए, लेकिन आउटपुट को किस तरह दिखाना चाहिए और उनका मतलब क्या नहीं होगा। यही वह जगह है जहां मैं उलझन में हूं। – Louis
आउटपुट संख्यात्मक होने जा रहे हैं, लेकिन उन संख्याओं का अर्थ होना चाहिए। "उनका क्या मतलब है" नेटवर्क के डिजाइनर, आप पर निर्भर है, लेकिन यह उन्हें डेटाबेस आईडी (जो कि कोई गणित अर्थ वाला लेबल नहीं है) में मैप करने के लिए काम नहीं करेगा आप चाहते हैं। आउटपुट को सीधे लेबल में परिवर्तित नहीं किया जा सकता है। आउटपुट ए एक सांख्यिकीय मॉडल के मूल्यों को फिर से करें। ऐसा लगता है कि आप अपनी जर्सी की संख्या के आधार पर क्वार्टरबैक के प्रदर्शन की भविष्यवाणी करने की कोशिश कर रहे हैं। जब तक कि जर्सी को खिलाड़ी के बारे में विशिष्ट, अवलोकन योग्य मानदंडों पर असाइन नहीं किया जाता है, तब तक ऐसी कोई भविष्यवाणी व्यर्थ नहीं होगी। –