7
  • सबसे अच्छा तरीका क्या है?
  • एल्गोरिदम का उपयोग क्या किया जाता है? उनकी ताकत और कमजोरियां क्या हैं?
  • वर्तमान मूवी अनुशंसा प्रणाली क्यों अच्छी सिफारिशें प्रदान करने में विफल रही हैं?
+0

शायद [webmasters.stackexchange.com] (http://webmasters.stackexchange.com) इस उत्तर के लिए बेहतर जगह है –

+0

क्या मुझे पता चलेगा क्यों? – melhosseiny

+0

"अधिकांश फिल्म अनुशंसाकर्ता सिस्टम क्यों चूसते हैं?" प्रोग्रामिंग प्रश्न की तरह नहीं लगता है। हो सकता है कि मैं webmasters.stackexchange.com के बारे में सही नहीं हूं –

उत्तर

7

यह एक बहुत ही खुले अंत प्रश्न है जिसमें कई अलग-अलग अवधारणाएं शामिल हैं।

प्रारंभिक चर्चा बिंदु के रूप में, k-nearest neighbor algorithm पर विचार करें। यह आपके मूवी पिकर की तरह समस्याओं में व्यापक रूप से उपयोग किया जाता है। इस एल्गोरिदम के साथ एक बड़ी समस्या यह तय करने में मानव इनपुट है कि आप अपने फीचर-स्पेस को विभाजित करने और उन आयामों के गुणों को चुनने के लिए कितने आयामों का उपयोग करते हैं ताकि प्रत्येक आयाम के मूल्य को डुप्लिकेट करने के बजाय प्रत्येक मूल्य जोड़ता है।

सीधे के-एनएन एल्गोरिदम से संबंधित cluster analysis का क्षेत्र है। जब आप उस जानकारी के लिए डेटा पॉइंट प्लॉट करते हैं जिसमें अधिक बिखरे हुए आउटलियर के भीतर क्लंप होता है तो आप सहजता से देख सकते हैं कि क्लॉम्ड पॉइंट्स में समानता की कुछ प्रकृति है। आप आसानी से एक या दूसरे क्लंप के साथ कुछ बिखरे हुए आउटलाइजर्स को समूहित करने में सक्षम हो सकते हैं, लेकिन ऐसे कई अंक होंगे जो दो या अधिक प्रतिस्पर्धी क्लंपों के साथ फिट हो सकते हैं। इस दुविधा का समाधान करने का एकमात्र तरीका है अपने डेटा बिंदुओं पर अधिक आयामी पैरामीटर जोड़ना ताकि उन असामान्य आउटलाइजर्स को एक क्लंप पर खींचा जा सके। (क्लंप किए गए डेटा की एक अच्छी तस्वीर देखने के लिए लिंक का पालन करें।)

यह संक्षिप्त परिचय अगली अवधारणा की ओर जाता है: Pattern Recognition। यह विषय गणित-भारी है और सैद्धांतिक कंप्यूटिंग विज्ञान, सांख्यिकी, आर्टिफिशियल इंटेलिजेंस, मशीन लर्निंग और क्लेयरवोयंस के क्षेत्र में बहुत से शोध का विषय है। वह आखिरी वाला अर्ध-मजाक है, लेकिन यह आपकी समस्या के क्रूक्स को इंगित करता है: कंप्यूटर भविष्यवाणी कर सकता है कि भविष्य में आप क्या करेंगे? संक्षिप्त उत्तर यह है कि यह नहीं कर सकता है। लंबा जवाब यह बताने की कोशिश करता है कि आपके स्वाद और मनोदशा यादृच्छिक समय पर यादृच्छिक दिशाओं में क्यों बदलते हैं।एक अच्छी पैटर्न पहचान प्रणाली 20 फिल्में चुन सकती है जिन्हें आप वास्तव में आनंद लेते हैं और फिर उसी क्लंप से दूसरे को सलाह देते हैं कि दूसरे 20 ने आपको पूरी तरह से नफरत की है। सिस्टम कहां विफल हुआ? क्या यह एल्गोरिदम कार्यान्वयन में था, आपकी सुविधा-स्थान के आयामों के लिए पैरामीटर का प्रारंभिक चयन, या आपकी प्रोफ़ाइल को गड़बड़ कर दिया गया था क्योंकि किसी और ने आपके नेटफ्लिक्स खाते का उपयोग 'हॉवर्ड डक', क्रूज़िंग ' , और 'समुद्र तट'?

'पैटर्न पहचान' के लिए विकिपीडिया पृष्ठ में कई अलग-अलग एल्गोरिदम और विधियां सूचीबद्ध हैं। आप अलग-अलग शक्तियों और कमजोरियों पर बेहतर संभाल पाने के लिए वहां पढ़ना शुरू कर सकते हैं। आप लंबे समय से बालों वाले उत्तरों को प्राप्त करने के लिए Theoretical Computer Science स्टैक में इस प्रश्न को पूछने का प्रयास भी कर सकते हैं।

2

बेलकोर से एक टीम ने Netflix Prize जीता। तो, तर्कसंगत रूप से, यह दृष्टिकोण सबसे अच्छा दृष्टिकोण हो सकता है।

इन सिफारिश प्रणालियों के काम के लिए उच्च स्तर, अंतर्ज्ञानी, स्पष्टीकरण देने के लिए, निम्न स्थितियों पर विचार करें। मैं सप्ताह में दो बार स्टार वार्स देखता हूं। अब, अगर आपको मुझे एक फिल्म की सिफारिश करनी है जो मैं चाहूंगा, तो आप कौन सी फिल्म चुनेंगे? हैरिसन फोर्ड के साथ एक फिल्म? एक विज्ञान-फाई फिल्म? शायद 80 के दशक में बनाई गई एक फिल्म?

सिफारिश प्रणाली के पीछे बड़ा विचार यह है कि जितना अधिक वे जानते हैं कि आपको क्या पसंद है (यानी कौन सी शैलियों, अभिनेता, आदि), वे बेहतर सिफारिशें दे सकते हैं।

हालांकि, यदि आपके स्वाद एक-दूसरे से विरोधाभास करते हैं (उदाहरण के लिए आप निजी रायन सेव करना पसंद करते हैं लेकिन शांतिवादियों के बारे में फिल्मों को भी प्यार करते हैं), तो आपको एक फिल्म की सिफारिश करना मुश्किल होगा।

संक्षेप में, कई सिफारिश एल्गोरिदम जानने की जरूरत:

  1. आप की तरह क्या: यह जानते हुए भी क्या सुविधा रिकॉर्डिंग क्या फिल्में आप की तरह में उपयोग करने के लिए सेट शामिल है। जैसे फिल्म की शैली क्या है, फिल्म में कौन से कलाकार हैं, आदि
  2. आपकी पसंद के अनुसार कौन सी फिल्में समान हैं। इसमें पिछले चरण में उपयोग किए जाने वाले फीचर सेट के आधार पर एक अच्छी समानता मीट्रिक ढूंढना शामिल है।
संबंधित मुद्दे