2009-06-19 14 views
16

बस recent article in Wired पढ़ने के बाद, मैं उत्सुक हूं: Netflix पुरस्कार के बारे में क्या है जो इतना चुनौतीपूर्ण है? मेरा मतलब है कि यह सबसे गंभीर तरीके से संभव है, मैं सिर्फ प्रतियोगिता से उत्पन्न कठिनाइयों के बारे में उत्सुक हूं। क्या सामान्य रूप से अधिकतर सिफारिश इंजनों में सुधार करना मुश्किल है? यदि हां, तो वह क्यों है? या, Netflix को सुधारने में असामान्य रूप से मुश्किल है, और यदि ऐसा है, तो Netflix के बारे में विशेष क्या है जो अमेज़ॅन कहने से कहीं अधिक चुनौतीपूर्ण बनाता है?नेटफ्लिक्स पुरस्कार इतना चुनौतीपूर्ण क्यों है?

+0

यह SO पर क्यों है? बंद करे। –

+13

@ लुकास यह एक प्रोग्रामिंग चुनौती और इसके तकनीकी विवरण के बारे में एक प्रश्न है, इसलिए यह प्रोग्रामिंग से संबंधित है। मुझे नहीं लगता कि यह * क्यों * पर नहीं होगा। –

+2

क्यों नहीं? सिफारिश इंजन निश्चित रूप से प्रोग्रामिंग से संबंधित हैं। एसओ पर सबसे अच्छा सवाल नहीं हो सकता है, लेकिन फिर भी। – dmeister

उत्तर

13

क्योंकि नेटफ्लिक्स में पहले से ही वास्तव में एक अच्छा अनुशंसा इंजन है। अगर वे जानते थे कि इसे आसानी से कैसे सुधारना है, तो वे अब तक ऐसा कर सकते थे। उनका पूरा व्यापार मॉडल उपभोक्ताओं को क्रॉस सेलिंग उत्पादों (फिल्मों) के आसपास है। अनुशंसा एल्गोरिदम वास्तव में उनके व्यापार का मूल है। यह बेहतर काम करता है, जितना पैसा वे बनाने के लिए खड़े हैं।

+1

खैर ... भारी सस्ती सूची, लंबी पूंछ, (विश्वसनीय) सदस्यता राजस्व, और ग्राहकों की संख्या तक पहुंचने के लिए नेट की शक्ति भी उनके व्यावसायिक मॉडल के लिए बहुत महत्वपूर्ण है। – isomorphismes

2

मुझे लगता है कि इस पर कुछ लेख लिखे गए हैं, लेकिन मुझे नहीं पता कि वे इस समय कहां हैं, इसलिए मैं इसे यहां समझाऊंगा।

जब लोग किताबों के लिए अमेज़ॅन की दुकान करते हैं (उदाहरण के लिए), वे एक विशिष्ट प्रकार की किताबें खरीदते हैं, इसलिए एक ही प्रकार की अन्य पुस्तकों का सुझाव देना आसान हो सकता है।

फिल्मों के साथ, लोग एक ही काम कर सकते हैं, हालांकि लोग आमतौर पर खुद को एक शैली तक सीमित नहीं करते हैं। लोग फिल्मों की एक विस्तृत विविधता देख सकते हैं: डरावनी, कॉमेडी, एक्शन, रोमांस इत्यादि।

भविष्यवाणी करना कि आप उन शैलियों से क्या पसंद करते हैं, भविष्यवाणी करना मुश्किल हो सकता है कि आपने अभी तक एक फिल्म किराए पर ली है, और वह फिल्म एक नाटक है

अगर कोई बहुत चालाक अनुशंसा इंजन के साथ आना चाहता था, तो Netflix इससे काफी लाभ उठा सकता है। मुझे लगता है कि वे मुख्य रूप से ऐसे इंजन की तलाश में हैं जो केवल एक या 2 फिल्मों के आधार पर चीजों की सिफारिश कर सके। नेटफ्लिक्स के बारे में ज्यादा जानकारी नहीं रखने वाले नए ग्राहकों के पास चारों ओर चिपकने का बेहतर मौका होता है, अगर उन्हें उन फिल्मों को ढूंढें जो उन्हें पसंद नहीं करते हैं।

मेरी राय में, उनके पास पहले से ही अमेज़ॅन के साथ एक अनुशंसा इंजन है। मुझे लगता है कि वे इसे और बढ़ाने के लिए देख रहे हैं।

1

मुझे और मेरे सहयोगी ने इसमें भाग लिया। मेरे पास मजबूत एआई पृष्ठभूमि नहीं है, लेकिन सिफारिश इंजनों को गिब्स नमूनाकरण, के विधि, निकटतम पड़ोसी इत्यादि जैसे मौजूदा साहित्य एल्गोरिदम के कुछ गहरे ज्ञान की आवश्यकता होती है। हमने गीब्स नमूनाकरण का उपयोग किया और मैं कह सकता हूं कि हमने चूसा है :) नेटफ्लिक्स के पहले से ही क्या है।

29

Recommender सिस्टम समस्याओं को ठीक करने के लिए कड़ी मेहनत कर रहे हैं से ग्रस्त हैं:

  • Cold start - एक नई प्रणाली में या एक नया उपयोगकर्ता के साथ, वहाँ के लिए पर्याप्त डेटा एक सिफारिश के लिए एक सटीक सांख्यिकीय मॉडल बनाने के लिए नहीं है।
  • Rating bias - यदि आप उपयोगकर्ता रेटिंग पर अनुशंसा करते हैं, तो उपयोगकर्ता जो अक्सर अपने स्वाद की ओर परिणाम निकालते हैं। यदि आप ऐसे व्यक्ति हैं जो रेटिंग के अतिरिक्त चरण को पसंद नहीं करते हैं, तो संभव है कि समान स्वाद वाले लोगों को रेटिंग पसंद न हो, इसलिए उनकी राय अनुशंसाओं से बाहर है।
  • रेट किए गए आइटम रेट किए जाने की संभावना कम हैं - यदि आप चुनते हैं, और इसलिए रेट करते हैं, तो उनकी रेटिंग के आधार पर आइटम, रेट किए गए आइटम कम दिखाई नहीं दे रहे हैं और उन्हें आवश्यक रेटिंग प्राप्त करने में कठिनाई होगी सिफारिशों को प्रभावित करें। दूसरी दिशा में, लोकप्रिय वस्तुओं में अधिक दृश्यता होती है, जिन्हें अधिक बार रेट किया जाता है, और इसलिए सिफारिशों में एक बड़ा हिस्सा खेलते हैं।
  • Temporal bias - उपयोगकर्ता की रेटिंग समय के साथ बदलती है। दीर्घकालिक परिवर्तनों के साथ, आप अपनी सिफारिशों में समय तत्व जोड़कर क्षतिपूर्ति कर सकते हैं। शॉर्ट-टर्म परिवर्तन को ठीक करना कठिन होता है।Chuck Norris मैराथन के बाद, आप एक्शन मूवीज़ उच्च अंक देने की अधिक संभावना रखते हैं। अगले दिन, Steel Magnolias पर अपनी आंखें रोने के बाद, आप अस्थायी रूप से एक्शन मूवीज़ के खिलाफ पक्षपातपूर्ण हो सकते हैं।
  • item-based recommender systems में, आपके द्वारा चाची के जन्मदिन के लिए खरीदी गई बुनाई पुस्तक आपकी सिफारिशों को छोड़ देगी (यदि आप सिस्टम को इसका उपयोग न करने के लिए समय नहीं लेते हैं)। आप एक बुरे बच्चों की फिल्म को उच्च रेटिंग दे सकते हैं क्योंकि आपके बच्चे इसे पसंद करते थे।

सभी एक साथ, यह सिफारिशकर्ता प्रणाली को ठीक-ठीक सुधारने के लिए कठिन बनाता है। 80% सटीकता वाला एक सिस्टम बहुत अच्छा लगता है लेकिन 5 बार में से 1 गलत है। इससे उन्हें कुछ उपयोगकर्ताओं के लिए मूल्यवान होने की तुलना में अधिक परेशानी होती है।

+1

स्टैक ओवरफ़्लो के साथ संपूर्ण अनुशंसा-इंजन टैग में सबसे अच्छे उत्तरों में से एक। :) – isomorphismes

संबंधित मुद्दे