बस recent article in Wired पढ़ने के बाद, मैं उत्सुक हूं: Netflix पुरस्कार के बारे में क्या है जो इतना चुनौतीपूर्ण है? मेरा मतलब है कि यह सबसे गंभीर तरीके से संभव है, मैं सिर्फ प्रतियोगिता से उत्पन्न कठिनाइयों के बारे में उत्सुक हूं। क्या सामान्य रूप से अधिकतर सिफारिश इंजनों में सुधार करना मुश्किल है? यदि हां, तो वह क्यों है? या, Netflix को सुधारने में असामान्य रूप से मुश्किल है, और यदि ऐसा है, तो Netflix के बारे में विशेष क्या है जो अमेज़ॅन कहने से कहीं अधिक चुनौतीपूर्ण बनाता है?नेटफ्लिक्स पुरस्कार इतना चुनौतीपूर्ण क्यों है?
उत्तर
क्योंकि नेटफ्लिक्स में पहले से ही वास्तव में एक अच्छा अनुशंसा इंजन है। अगर वे जानते थे कि इसे आसानी से कैसे सुधारना है, तो वे अब तक ऐसा कर सकते थे। उनका पूरा व्यापार मॉडल उपभोक्ताओं को क्रॉस सेलिंग उत्पादों (फिल्मों) के आसपास है। अनुशंसा एल्गोरिदम वास्तव में उनके व्यापार का मूल है। यह बेहतर काम करता है, जितना पैसा वे बनाने के लिए खड़े हैं।
खैर ... भारी सस्ती सूची, लंबी पूंछ, (विश्वसनीय) सदस्यता राजस्व, और ग्राहकों की संख्या तक पहुंचने के लिए नेट की शक्ति भी उनके व्यावसायिक मॉडल के लिए बहुत महत्वपूर्ण है। – isomorphismes
मुझे लगता है कि इस पर कुछ लेख लिखे गए हैं, लेकिन मुझे नहीं पता कि वे इस समय कहां हैं, इसलिए मैं इसे यहां समझाऊंगा।
जब लोग किताबों के लिए अमेज़ॅन की दुकान करते हैं (उदाहरण के लिए), वे एक विशिष्ट प्रकार की किताबें खरीदते हैं, इसलिए एक ही प्रकार की अन्य पुस्तकों का सुझाव देना आसान हो सकता है।
फिल्मों के साथ, लोग एक ही काम कर सकते हैं, हालांकि लोग आमतौर पर खुद को एक शैली तक सीमित नहीं करते हैं। लोग फिल्मों की एक विस्तृत विविधता देख सकते हैं: डरावनी, कॉमेडी, एक्शन, रोमांस इत्यादि।
भविष्यवाणी करना कि आप उन शैलियों से क्या पसंद करते हैं, भविष्यवाणी करना मुश्किल हो सकता है कि आपने अभी तक एक फिल्म किराए पर ली है, और वह फिल्म एक नाटक है
अगर कोई बहुत चालाक अनुशंसा इंजन के साथ आना चाहता था, तो Netflix इससे काफी लाभ उठा सकता है। मुझे लगता है कि वे मुख्य रूप से ऐसे इंजन की तलाश में हैं जो केवल एक या 2 फिल्मों के आधार पर चीजों की सिफारिश कर सके। नेटफ्लिक्स के बारे में ज्यादा जानकारी नहीं रखने वाले नए ग्राहकों के पास चारों ओर चिपकने का बेहतर मौका होता है, अगर उन्हें उन फिल्मों को ढूंढें जो उन्हें पसंद नहीं करते हैं।
मेरी राय में, उनके पास पहले से ही अमेज़ॅन के साथ एक अनुशंसा इंजन है। मुझे लगता है कि वे इसे और बढ़ाने के लिए देख रहे हैं।
मुझे और मेरे सहयोगी ने इसमें भाग लिया। मेरे पास मजबूत एआई पृष्ठभूमि नहीं है, लेकिन सिफारिश इंजनों को गिब्स नमूनाकरण, के विधि, निकटतम पड़ोसी इत्यादि जैसे मौजूदा साहित्य एल्गोरिदम के कुछ गहरे ज्ञान की आवश्यकता होती है। हमने गीब्स नमूनाकरण का उपयोग किया और मैं कह सकता हूं कि हमने चूसा है :) नेटफ्लिक्स के पहले से ही क्या है।
Recommender सिस्टम समस्याओं को ठीक करने के लिए कड़ी मेहनत कर रहे हैं से ग्रस्त हैं:
- Cold start - एक नई प्रणाली में या एक नया उपयोगकर्ता के साथ, वहाँ के लिए पर्याप्त डेटा एक सिफारिश के लिए एक सटीक सांख्यिकीय मॉडल बनाने के लिए नहीं है।
- Rating bias - यदि आप उपयोगकर्ता रेटिंग पर अनुशंसा करते हैं, तो उपयोगकर्ता जो अक्सर अपने स्वाद की ओर परिणाम निकालते हैं। यदि आप ऐसे व्यक्ति हैं जो रेटिंग के अतिरिक्त चरण को पसंद नहीं करते हैं, तो संभव है कि समान स्वाद वाले लोगों को रेटिंग पसंद न हो, इसलिए उनकी राय अनुशंसाओं से बाहर है।
- रेट किए गए आइटम रेट किए जाने की संभावना कम हैं - यदि आप चुनते हैं, और इसलिए रेट करते हैं, तो उनकी रेटिंग के आधार पर आइटम, रेट किए गए आइटम कम दिखाई नहीं दे रहे हैं और उन्हें आवश्यक रेटिंग प्राप्त करने में कठिनाई होगी सिफारिशों को प्रभावित करें। दूसरी दिशा में, लोकप्रिय वस्तुओं में अधिक दृश्यता होती है, जिन्हें अधिक बार रेट किया जाता है, और इसलिए सिफारिशों में एक बड़ा हिस्सा खेलते हैं।
- Temporal bias - उपयोगकर्ता की रेटिंग समय के साथ बदलती है। दीर्घकालिक परिवर्तनों के साथ, आप अपनी सिफारिशों में समय तत्व जोड़कर क्षतिपूर्ति कर सकते हैं। शॉर्ट-टर्म परिवर्तन को ठीक करना कठिन होता है।Chuck Norris मैराथन के बाद, आप एक्शन मूवीज़ उच्च अंक देने की अधिक संभावना रखते हैं। अगले दिन, Steel Magnolias पर अपनी आंखें रोने के बाद, आप अस्थायी रूप से एक्शन मूवीज़ के खिलाफ पक्षपातपूर्ण हो सकते हैं।
- item-based recommender systems में, आपके द्वारा चाची के जन्मदिन के लिए खरीदी गई बुनाई पुस्तक आपकी सिफारिशों को छोड़ देगी (यदि आप सिस्टम को इसका उपयोग न करने के लिए समय नहीं लेते हैं)। आप एक बुरे बच्चों की फिल्म को उच्च रेटिंग दे सकते हैं क्योंकि आपके बच्चे इसे पसंद करते थे।
सभी एक साथ, यह सिफारिशकर्ता प्रणाली को ठीक-ठीक सुधारने के लिए कठिन बनाता है। 80% सटीकता वाला एक सिस्टम बहुत अच्छा लगता है लेकिन 5 बार में से 1 गलत है। इससे उन्हें कुछ उपयोगकर्ताओं के लिए मूल्यवान होने की तुलना में अधिक परेशानी होती है।
स्टैक ओवरफ़्लो के साथ संपूर्ण अनुशंसा-इंजन टैग में सबसे अच्छे उत्तरों में से एक। :) – isomorphismes
- 1. हास्केल इतना बड़ा क्यों है?
- 2. टेस्टकंपलेट इतना धीमा क्यों है?
- 3. जीएलयूटी इतना बुरा क्यों है?
- 4. Thread.stop() इतना खतरनाक क्यों है
- 5. वालराय इतना धीमा क्यों है?
- 6. EXC_BAD_ACCESS इतना असहनीय क्यों है?
- 7. नेटफ्लिक्स/हूलू सिस्टम आर्किटेक्चर
- 8. $ (विंडो) क्यों है। हाइट() इतना गलत है?
- 9. मेरा डीबगर इतना धीमा क्यों है?
- 10. पापी का डेक इतना धीमा क्यों है?
- 11. ग्लासफ़िश व्यवस्थापक कंसोल इतना धीमा क्यों है?
- 12. मेरा एचजीवेब सर्वर इतना धीमा क्यों है?
- 13. SQL का आयात इतना धीमा क्यों है?
- 14. क्यों PyQt अनुप्रयोग स्टार्टअप इतना धीमा है?
- 15. लिंकर अनुकूलन इतना खराब क्यों है?
- 16. कंसोल आउटपुट इतना धीमा क्यों है?
- 17. मेरा मोंगोडब कॉल इतना धीमा क्यों है?
- 18. Wpf का DrawingContext.DrawText इतना महंगा क्यों है?
- 19. जीएचसी इतना बड़ा/बड़ा क्यों है?
- 20. array.map (String.fromCharCode) इतना धीमा क्यों है?
- 21. रुपये कैनवास इतना धीमा क्यों है?
- 22. रूबी स्कैनफ़ इतना धीमा क्यों है?
- 23. MySQL InnoDB इतना धीमा क्यों है?
- 24. यह असर गणना इतना क्यों है?
- 25. डी संकलन इतना लंबा क्यों लेता है?
- 26. आयरनपीथन स्टार्टअप समय इतना धीमा क्यों है?
- 27. यह jQuery चयनकर्ता इतना धीमा क्यों है?
- 28. एंड्रॉइड फोन सिम्युलेटर इतना धीमा क्यों है?
- 29. (क्यों) प्रतिबिंब इतना महंगा है .Net?
- 30. क्यों PyQt कनेक्ट() वाक्यविन्यास इतना verbose है?
यह SO पर क्यों है? बंद करे। –
@ लुकास यह एक प्रोग्रामिंग चुनौती और इसके तकनीकी विवरण के बारे में एक प्रश्न है, इसलिए यह प्रोग्रामिंग से संबंधित है। मुझे नहीं लगता कि यह * क्यों * पर नहीं होगा। –
क्यों नहीं? सिफारिश इंजन निश्चित रूप से प्रोग्रामिंग से संबंधित हैं। एसओ पर सबसे अच्छा सवाल नहीं हो सकता है, लेकिन फिर भी। – dmeister