2009-10-20 11 views
7

मैं एक सिफारिश प्रणाली बनाने के साथ खेलना चाहता हूं, और इसके द्वारा मेरा मतलब है एक एल्गोरिदम जो उपयोगकर्ता द्वारा पोस्ट की गई वरीयताओं और/या समीक्षाओं को देखता है और उसके बाद नेटफ्लिक्स या अमेज़ॅन उपयोग के समान, उनके लिए सिफारिशें करता है।मैं सिफारिश प्रणाली के बारे में कहां से सीख सकता हूं?

इस तरह कुछ लिखना सीखने के लिए कुछ अच्छे संसाधन क्या हैं? मुझे कहां से शुरू करना चाहिए?

उत्तर

5

Netflix Prize और उसके discussion forum पर विकिपीडिया पृष्ठ देखें। इसके अलावा, कुछ हद तक संबंधित 2009 GitHub Contest विभिन्न स्रोत इंजनों पर पूर्ण स्रोत कोड के लिए एक अच्छा स्रोत है। और जाहिर है Wikipedia page on the topic itself भी है, जिसमें कुछ सभ्य लिंक हैं।

यदि आप अपना खुद लिखना शुरू करते हैं, तो आप एक कॉर्पस का उपयोग करना चाहेंगे। मैं वास्तव में Netflix Prize's data set का उपयोग करने की सलाह देता हूं। बस डेटा को दो टुकड़ों में सेट करें। पहले टुकड़े पर ट्रेन करें और दूसरे टुकड़े पर अपना एल्गोरिदम स्कोर करें।

अनुशेष:, किसी उपयोगकर्ता के लिंग, आयु, घरेलू आय, बुद्धि, यौन अभिविन्यास आदि तुम शायद Netflix पुरस्कार से इन विशेषताओं के सबसे कर सकता है: बात की इस तरह की एक कुछ हद तक संबंधित और डरावना आवेदन predicting demographic information है सटीकता की काफी उच्च डिग्री वाले डेटासेट। सौभाग्य से everyone in that dataset is just a number

+0

इसके बारे में क्या डरावना है? विपणक आपके ब्राउज़र, आईपी और HTTP शीर्षलेख से अन्य जानकारी के आधार पर आपको हर समय पूर्वानुमानित करने का प्रयास करते हैं। यह वास्तविक जानकारी नहीं है, बस "सूचित रूढ़िवादी" (सशर्त बेयस)। – isomorphismes

+1

क्योंकि डेटा को 'अज्ञात' के रूप में दर्शाया गया था लेकिन वास्तव में नहीं था? यह विशेष रूप से खराब है यदि उपयोगकर्ता ने कभी भी अपने डेटा को साझा नहीं किया है। –

+0

मुझे समझ में नहीं आता कि आपका क्या मतलब है। क्या आप कह रहे हैं कि गुमनाम का उल्लंघन किया गया था क्योंकि मैं उपयोगकर्ता 2871875 की जनसांख्यिकीय विशेषताओं का सटीक अनुमान लगा सकता हूं? – isomorphismes

3

pysuggest पर एक पायथन लाइब्रेरी देखें जो collaborative filtering (जिसे Amazon.com द्वारा उपयोग किया जाता है) के लिए विभिन्न अनुशंसा एल्गोरिदम लागू करता है।

संबंधित मुद्दे

 संबंधित मुद्दे