2009-08-12 18 views
41

मैं एक परियोजना शुरू करने के बारे में सोच रहा हूं जो सिफारिश प्रणाली पर आधारित है। मुझे इस क्षेत्र में खुद को सुधारने की जरूरत है जो वेब तरफ एक गर्म विषय जैसा दिखता है। यह भी सोचते हुए कि एल्गोरिदम lastfm, grooveshark, pandora उनकी सिफारिश प्रणाली के लिए उपयोग कर रहा है। यदि आप इस तरह के एल्गोरिदम के लिए कोई पुस्तक, साइट या कोई संसाधन जानते हैं तो कृपया सूचित करें।last.fm, grooveshark, pandora जैसी सिफारिश साइटों के पीछे एल्गोरिदम क्या है?

उत्तर

-2

पेंडोरस एल्गोरिदम ने आपके द्वारा इनपुट किए गए कुछ निश्चित गीतों के लिए विशिष्ट संगीत शैलियों से मिलान करना शुरू किया। फिर यह लोगों द्वारा वोटिंग या नापसंद करने के लिए लोगों को धीरे-धीरे बढ़ रहा है, जिससे वे खराब गीतों को खत्म कर सकते हैं और अच्छे गाने को सामने ला सकते हैं। यह उन नए गानों को भी छीन लेगा जिनके पास आपके गीत प्लेलिस्ट में कुछ वोट हैं या नीचे हैं ताकि गीत कुछ वोट प्राप्त कर सके।

सूचीबद्ध अन्य साइटों के बारे में निश्चित नहीं है।

+2

यह उससे थोड़ा अधिक जटिल है। http://www.pandora.com/corporate/mgp – Brad

6

Mapping and visualizing music collections पर स्पष्टीकरण (और लेखक की थीसिस के लिए एक लिंक) के साथ एक अच्छा डेमो वीडियो है। यह दृष्टिकोण संगीत की विशेषताओं का विश्लेषण करने से संबंधित है। नेटफ्लिक्स और अमेज़ॅन जैसी अन्य विधियां, समान स्वाद के साथ-साथ मूल श्रेणी फ़िल्टरिंग वाले अन्य उपयोगकर्ताओं की सिफारिशों पर भरोसा करती हैं।

4

येहुदा कोरेन (जिस टीम ने नेटफ्लिक्स पुरस्कार जीता था) पर ग्रेट पेपर: नेटफ्लिक्स ग्रैंड पुरस्कार (Google "GrandPrize2009_BPC_BellKor.pdf") के बेलकोर समाधान।

युगल वेबसाइटों:

21

एक फैशनेबल देर प्रतिक्रिया: भानुमती और Grooveshark एल्गोरिथ्म वे उपयोग में बहुत अलग हैं।

मूल रूप से सिफारिश प्रणाली के लिए दो प्रमुख दृष्टिकोण हैं - 1. सहयोगी फ़िल्टरिंग, और 2. सामग्री आधारित। (और हाइब्रिड सिस्टम)

अधिकांश सिस्टम सहयोगी फ़िल्टरिंग पर आधारित होते हैं। इसका मूल रूप से वरीयताओं की मिलान सूची है): यदि मुझे आइटम ए, बी, सी, डी, ई और एफ पसंद आया, और कई अन्य उपयोगकर्ताओं को ए, बी, सी, डी, ई, एफ और जे पसंद आया - यह सिस्टम जे को अनुशंसा करेगा मैं इस तथ्य के आधार पर कि मैं इन उपयोगकर्ताओं के साथ एक ही स्वाद साझा करता हूं (यह इतना आसान नहीं है लेकिन यह विचार है)। यहां विश्लेषण की जाने वाली मुख्य विशेषताएं आइटम आईडी हैं और उपयोगकर्ता इन वस्तुओं के बारे में वोट देते हैं।

सामग्री आधारित विधि हाथों की सामग्री का विश्लेषण करती है और मेरी पसंद की वस्तुओं की सामग्री के आधार पर मेरी प्रोफ़ाइल का निर्माण करती है और अन्य उपयोगकर्ताओं के आधार पर नहीं।

ऐसा करने के बाद - ग्रोवेशर्क सहयोगी फ़िल्टरिंग पर आधारित है पेंडोरा सामग्री आधारित है (शायद शीर्ष पर कुछ सहयोगी फ़िल्टरिंग परत के साथ)।

पेंडोरा के बारे में दिलचस्प बात यह है कि सामग्री का विश्लेषण मनुष्यों (संगीतकारों) द्वारा किया जाता है और स्वचालित रूप से नहीं। वे इसे संगीत जीनोम प्रोजेक्ट (http://www.pandora.com/mgp.shtml) कहते हैं, जहां एनोटेटर प्रत्येक गीत को संरचना, लय, tonality, रिकॉर्डिंग तकनीक और कुछ (जैसे पूर्ण सूची: http://en.wikipedia.org/wiki/List_of_Music_Genome_Project_attributes) पर कुछ लेबलों के साथ टैग करते हैं, यही उन्हें विकल्प देता है अनुशंसित गीत को समझाने और औचित्य देने के लिए।

2
  • Last.fm "पड़ोसियों" शायद सहयोगी फ़िल्टरिंग है।
  • पेंडोरा ने सैकड़ों संगीतकारों को ~ 500 आयामों के साथ गानों को वर्गीकृत करने के लिए काम पर रखा। http://en.wikipedia.org/wiki/Music_Genome_Project

ये दो बहुत अलग दृष्टिकोण हैं। जहां तक ​​साहित्य जाता है, Google विद्वान आपका मित्र है।

संबंधित मुद्दे