8

मैं परिवार के सदस्यों के आधार पर एचटीपीसी में फिल्मों को वर्गीकृत करने के लिए एक ऐप लिखने की सोच रहा हूं।एल्गोरिदम अन्य उपयोगकर्ताओं को पसंद करने के लिए एल्गोरिदम को पसंद करते हैं

मुझे आंकड़े या एआई नहीं पता, लेकिन सामान here बहुत रसदार दिखता है। मुझे नहीं पता कि कहां से शुरू करना है।

यहाँ है कि मैं क्या करना चाहते है:

  1. प्रत्येक उपयोगकर्ताओं से नमूने का एक सेट लिखें, पसंद करती रेटिंग प्रत्येक नमूने अलग से जोड़कर देखते हैं। उदाहरण के लिए, शायद उपयोगकर्ता को पश्चिमी फिल्मों को बहुत पसंद है, इसलिए पश्चिमी शैली में उस उपयोगकर्ता के लिए थोड़ा अधिक भार होगा (और अन्य विशेषताओं जैसे कि अभिनेता, निर्देशक इत्यादि) के लिए।

  2. एक उपयोगकर्ता अन्य उपयोगकर्ताओं की पसंद के आधार पर सुझाव प्राप्त कर सकता है। उदाहरण के लिए, यदि उपयोगकर्ता ए और बी दोनों स्पिलबर्ग (उपयोगकर्ताओं के बीच कनेक्शन) की तरह हैं, और उपयोगकर्ता बी बैटमैन शुरुआत से प्यार करता है, लेकिन उपयोगकर्ता ए लेटेस केटी होम्स, वीडियो ए के अनुसार फिल्म का वजन करता है (उदाहरण के लिए, प्रत्येक विशेषता अलग से, उदाहरण के लिए, शायद उपयोगकर्ता ए को एक्शन मूवीज़ बहुत पसंद नहीं है, इसलिए रेटिंग को थोड़ा नीचे लाएं, और चूंकि केटी होम्स मुख्य सितारा नहीं है, इसलिए इसे अन्य विशेषताओं के रूप में ध्यान में न लें)।

मूल रूप से, उपयोगकर्ता उपयोगकर्ता बी से सेट करने के लिए इसी तरह की एक से सेट की तुलना, और उपयोगकर्ता ए के लिए रेटिंग के साथ आने

मैं कैसे इस को लागू करने के बारे में कच्चे विचार है, लेकिन मैं कर रहा हूँ कुछ उज्ज्वल दिमाग पहले से ही एक बेहतर समाधान के बारे में पहले से ही सोचा है, तो ... कोई सुझाव?

असल में, एक त्वरित शोध के बाद, ऐसा लगता है कि एक बेयसियन फ़िल्टर काम करेगा। यदि हां, तो क्या यह बेहतर दृष्टिकोण होगा? क्या यह मूवी डेटा को "सामान्यीकृत" करने के समान सरल होगा, प्रत्येक उपयोगकर्ता के लिए क्लासिफायरफायर प्रशिक्षण देगा, और फिर प्रत्येक मूवी को वर्गीकृत करेगा?

यदि आपके सुझाव में कुछ मस्तिष्क पिघलने की अवधारणाएं शामिल हैं (मुझे इन विषयों में विशेष रूप से एआई में अनुभव नहीं होता है), तो मैं इसकी सराहना करता हूं यदि आपने मांसपेशियों में गोता लगाने से पहले शोध करने के लिए कुछ मूलभूत बातें भी शामिल की हैं सामान।

धन्यवाद!

ARTMAP: समूहों

+1

डुप्लिकेट http://stackoverflow.com/questions/626220/how-do-recommendation-systems-work – cletus

+0

संदर्भ के लिए धन्यवाद। मैं अपने उदाहरणों के आधार पर एक और विशिष्ट उत्तर की तलाश में हूं। हालांकि, मैं सिफारिश प्रणाली के बारे में सब कुछ पढ़ना दिलचस्प होगा, मैं पहले सही दिशा में आगे बढ़ना पसंद करूंगा :) – Ivan

उत्तर

2

कुछ एल्गोरिदम है कि इस के लिए अच्छे हैं कर रहे हैं पर कुछ दिलचस्प लेख था एक दूसरे के खिलाफ संभावना के माध्यम से (यह तेज़ नहीं है लेकिन आपकी समस्या आईएमओ के लिए यह सबसे अच्छी बात है)

एआरटीएमएपी में सामान्य गुणों का एक समूह है और प्रतिशत के माध्यम से समानता की संभावना निर्धारित करता है। ARTMAP

KMeans: यह बाहर अलग दूरी के अनुसार वैक्टर कि वे एक दूसरे KMeans: Wikipedia

पीसीए से कर रहे हैं: varing बिट्स से सभी मानों का औसत अलग होगा।यह वही है जो आप चेहरे का पता लगाने, और कंप्यूटर विजन में पृष्ठभूमि घटाव करने के लिए उपयोग करेंगे। PCA

+0

धन्यवाद। एआरटीएमएपी के बारे में पढ़ने पर, यह एक अच्छे उम्मीदवार की तरह लगता है। चूंकि मैं वैज्ञानिक कागजात से बेहतर कोड समझता हूं, इसलिए मुझे यह http://users.visualserver.org/xhudik/art/doc/index.html मिला और इस http: // stackoverflow को जन्म दिया।कॉम/प्रश्न/160 9 2 9 6/आर्टमैप-अनुकूली-अनुनाद-सिद्धांत-कार्यान्वयन-मूल बातें ... केमैन भी दिलचस्प लगते हैं, लेकिन एक समय में एक :) :) – Ivan

+0

इस पुस्तक में वास्तव में एक आसान परिचय ट्यूटोरियल onit है ... http: // www .amazon.com/एआई-एप्लिकेशन-प्रोग्रामिंग-टिम-जोन्स/डीपी/158450278 9 हालांकि, आईआरसी संभावना है कि एफएन में इसकी कोई त्रुटि है। – monksy

4
+0

वहां कुछ बहुत ही रोचक चीजें हैं, साथ ही कुछ पढ़ने की सिफारिशें भी मैं अनुसरण करने जा रहा हूं। आपका बहुत बहुत धन्यवाद! – Ivan

2

के-निकटतम पड़ोसी एल्गोरिदम आपकी गली को सही कर सकता है।

+0

वह मेरे लिए कोशिश करने और लागू करने के लिए मेरे लिए काफी आसान लग रहा है। एक अच्छा सीखने संसाधन, धन्यवाद! – Ivan

4

यह this question जैसा है जहां ओपी एक सिफारिश प्रणाली बनाना चाहता था। संक्षेप में, हमें प्रशिक्षण डेटा का एक सेट दिया जाता है जिसमें फिल्मों के लिए उपयोगकर्ता रेटिंग (उदाहरण के लिए 1-5 स्टार रेटिंग) और प्रत्येक मूवी (वर्ष, शैली, अभिनेता, ..) के लिए विशेषताओं का एक सेट शामिल है। हम एक सिफारिशकर्ता बनाना चाहते हैं ताकि यह अदृश्य फिल्मों के लिए एक संभावित रेटिंग आउटपुट कर सके।

user movie year genre ... | rating 
--------------------------------------------- 
    1 1  2006 action   | 5 
    3 2  2008 drama   | 3.5 
    ... 

और एक रेटिंग रहित फिल्म एक्स के लिए:: तो inpt डेटा की तरह लग रहा

10 20  2009 drama ? 

हम रेटिंग भविष्यवाणी करने के लिए चाहते हैं। यह सभी अदृश्य फिल्मों के लिए ऐसा करना, फिर अनुमानित फिल्म रेटिंग द्वारा क्रमबद्ध करना और शीर्ष 10 को आउटपुट करने से आपको एक सिफारिश प्रणाली मिलती है।

सबसे आसान तरीका k-nearest neighbor एल्गोरिदम का उपयोग करना है। रेटेड फिल्मों में से, फिल्म एक्स के लिए "निकटतम" लोगों की खोज करें, और भविष्यवाणी करने के लिए अपनी रेटिंग को गठबंधन करें। इस दृष्टिकोण से स्क्रैच से आसान कार्यान्वयन के लिए बहुत आसान होने का लाभ है।

अन्य परिष्कृत दृष्टिकोण मौजूद हैं। उदाहरण के लिए आप decision tree बना सकते हैं, प्रशिक्षण डेटा पर नियमों का एक सेट फिट कर सकते हैं। आप कई अन्य लोगों के बीच Bayesian networks, artificial neural networks, support vector machines का भी उपयोग कर सकते हैं ... इनमें से प्रत्येक के माध्यम से उचित पृष्ठभूमि के बिना किसी के लिए आसान नहीं होना चाहिए। फिर भी मुझे उम्मीद है कि आप बाहरी टूल/लाइब्रेरी का उपयोग करेंगे। अब आप बेयसियन नेटवर्क से परिचित प्रतीत होते हैं, इसलिए एक साधारण बेवकूफ बेय नेट, वास्तव में बहुत शक्तिशाली हो सकता है। एक फायदा यह है कि यह लापता डेटा के तहत भविष्यवाणी की अनुमति देता है।

मुख्य विचार कुछ हद तक समान होगा; आपके पास इनपुट डेटा लेना, मॉडल को प्रशिक्षित करना, फिर नए उदाहरणों की कक्षा की भविष्यवाणी करने के लिए इसका उपयोग करें।

आप सरल सहज ज्ञान युक्त पैकेज जो कोई प्रोग्रामिंग की आवश्यकता में विभिन्न एल्गोरिदम के साथ चारों ओर खेलने के लिए चाहते हैं, तो मैं तुम्हें Weka (मेरी 1 पसंद), Orange, या RapidMiner पर एक नज़र डालें सुझाव देते हैं। आवश्यक प्रारूप में डेटासेट तैयार करना सबसे कठिन हिस्सा होगा। बाकी एल्गोरिदम चुनने और इसे लागू करने के रूप में आसान है (सभी क्लिक में!)

मुझे लगता है कि किसी के लिए बहुत अधिक विवरण नहीं जाना है, मैं निकटतम पड़ोसी विधि के साथ जाने की अनुशंसा करता हूं क्योंकि यह सहज है और कार्यान्वित करने में आसान .. फिर भी का उपयोग करने का विकल्प वीका (या अन्य टूल्स में से एक) देखने योग्य है।

+0

बहुत बढ़िया जवाब, धन्यवाद। मैं इस सप्ताह के अंत में वेका में गोता लगाने जा रहा हूं और देख रहा हूं कि मैं किसके साथ आया हूं। – Ivan

संबंधित मुद्दे