2010-01-02 7 views
5

मुझे उत्सुकता है कि "ठंड शुरूआत" समस्या को दूर करने के तरीकों/दृष्टिकोण क्या हैं, जहां इस नए इकाई के बारे में जानकारी की कमी के कारण, जब कोई नया उपयोगकर्ता या कोई आइटम सिस्टम में प्रवेश करता है, तो सिफारिश करना एक समस्या है।मैं अपने अनुशंसा इंजन को ठंडा शुरू करने के लिए कैसे अनुकूलित करूं?

मैं कुछ भविष्यवाणी आधारित सिफारिश (जैसे लिंग, राष्ट्रीयता और इसी तरह) करने के बारे में सोच सकता हूं।

उत्तर

6

शायद कई बार आपको सिफारिश नहीं करनी चाहिए? "अपर्याप्त डेटा" उन समयों में से एक के रूप में योग्य होना चाहिए।

मुझे नहीं लगता कि "लिंग, राष्ट्रीयता और इसी तरह" पर आधारित भविष्यवाणी की सिफारिशें स्टीरियोटाइपिंग से अधिक की राशि होगी।

आईआईआरसी, अमेज़ॅन जैसे स्थानों ने सिफारिशों को शुरू करने से पहले कुछ समय के लिए अपने डेटाबेस बनाए। यह ऐसी चीज नहीं है जिसे आप गलत करना चाहते हैं; अपर्याप्त डेटा के आधार पर अनुचित अनुशंसाओं के बारे में कई कहानियां हैं।

1

यह कई बार पहले पूछा गया है (स्वाभाविक रूप से, मुझे अब उन प्रश्नों को नहीं मिल रहा है:/लेकिन सामान्य निष्कर्ष यह सिफारिशों से बचने के लिए बेहतर था। Worls के विभिन्न हिस्सों में समान नाम अलग-अलग लिंगों से संबंधित हैं, और इसलिए पर ...

0

सिफारिशों के आधार पर "समान उपयोगकर्ताओं पसंद आया ..." स्पष्ट रूप से प्रतीक्षा करनी होगी। आप बाहर कूपन या अन्य प्रोत्साहन सर्वेक्षण उत्तरदाताओं अगर आप पूरी तरह से उपयोगकर्ता समानता के आधार पर भविष्यवाणियों कर के लिए प्रतिबद्ध हैं दे सकते हैं।

एक सिफारिश इंजन को ठंडा करने के दो अन्य तरीके हैं।

  1. अपने आप को एक मॉडल बनाएं।
  2. अपने आपूर्तिकर्ताओं को एक कंकाल मॉडल में महत्वपूर्ण जानकारी भरने के लिए प्राप्त करें। (इसके अलावा $ प्रोत्साहन की आवश्यकता हो सकती है।)

इन सभी में संभावित नुकसान के बहुत सारे, जो उल्लेख करने के लिए बहुत आम हैं।

जैसा कि आप उम्मीद कर सकते हैं, यहां कोई निःशुल्क भोजन नहीं है। लेकिन इस बारे में इस बारे में सोचें: सिफारिश इंजन एक व्यापार योजना नहीं है। वे केवल व्यापार योजना को बढ़ाते हैं।

22

आप ठंड एक सिफारिश प्रणाली शुरू कर सकते हैं।

दो प्रकार की सिफारिश प्रणाली हैं; सहयोगी फ़िल्टरिंग और सामग्री आधारित। सामग्री आधारित सिस्टम उन चीजों के बारे में मेटा डेटा का उपयोग करते हैं जिन्हें आप अनुशंसा कर रहे हैं। सवाल यह है कि मेटा डेटा क्या महत्वपूर्ण है? दूसरा दृष्टिकोण सहयोगी फ़िल्टरिंग है जो मेटा डेटा की परवाह नहीं करता है, यह सिर्फ एक आइटम के बारे में सिफारिश करने के लिए लोगों ने क्या किया या कहा है। सहयोगी फ़िल्टरिंग के साथ आपको चिंता करने की ज़रूरत नहीं है कि मेटा डेटा में कौन सी शर्तें महत्वपूर्ण हैं। वास्तव में आपको सिफारिश करने के लिए किसी भी मेटा डेटा की आवश्यकता नहीं है। सहयोगी फ़िल्टरिंग के साथ समस्या यह है कि आपको डेटा चाहिए। आपके पास पर्याप्त डेटा होने से पहले आप सामग्री-आधारित अनुशंसाओं का उपयोग कर सकते हैं। आप दोनों विधियों पर आधारित अनुशंसाएं प्रदान कर सकते हैं, और शुरुआत में 100% सामग्री-आधारित है, फिर जब आप सहयोगी फ़िल्टरिंग के आधार पर अधिक डेटा प्राप्त करना शुरू करते हैं। वह विधि है जिसे मैंने अतीत में उपयोग किया है।

एक और आम तकनीक सामग्री आधारित हिस्से को एक साधारण खोज समस्या के रूप में पेश करना है। आपने मेटा डेटा को अपने दस्तावेज़ के टेक्स्ट या बॉडी के रूप में रखा है, फिर अपने दस्तावेज़ों को इंडेक्स करें। आप इसे ल्यूसीन & सोलर के साथ कोई कोड लिखने के बिना कर सकते हैं।

आप कैसे बुनियादी सहयोगी फ़िल्टर कार्यप्रणाली को पता है, टोबी Segaran

+2

यह सबसे अच्छा जवाब है और वास्तव में चेक मार्क का हकदार है। मैं जोड़ूंगा कि बैंडिट एल्गोरिदम नए उत्पादों के लिए बेसलाइन दरों की खोज करने या सामग्री आधारित और सहयोगी दृष्टिकोण के बीच व्यापार को निर्धारित करने में भूमिका निभा सकता है। – SetJmp

2

द्वारा की "कलेक्टिव खुफिया प्रोग्रामिंग" अध्याय 2 की जाँच इस समस्या को अपने आप पर कार्य करना चाहते हैं, लेकिन बोल्ट्जमान मशीनों पर माइक्रोसॉफ्ट से इस पत्र सार्थक दिखाई देता है: http://research.microsoft.com/pubs/81783/gunawardana09__unified_approac_build_hybrid_recom_system.pdf

0

तीन चीज़ें शीत-प्रारंभ समस्या का समाधान करने के लिए आवश्यक हैं:

  1. डेटा इस तरह के प्रोफाइल गया होगा अपना उत्पाद डेटा वें के साथ कई अलग अलग विशेषताएं हैं कि ('फीचर' के लिए इस्तेमाल किया जाने वाला ई शब्द अक्सर 'वर्गीकरण पहलू' होता है)। यदि आप दरवाजे में डेटा के रूप में सही ढंग से प्रोफ़ाइल नहीं करते हैं, तो आपका अनुशंसा इंजन 'ठंडा' रहेगा क्योंकि इसमें कुछ भी नहीं है जिसके साथ सिफारिशों को वर्गीकृत किया जा सके।

  2. सबसे महत्वपूर्ण: आपको एक उपयोगकर्ता-फीडबैक लूप की आवश्यकता है जिसके साथ उपयोगकर्ता वैयक्तिकरण इंजन के सुझावों की सिफारिशों की समीक्षा कर सकते हैं। उदाहरण के लिए, 'क्या यह सुझाव सहायक था' के लिए हां/नहीं बटन एक प्रशिक्षण डेटासेट (यानी 'अनुशंसा' प्रशिक्षण डेटासेट) में प्रतिभागियों की एक समीक्षा को अन्य प्रशिक्षण डेटासेट में कतारबद्ध करना चाहिए (यानी प्रशिक्षण डेटासेट की सिफारिश न करें)।

  3. मॉडल (अनुशंसित/अनुशंसा नहीं) सुझावों के लिए उपयोग किए जाने वाले मॉडल को कभी भी एक आकार-फिट-सभी सिफारिशों के रूप में नहीं माना जाना चाहिए। किसी ग्राहक को सुझाव देने के लिए उत्पाद या सेवा को वर्गीकृत करने के अलावा, फर्म प्रत्येक विशिष्ट ग्राहक मामलों को कैसे वर्गीकृत करती है। यदि सही तरीके से काम कर रहा है, तो किसी को यह उम्मीद करनी चाहिए कि अलग-अलग सुविधाओं वाले ग्राहकों को किसी दिए गए परिस्थिति में (अनुशंसा/सिफारिश न करें) के लिए अलग-अलग सुझाव मिलेंगे। यह निजीकरण इंजन का 'निजीकरण' हिस्सा होगा।

संबंधित मुद्दे