(मुझे लगता है कि यह एक ही सवाल तुम सिर्फ [email protected]? पर पूछा मेरा उत्तर प्रतिलिपि बनाई जा रही है।)
आप सब पर Hadoop की जरूरत नहीं है, और आप नहीं करते हैं, मैं सुझाव दूंगा कि आप सादगी के लिए इसका इस्तेमाल न करें। यह एक निश्चित बिंदु से पहले स्केल करने के लिए "आवश्यक बुराई" है।
आपके पास कैसंद्रा पर डेटा हो सकता है लेकिन आप इसे स्मृति में पढ़ने में सक्षम होना चाहेंगे। यदि आप फ़ाइल के रूप में डंप कर सकते हैं, तो आप FileDataModel का उपयोग कर सकते हैं। या, आप Cassandra पर आधारित एक बनाने के लिए FileDataModel में कोड अनुकरण कर सकते हैं।
फिर, अपने दो जरूरतों को आसानी से उत्तर दिया जाता है:
यह भी एक सिफारिश समस्या नहीं है। उपयोगकर्ता की समानता के को कार्यान्वित करें, और इसे पर किसी अन्य उपयोगकर्ता से तुलना करें, और उच्चतम समानता वाले लोगों को चुनें। ( CachingUserSimilarity साथ रैपिंग एक बहुत मदद मिलेगी।)
यह सिर्फ एक recommender समस्या है। जेनेरिक यूसर आधारित रीकैमेन्डर के साथ अपने उपयोगकर्ता समरूपता और डेटा मॉडल और आप कर चुके हैं।
यह निश्चित रूप से इससे अधिक जटिल हो सकता है, लेकिन यह एक अच्छा प्रारंभ बिंदु है।
यदि बाद में आप हडोप का उपयोग करते हैं, तो आपको इसके निर्देशों के अनुसार हडोप स्थापित करना होगा। कोई महाउट "सेटअप" नहीं है। अनुशंसाओं के लिए, आप एक सिफारिशकर्ता जोब कक्षाओं में से एक देखेंगे जो आपके हडोप क्लस्टर पर आवश्यक नौकरियों का आह्वान करता है। आप इसे "हडूप" कमांड के साथ चलाएंगे - फिर, यह वह जगह है जहां आपको हडोप को समझना होगा।
पुस्तक Mahout in Action पुस्तक में कुछ विस्तार से महाउट हडोप नौकरियां लिखती हैं।
स्रोत
2011-01-13 11:01:55