6

मैंने पर को पर पाया है जो Mllib का उपयोग करता है। 1-5 की रेटिंग के साथ डेटासेट का उपयोग करते समय (मैंने मूवीलेन्स डेटासेट का उपयोग किया है) यह 5 से अधिक की अनुमानित रेटिंग के साथ सिफारिशें देता है! मेरे छोटे परीक्षण में जो उच्चतम मिला है वह 7.4 है। जाहिर है, मैं या तो गलत समझ रहा हूं कि कोड क्या करना है, या कुछ ख़राब हो गया है। मैंने लेटेंट फैक्टर अनुशंसा प्रणाली में शोध किया है और इस धारणा के तहत था कि स्पार्क एमएलआईबी एएलएस कार्यान्वयन this one पर आधारित था।अपाचे स्पार्क एएलएस सिफारिश

यह क्या संभव है की तुलना में अधिक रेटिंग्स क्यों वापसी होगी? इसका कोई मतलब नही बनता।

मैं एल्गोरिथ्म गलत समझा या कार्यक्रम त्रुटिपूर्ण है?

उत्तर

9

आप सही कागज पर देख रहे हैं, लेकिन, मुझे लगता है कि आप एल्गोरिथ्म उम्मीद कर रहे हैं कुछ ऐसा करने का इरादा नहीं है क्या करना है। यह आपके इनपुट में दो मैट्रिक्स के उत्पाद के रूप में कम रैंक अनुमान का उत्पादन कर रहा है, लेकिन मैट्रिस को गुणा करने के बारे में कुछ भी आउटपुट मानों को क्लैंप नहीं करता है।

आप क्लैंप, या मूल्यों दौर कर सकते हैं। आप इसे नहीं चाहते हैं क्योंकि आपको अनुमानित रेटिंग 5 से 5 से अधिक मजबूत होने के बारे में अतिरिक्त जानकारी मिल रही है। मुझे लगता है कि यह एल्गोरिदम के लिए तकनीकी रूप से संभव नहीं है कि अधिकतम संभव मूल्य इनपुट में अधिकतम मनाया गया मान है।

+0

महान जबाब, शॉन के लिए धन्यवाद। हालांकि, यह एक और सवाल उठाता है। इस तरह के एल्गोरिदम के लिए रूट मीन स्क्वायर त्रुटि (आरएमएसई) की गणना कैसे की जाती है? यह मेरी समझ यह थी कि एल्गोरिथ्म के उद्देश्य, जाना जाता डेटा पर RMSE कम करने के लिए फिर अगर एल्गोरिथ्म "की तरह की तरह के लिए" वापस नहीं करता है परिणाम (जैसे रेटिंग मान) क्या हो रहा है था? क्षमा करें अगर यह एक बेवकूफ सवाल है, तो मैंने पहले इस तरह गणित नहीं किया है। – monster

+0

सुनिश्चित नहीं है कि आपका क्या मतलब है; आउटपुट अनुमानित रेटिंग है, इसलिए सीएमएसई के साथ सीधे तरीके से तुलना की जा सकती है। प्रैक्टिस में, मुझे लगता है कि आप परिणामों को [1,5] में क्लैंप करेंगे। यह ठीक है, और आपको आरएमएसई की गणना करने से पहले ऐसा करना चाहिए। –

+0

क्षमा करें, मैं बहुत स्पष्ट नहीं था, हालांकि आपके उत्तर ने उत्तर दिया कि मैं क्या पूछने की कोशिश कर रहा था - कि 7 की अनुमानित रेटिंग के आरएमएसई, जब असली रेटिंग वास्तव में 5 है, यह अनुमान है कि रेटिंग 3 (अगर हम आरएमएसई का संकेतक के रूप में उपयोग कर रहे थे कि एल्गोरिदम कितना अच्छा है)। हालांकि, पूर्वानुमान उद्देश्यों के लिए मैं समझता हूं कि इस 7 का मतलब है "आप वास्तव में इसे वास्तव में पसंद करेंगे"। अपनी प्रोफ़ाइल को देखते हुए आप एक पुस्तक के लेखक हैं जिन्हें मैं हाल ही में अपने अध्ययनों, कुडोस के साथ मेरी मदद करने के लिए उपयोग कर रहा हूं, यह बहुत अच्छा है! मैं एएलएस पर एक और क्यू पूछने जा रहा हूं, अगर आप एक नज़र डाल सकते हैं तो यह बहुत अच्छा होगा। – monster

संबंधित मुद्दे