मैं पाइथन विज्ञान-सीखने का उपयोग करके अपने डेटासेट पर एनएमएफ लागू करने की कोशिश कर रहा हूं। मेरे डेटासेट में 0 मान और अनुपलब्ध मान हैं। लेकिन scikit-learn डेटा मैट्रिक्स में NaN मान की अनुमति नहीं देता है। कुछ पदों ने कहा कि शून्य के साथ लापता मूल्यों को प्रतिस्थापित करें।पाइथन विज्ञान में लापता मूल्यों से निपटने के लिए कैसे करें एनएमएफ
मेरे प्रश्न हैं:
मैं शून्य से मान अनुपलब्ध जगह हैं, तो कैसे एल्गोरिथ्म लापता मूल्यों और वास्तविक शून्य मान बता सकते हैं?
क्या कोई अन्य एनएमएफ कार्यान्वयन गुम मूल्यों से निपट सकता है?
या यदि कोई अन्य मैट्रिक्स कारककरण एल्गोरिदम गुम मूल्य पूर्वानुमान कर सकता है?
शून्य के साथ लापता-मूल्यों के प्रतिस्थापन (या स्तंभ मतलब, या पंक्ति-मतलब या ...) वर्गीकारक द्वारा ज्ञात नहीं है। यह इन संख्याओं को किसी अन्य के रूप में मानता है जो ठीक हो सकता है (हम हमेशा इन विधियों के साथ एक निम्न रैंक मॉडल मानते हैं)।/सामान्य रूप से मैं कहूंगा कि लापता-मूल्य भविष्यवाणी एक लापता-मूल्य के बिना एक मैट्रिक्स के निम्न-रैंक कारककरण की तुलना में एक कठिन समस्या है (जिसे मजबूत धारणाओं की आवश्यकता होती है)। एक विकल्प के रूप में: कुछ सामान्य एनएमएफ-समस्या के लिए एक एसजीडी-आधारित अनुकूलक लिखें (और आप केवल ज्ञात मानों से नमूना दे सकते हैं) – sascha
धन्यवाद, ऐसा लगता है कि एसजीडी लागू करने पर लापता मूल्यों को अनदेखा करना समाधान है। –
एक ही समस्या का सामना करना पड़ रहा है। क्या आपने अपना स्वयं का एसजीडी कार्यान्वयन लिखा है? यदि हां, तो यह कैसा प्रदर्शन कर रहा है? अब तक मैं कुछ भी हासिल नहीं कर पाया जो एनएमएफ के समान प्रदर्शन करता है। – silentser