5

मैं पाइथन विज्ञान-सीखने का उपयोग करके अपने डेटासेट पर एनएमएफ लागू करने की कोशिश कर रहा हूं। मेरे डेटासेट में 0 मान और अनुपलब्ध मान हैं। लेकिन scikit-learn डेटा मैट्रिक्स में NaN मान की अनुमति नहीं देता है। कुछ पदों ने कहा कि शून्य के साथ लापता मूल्यों को प्रतिस्थापित करें।पाइथन विज्ञान में लापता मूल्यों से निपटने के लिए कैसे करें एनएमएफ

मेरे प्रश्न हैं:

  • मैं शून्य से मान अनुपलब्ध जगह हैं, तो कैसे एल्गोरिथ्म लापता मूल्यों और वास्तविक शून्य मान बता सकते हैं?

  • क्या कोई अन्य एनएमएफ कार्यान्वयन गुम मूल्यों से निपट सकता है?

  • या यदि कोई अन्य मैट्रिक्स कारककरण एल्गोरिदम गुम मूल्य पूर्वानुमान कर सकता है?

+0

शून्य के साथ लापता-मूल्यों के प्रतिस्थापन (या स्तंभ मतलब, या पंक्ति-मतलब या ...) वर्गीकारक द्वारा ज्ञात नहीं है। यह इन संख्याओं को किसी अन्य के रूप में मानता है जो ठीक हो सकता है (हम हमेशा इन विधियों के साथ एक निम्न रैंक मॉडल मानते हैं)।/सामान्य रूप से मैं कहूंगा कि लापता-मूल्य भविष्यवाणी एक लापता-मूल्य के बिना एक मैट्रिक्स के निम्न-रैंक कारककरण की तुलना में एक कठिन समस्या है (जिसे मजबूत धारणाओं की आवश्यकता होती है)। एक विकल्प के रूप में: कुछ सामान्य एनएमएफ-समस्या के लिए एक एसजीडी-आधारित अनुकूलक लिखें (और आप केवल ज्ञात मानों से नमूना दे सकते हैं) – sascha

+1

धन्यवाद, ऐसा लगता है कि एसजीडी लागू करने पर लापता मूल्यों को अनदेखा करना समाधान है। –

+0

एक ही समस्या का सामना करना पड़ रहा है। क्या आपने अपना स्वयं का एसजीडी कार्यान्वयन लिखा है? यदि हां, तो यह कैसा प्रदर्शन कर रहा है? अब तक मैं कुछ भी हासिल नहीं कर पाया जो एनएमएफ के समान प्रदर्शन करता है। – silentser

उत्तर

1

एसजीडी यहां काम करेगा, लेकिन विज्ञान-सीख में ऐसा कोई नहीं है जिसे कार्य के लिए लागू किया जा सके। अपना खुद का लेखन नौकरी करेगा, लेकिन वास्तव में धीमा होगा क्योंकि कोई भी सीधे मैट्रिक्स कारक एसजीडी समानांतर नहीं कर सकता है। वितरित एसजीडी एल्गोरिदम here वर्णित है। इसे लागू करना इतना कठिन नहीं है और यह चीजों को महत्वपूर्ण रूप से गति देता है।

+0

अच्छा बिंदु, धन्यवाद :) –

0

इस बारे में एक धागा है जो कि विज्ञान-सीखने वाले जिथब और एक संस्करण सीम उपलब्ध है लेकिन अभी तक मुख्य कोड में नहीं है।

https://github.com/scikit-learn/scikit-learn/pull/8474

+1

कृपया अधिक जानकारी जोड़ें। लिंक समाप्त हो गया। – empty

संबंधित मुद्दे