पाइथन विज्ञान में लापता मूल्यों से निपटने के लिए कैसे करें एनएमएफ

मैं पाइथन विज्ञान-सीखने का उपयोग करके अपने डेटासेट पर एनएमएफ लागू करने की कोशिश कर रहा हूं। मेरे डेटासेट में 0 मान और अनुपलब्ध मान हैं। लेकिन scikit-learn डेटा मैट्रिक्स में NaN मान की अनुमति नहीं देता है। कुछ पदों ने कहा कि शून्य के साथ लापता मूल्यों को प्रतिस्थापित करें।पाइथन विज्ञान में लापता मूल्यों से निपटने के लिए कैसे करें एनएमएफ

मेरे प्रश्न हैं:

मैं शून्य से मान अनुपलब्ध जगह हैं, तो कैसे एल्गोरिथ्म लापता मूल्यों और वास्तविक शून्य मान बता सकते हैं?
क्या कोई अन्य एनएमएफ कार्यान्वयन गुम मूल्यों से निपट सकता है?
या यदि कोई अन्य मैट्रिक्स कारककरण एल्गोरिदम गुम मूल्य पूर्वानुमान कर सकता है?

स्रोत

2016-09-07 Zhaojie Tao

शून्य के साथ लापता-मूल्यों के प्रतिस्थापन (या स्तंभ मतलब, या पंक्ति-मतलब या ...) वर्गीकारक द्वारा ज्ञात नहीं है। यह इन संख्याओं को किसी अन्य के रूप में मानता है जो ठीक हो सकता है (हम हमेशा इन विधियों के साथ एक निम्न रैंक मॉडल मानते हैं)।/सामान्य रूप से मैं कहूंगा कि लापता-मूल्य भविष्यवाणी एक लापता-मूल्य के बिना एक मैट्रिक्स के निम्न-रैंक कारककरण की तुलना में एक कठिन समस्या है (जिसे मजबूत धारणाओं की आवश्यकता होती है)। एक विकल्प के रूप में: कुछ सामान्य एनएमएफ-समस्या के लिए एक एसजीडी-आधारित अनुकूलक लिखें (और आप केवल ज्ञात मानों से नमूना दे सकते हैं) – sascha

धन्यवाद, ऐसा लगता है कि एसजीडी लागू करने पर लापता मूल्यों को अनदेखा करना समाधान है। –

एक ही समस्या का सामना करना पड़ रहा है। क्या आपने अपना स्वयं का एसजीडी कार्यान्वयन लिखा है? यदि हां, तो यह कैसा प्रदर्शन कर रहा है? अब तक मैं कुछ भी हासिल नहीं कर पाया जो एनएमएफ के समान प्रदर्शन करता है। – silentser

एसजीडी यहां काम करेगा, लेकिन विज्ञान-सीख में ऐसा कोई नहीं है जिसे कार्य के लिए लागू किया जा सके। अपना खुद का लेखन नौकरी करेगा, लेकिन वास्तव में धीमा होगा क्योंकि कोई भी सीधे मैट्रिक्स कारक एसजीडी समानांतर नहीं कर सकता है। वितरित एसजीडी एल्गोरिदम here वर्णित है। इसे लागू करना इतना कठिन नहीं है और यह चीजों को महत्वपूर्ण रूप से गति देता है।

स्रोत

2017-03-31 06:52:58 silentser

अच्छा बिंदु, धन्यवाद :) –

इस बारे में एक धागा है जो कि विज्ञान-सीखने वाले जिथब और एक संस्करण सीम उपलब्ध है लेकिन अभी तक मुख्य कोड में नहीं है।

https://github.com/scikit-learn/scikit-learn/pull/8474

स्रोत

2017-10-25 20:11:28

कृपया अधिक जानकारी जोड़ें। लिंक समाप्त हो गया। – empty

पाइथन विज्ञान में लापता मूल्यों से निपटने के लिए कैसे करें एनएमएफ

उत्तर

संबंधित मुद्दे