2017-05-04 15 views
6

मैं कुछ डेटा विश्लेषण करने की कोशिश कर रहा हूं और विचार इष्टतम डिब्बे बनाने के लिए autobinning कमांड का उपयोग करना है, प्रत्येक बिन के लिए WOE (सबूत का वजन) मान की गणना करें और उसके बाद मूल मानों को प्रतिस्थापित करें संबंधित डब्ल्यूओई मूल्य के साथ प्रत्येक बिन से संबंधित है। तो नीचे मैं क्या कर रहा है:NaN मानों के लिए एक बिन बनाना

CreSC = creditscorecard(Data_Table ,'IDVar','CustID','GoodLabel',0); 
scAB = autobinning(CreSC,'Algorithm','Monotone'); 
DataTransformed = bindata(scAB,t_Data,'OutputType','WOE'); 

समस्या यह है कि उपरोक्त प्रक्रिया NaN मूल्यों है कि डेटा में हैं पर विचार नहीं करता है और उन्हें स्वचालित रूप से शामिल नहीं है।

मेरा लक्ष्य केवल NaN मानों के लिए एक अलग बिन बनाना है और मानों पर विचार करने के लिए autobinning आदेश को बल देना है।

क्या किसी के पास उचित समाधान है?

उत्तर

2

सभी NaN मान खोजें।

एक मूल्य चुनें जो आपके डेटा के अंदर मौजूद नहीं है।

इस मूल्य से सभी NaN मानों को बदलें।

अपनी कताई चलाएं, और अंत में इस मूल्य को NaN पर मानचित्र करें।

+0

उत्तर के लिए धन्यवाद। मैंने पहले ही यह कोशिश की है। इस तरह से काम नहीं लगता है क्योंकि डिब्बे के अंतराल NaNs पर निर्दिष्ट मूल्य से प्रभावित होते हैं। दोबारा, मेरा लक्ष्य केवल नाइन के साथ एक बिन बनाना है! –

संबंधित मुद्दे