2016-11-12 12 views
5

मुझे आश्चर्य है कि क्या विज्ञान-सीखने के पैकेज के हाल के संस्करणों में संतुलित रैंडम वन (बीआरएफ) का कार्यान्वयन हुआ है। असंतुलित डेटा के मामले में बीआरएफ का उपयोग किया जाता है। यह सामान्य आरएफ के रूप में काम करता है, लेकिन प्रत्येक बूटस्ट्रैपिंग पुनरावृत्ति के लिए, यह अंडरसेप्लिंग द्वारा प्रसार वर्ग को संतुलित करता है। उदाहरण के लिए, प्रत्येक कक्षा को एन 0 = 100, और एन 1 = 30 उदाहरण दिए गए हैं, प्रत्येक यादृच्छिक नमूनाकरण में यह पहली कक्षा से 30 उदाहरण और दूसरे वर्ग से उदाहरणों की एक ही राशि खींचता है, यानी यह एक पेड़ को प्रशिक्षित करता है संतुलित डेटा सेट। अधिक जानकारी के लिए please refer to this paperविज्ञान-सीखने में संतुलित रैंडम वन (पायथन)

RandomForestClassifier() में 'class_weight =' पैरामीटर है, जिसे 'संतुलित' पर सेट किया जा सकता है, लेकिन मुझे यकीन नहीं है कि यह बूटस्ट्रैप प्रशिक्षण नमूने के डाउनसमल्पिंग से संबंधित है।

+0

क्या आपको कभी समाधान मिला? – oliversm

+0

@oliversm, दुर्भाग्य से नहीं। मैंने इस मुद्दे को छोड़ दिया। शायद हमें scikit सीखने के मंच पर एक मुद्दा खोलना चाहिए और समाधान का प्रस्ताव देना चाहिए। वह महान होगा। –

+0

ब्राइमन द्वारा प्रस्तावित विधि को साइकिट पहले से पेश किए जाने के तरीके को लागू करने के लिए काफी आसान होना चाहिए, हालांकि यह एक शर्म की बात है, हालांकि ऐसा लगता है कि ऐसा अनदेखा किया गया है। – oliversm

उत्तर

4

मुझे पता है कि यह 10 महीने देर हो चुकी है, लेकिन मुझे लगता है कि आप जो खोज रहे हैं वह imblearn से है।

imblearn.ensemble.BalancedBaggingClassifier(base_estimator=None, 
n_estimators=10, max_samples=1.0, max_features=1.0, bootstrap=True, 
bootstrap_features=False, oob_score=False, warm_start=False, ratio='auto', 
replacement=False, n_jobs=1, random_state=None, verbose=0) 

प्रभावी रूप से क्या यह आपको ऐसा करने की अनुमति क्रमिक अपने बहुमत वर्ग undersample शीर्ष पर एक आकलनकर्ता फिटिंग, जबकि करने के लिए है। आप scikit-learn से यादृच्छिक वन या किसी भी बेस अनुमानक का उपयोग कर सकते हैं। यहां एक example है।

+1

धन्यवाद! मैं इस पैकेज के साथ थोड़ा सा खेल रहा हूं और इसे काफी रोचक पाया। मैं आपके उदाहरण का और पता लगाऊंगा। –

+0

@ अर्नोल्डक्लेन हां यह बहुत उपयोगी है, लेकिन दस्तावेज को अभी भी कुछ सुधार की जरूरत है। – mamafoku

संबंधित मुद्दे