2010-02-18 10 views
5

मैं पाइथन या किसी भी भाषा में एक आईडी 3 निर्णय पेड़ कार्यान्वयन की तलाश में हूं जो एक सत्यापन और परीक्षण फ़ाइल को इनपुट के रूप में लेता है और पूर्वानुमान देता है।संख्यात्मक मान के साथ आईडी 3 निर्णय ट्री

मुझे this मिला और यह लेकिन मैं उन्हें संख्यात्मक मानों में अनुकूलित नहीं कर सका, उदा। Iris dataset पर।

क्या आप किसी भी ID3 पेड़ कार्यान्वयन को जानते हैं जो कंसोल या पायथन में लिखे गए किसी भी काम से काम करता है? या संख्यात्मक मानों के साथ this का उपयोग करने के लिए कोई सुझाव अद्भुत होगा।

उत्तर

2

मेरे पास पाइथन में लिखा गया एक समान एल्गोरिदम सी 4.5 है। यह कंसोल से काम करता है। यदि आप रुचि रखते हैं तो मैंने इसे यहां रखा है।

यदि आपको इसकी आवश्यकता नहीं है तो एक पोस्ट के लिए खेद है। http://pastebin.ca/1802066

  • आईरिस -

    • C4.5:

      मैं दोनों अपलोड कर दिया है: कोड और डेटा

      Btw, मैं यह आइरिस डेटा सेट :)

      अद्यतन पर परीक्षण किया है .data - http://pastebin.ca/1802067

    मुझे उम्मीद है कि यह आपकी मदद करेगा।

    Btw, कार्यक्रम भी एक पेड़ "png" में Graphviz

  • +1

    के माध्यम से आकर्षित कर सकते हैं हाँ, मैं सराहना करेंगे आप C4.5 एल्गोरिथ्म साझा कर सकते हैं यदि। –

    +0

    सी 4.5 कोड के लिए धन्यवाद। मुझे वर्गीकरण की शुद्धता की गणना करने की आवश्यकता है। मैं आपके कोड में पूर्वानुमानित कक्षाएं कैसे प्राप्त कर सकता हूं? मैंने वर्गीकरण (tree_root, डीएस) का उपयोग करने की कोशिश की लेकिन ऐसा लगता है कि यह मूल वर्ग के समान वर्ग लेबल लौटाता है - या मैं कुछ गलत कर रहा हूं :) –

    +2

    हाँ, आप सही हैं। लेबल समान हैं क्योंकि सीखने की प्रक्रिया पूरे आईरिस डेटा सेट पर कर रही है। बस डेटा फ़ाइल से कुछ डेटा वैक्टरों को बाहर निकालें (या इसे 'load_iris' फ़ंक्शन में करें), और पूर्वानुमानित परीक्षण के लिए बहिष्कृत वैक्टर का उपयोग करें। – woo

    संबंधित मुद्दे