आप किस भाषा में विकसित होंगे? यदि आप लचीले हैं, तो मैं अच्छे उम्मीदवारों के रूप में मैटलैब, पायथन और आर की सलाह देता हूं। ये एल्गोरिदम विकसित करने और मूल्यांकन करने के लिए उपयोग की जाने वाली कुछ सामान्य भाषाएं हैं। वे तेजी से एल्गोरिदम विकास और मूल्यांकन, डेटा कुशलता और दृश्यता की सुविधा प्रदान करते हैं। अधिकांश लोकप्रिय एमएल एल्गोरिदम पुस्तकालयों (स्रोत के साथ) के रूप में भी उपलब्ध हैं।
मैं आर 2 में मूल वर्गीकरण और/या क्लस्टरिंग अभ्यास पर ध्यान केंद्रित करके शुरू करूंगा। विज़ुअलाइज़ करना आसान है, और आमतौर पर एमएल, जैसे जोखिम, कक्षा असंतुलन, शोर लेबल, ऑनलाइन बनाम ऑफ़लाइन प्रशिक्षण इत्यादि में मुद्दों की खोज के लिए पर्याप्त है। रोजमर्रा की जिंदगी से डेटा सेट बनाएं, या जिस समस्या में आप रुचि रखते हैं। एक क्लासिक, आईरिस डेटा सेट की तरह, ताकि आप अपनी प्रगति को प्रकाशित साहित्य में तुलना कर सकें। आपको कम से आइरिस डेटा सेट पा सकते हैं:
इसकी अच्छा सुविधाओं में से एक यह एक वर्ग, 'setosa' किया है, जो आसानी से से रैखिक वियोज्य है दूसरे।
एक बार जब आप कुछ दिलचस्प डेटा सेट चुनते हैं, तो कुछ मानक क्लासिफायरों को लागू करके और उनके प्रदर्शन की जांच करके शुरू करें। यह classifiers का एक अच्छा संक्षिप्त सूची में जानने के लिए है:
- k-निकटतम पड़ोसियों
- रैखिक विभेदक विश्लेषण
- निर्णय वृक्ष (जैसे, C4.5)
- समर्थन वेक्टर मशीन (जैसे, LibSVM के माध्यम से)
- (स्टंप के साथ)
- अनुभवहीन Bayes वर्गीकारक
वाई बढ़ाने आईरिस डेटा सेट और मैं जिन भाषाओं का उल्लेख करता हूं उनमें से एक, आप आसानी से किसी भी क्लासिफायर का उपयोग करके मिनी-स्टडी कर सकते हैं (आपकी गति के आधार पर मिनटों तक)।
संपादित करें: आप कई उदाहरण खोजने के लिए "आईरिस डेटा वर्गीकरण" को Google पर लक्षित कर सकते हैं।यहाँ Mathworks से एक वर्गीकरण डेमो दस्तावेज़ आइरिस डेटा सेट का उपयोग कर रहा है:
http://www.mathworks.com/products/statistics/demos.html?file=/products/demos/shipping/stats/classdemo.html
स्रोत
2010-07-05 04:26:03
और आनुवंशिक एल्गोरिदम सामान्य रूप से सीखने के लिए पहला आसान कार्यान्वयन क्या था? – zubinmehta
coursera.org पर एमएल कोर्स लें। – ziggystar