14

मुझे लगता है कि विचार प्राप्त करने के लिए कोड के आसान कार्यान्वयन के साथ नए विषय सीखना सर्वोत्तम है। इस तरह मैंने जेनेटिक एल्गोरिदम और जेनेटिक प्रोग्रामिंग सीखा। मशीन सीखने के साथ शुरू करने के लिए लिखने के लिए कुछ अच्छे प्रारंभिक कार्यक्रम क्या होंगे?मशीन सीखने के लिए एक अच्छा पहला कार्यान्वयन क्या है?

अधिमानतः, किसी भी संदर्भित संसाधनों ताकि समुदाय

+0

और आनुवंशिक एल्गोरिदम सामान्य रूप से सीखने के लिए पहला आसान कार्यान्वयन क्या था? – zubinmehta

+1

coursera.org पर एमएल कोर्स लें। – ziggystar

उत्तर

4

फायदा हो सकता है मुझे लगता है कि आप जंक ईमेल को छानने के लिए एक "अनुभवहीन Bayes" वर्गीकारक लिख सकते हैं ऑनलाइन सुलभ हो सकते हैं। आप इस पुस्तक से बहुत सारी जानकारी प्राप्त कर सकते हैं।

http://nlp.stanford.edu/IR-book/information-retrieval-book.html

+1

यहां एक और महान मुफ्त पुस्तक - द एलिमेंट्स ऑफ स्टैटिस्टिकल लर्निंग - www-stat.stanford.edu/~hastie/Papers/ESLII.pdf – tathagata

+0

ईओएसएल मेरी राय में कुछ हद तक मुश्किल है। यह प्रारंभिक पढ़ने के रूप में उपयुक्त नहीं है, यह स्तर स्नातक छात्रों के लिए है। – lmsasu

+0

हां मैं इमासु से भी सहमत हूं। लेकिन "सूचना पुनर्प्राप्ति का परिचय" पुस्तक पढ़ने के लिए मुश्किल नहीं है। –

1

निर्णय पेड़। इसे अक्सर वर्गीकरण कार्यों में उपयोग किया जाता है और इसमें कई प्रकार होते हैं। टॉम मिशेल की पुस्तक इसे लागू करने के लिए एक अच्छा संदर्भ है।

-9

किताबें कहलाती हैं; क्या आप उनसे परिचित हैं? जब मैं दो दशक पहले एआई की खोज कर रहा था, वहां कई किताबें थीं। मुझे लगता है कि इंटरनेट मौजूद है, किताबें पुरातन हैं, लेकिन आप शायद कुछ प्राचीन पुस्तकालय में पा सकते हैं।

+0

मुझे खेद है कि लोग सोचते हैं कि किताबें अच्छी नहीं हैं, लेकिन किताबों में प्रचुर मात्रा में संसाधन उपलब्ध हैं। पुस्तकें यहां अन्य उत्तरों की तुलना में अधिक उपयोगी होंगी। –

+2

मुझे लगता है कि आप अन्य उत्तरों को पढ़ नहीं सकते जो अच्छी किताबों का संदर्भ लेते हैं ... – Malcolm

12

आप किस भाषा में विकसित होंगे? यदि आप लचीले हैं, तो मैं अच्छे उम्मीदवारों के रूप में मैटलैब, पायथन और आर की सलाह देता हूं। ये एल्गोरिदम विकसित करने और मूल्यांकन करने के लिए उपयोग की जाने वाली कुछ सामान्य भाषाएं हैं। वे तेजी से एल्गोरिदम विकास और मूल्यांकन, डेटा कुशलता और दृश्यता की सुविधा प्रदान करते हैं। अधिकांश लोकप्रिय एमएल एल्गोरिदम पुस्तकालयों (स्रोत के साथ) के रूप में भी उपलब्ध हैं।

मैं आर 2 में मूल वर्गीकरण और/या क्लस्टरिंग अभ्यास पर ध्यान केंद्रित करके शुरू करूंगा। विज़ुअलाइज़ करना आसान है, और आमतौर पर एमएल, जैसे जोखिम, कक्षा असंतुलन, शोर लेबल, ऑनलाइन बनाम ऑफ़लाइन प्रशिक्षण इत्यादि में मुद्दों की खोज के लिए पर्याप्त है। रोजमर्रा की जिंदगी से डेटा सेट बनाएं, या जिस समस्या में आप रुचि रखते हैं। एक क्लासिक, आईरिस डेटा सेट की तरह, ताकि आप अपनी प्रगति को प्रकाशित साहित्य में तुलना कर सकें। आपको कम से आइरिस डेटा सेट पा सकते हैं:

इसकी अच्छा सुविधाओं में से एक यह एक वर्ग, 'setosa' किया है, जो आसानी से से रैखिक वियोज्य है दूसरे।

एक बार जब आप कुछ दिलचस्प डेटा सेट चुनते हैं, तो कुछ मानक क्लासिफायरों को लागू करके और उनके प्रदर्शन की जांच करके शुरू करें। यह classifiers का एक अच्छा संक्षिप्त सूची में जानने के लिए है:

  • k-निकटतम पड़ोसियों
  • रैखिक विभेदक विश्लेषण
  • निर्णय वृक्ष (जैसे, C4.5)
  • समर्थन वेक्टर मशीन (जैसे, LibSVM के माध्यम से)
  • (स्टंप के साथ)
  • अनुभवहीन Bayes वर्गीकारक

वाई बढ़ाने आईरिस डेटा सेट और मैं जिन भाषाओं का उल्लेख करता हूं उनमें से एक, आप आसानी से किसी भी क्लासिफायर का उपयोग करके मिनी-स्टडी कर सकते हैं (आपकी गति के आधार पर मिनटों तक)।

संपादित करें: आप कई उदाहरण खोजने के लिए "आईरिस डेटा वर्गीकरण" को Google पर लक्षित कर सकते हैं।यहाँ Mathworks से एक वर्गीकरण डेमो दस्तावेज़ आइरिस डेटा सेट का उपयोग कर रहा है:

http://www.mathworks.com/products/statistics/demos.html?file=/products/demos/shipping/stats/classdemo.html

1

तंत्रिका जाल पहले लागू करने के लिए सबसे आसान काम हो सकता है, और वे काफी अच्छी तरह से साहित्य भर कवर कर रहे हैं।

+0

यह इसके लिए एक अच्छा संसाधन होगा: http://neuralnetworksanddeeplearning.com/ – marbel

संबंधित मुद्दे