2013-05-22 18 views
8

मैं मशीन सीखने के डोमेन में नया हूँ और मैं देखा है एल्गोरिदम का एक बहुत एल्गोरिदम के/सेट है कि इस्तेमाल किया जा सकता देखते हैं कि: SVM, निर्णय वृक्ष, अनुभवहीन Bayes, perceptron आदि ... है यही कारण है कि मुझे आश्चर्य है कौन सा एल्गोरिदम किसी समस्या को हल करने के लिए उपयोग करना चाहिए? दूसरे शब्दों में कौन सा एल्गोरिदम हल समस्या वर्ग हल करता है?मशीन लर्निंग एल्गोरिदम: किस समस्या के लिए कौन सा एल्गोरिदम?

तो मेरा सवाल यह है कि यदि आप एक अच्छी वेबसाइट या पुस्तक जानते हैं जो इस एल्गोरिदम चयन समस्याग्रस्त पर केंद्रित है?

किसी भी मदद की सराहना की जाएगी। अग्रिम में Thx।

होरेस

+3

कोई मुफ्त भोजन - http://en.wikipedia.org/wiki/No_free_lunch_theorem –

+2

एक समय पहले मैं एक लेख जो एक "की नकल पुस्तिकाओं" निहित पढ़ें। लेख, जो पाइथन मॉड्यूल विज्ञान के उपयोग पर केंद्रित है-सीख सकता है [** यहां **] (http://peekaboo-vision.blogspot.de/2013/01/machine-learning-cheat-sheet- के लिए-scikit.html)। – pwagner

उत्तर

9

Andrew Ng's machine learning course on coursera लो। यह खूबसूरती से एक साथ रखा गया है, विभिन्न प्रकार के एमएल एल्गोरिदम के बीच अंतर बताता है, प्रत्येक एल्गोरिदम का उपयोग करने के बारे में सलाह देता है, और यदि आप इसे चाहते हैं तो प्रैक्टर्स के साथ-साथ गणित के लिए उपयोगी सामग्री भी शामिल है। मैं खुद को सीखने की मशीन सीखने की प्रक्रिया में हूं और यह अब तक का सबसे उपयोगी संसाधन रहा है।

(सलाह का एक और टुकड़ा जिसे आप उपयोगी पा सकते हैं, सीखना पाइथन सीखना है। यह एक गलती पर आधारित है जिसे मैंने पहले चरण में पायथन सीखना शुरू नहीं किया था और कई किताबें, वेब पेज, एसडीक्स इत्यादि से बाहर निकलना शुरू किया था। जो कि पाइथन आधारित हैं। चूंकि यह निकलता है, पाइथन लेने के लिए बहुत आसान है, और कम से कम अपने व्यक्तिगत अवलोकनों से, मशीन सीखने और डेटा विज्ञान समुदायों में व्यापक रूप से उपयोग किया जाता है।)

+0

+1 एंड्रयू एनजी के चचेरे भाई की पेशकश के लिए +1 - मैंने पिछले साल यह किया था और यह वास्तव में शुरुआती लोगों के लिए एक सुलभ परिचय है। –

2

यह बहुत मुश्किल सवाल "जो एल्गोरिथ्म जो मुद्दा? के लिए"

क्षमता अनुभव और ज्ञान का एक बहुत कुछ के साथ आता है कि इसका जवाब है। तो मेरा सुझाव है, आपको मशीन सीखने के बारे में कुछ अच्छी किताबें पढ़नी चाहिए। शायद, निम्नलिखित पुस्तक एक अच्छा प्रारंभिक बिंदु होगा।

Machine Learning: A Probabilistic Perspective

एक बार जब आप मशीन सीखने के बारे में कुछ ज्ञान है, तो आप सरल मशीन लर्निंग समस्याओं की जोड़ी पर काम कर सकते हैं। Iris flower dataset एक अच्छा प्रारंभिक बिंदु है। इसमें तीन प्रकार की आईरिस प्रजातियों से संबंधित कई विशेषताएं शामिल हैं। शुरू में एक सरल मशीन सीखने मॉडल (जैसे रसद प्रतिगमन के रूप में) आइरिस प्रजातियों को वर्गीकृत करने को विकसित करने और धीरे-धीरे आप इस तरह के Neural Networks के रूप में और अधिक उन्नत मॉडल को स्थानांतरित कर सकते हैं।

+1

एक और पुस्तक "मशीन लर्निंग इन एक्शन" हो सकती है जिसमें लेखक (पीटर हैरिंगटन) अपनी प्रयोज्यता सहित कई मशीन लर्निंग एल्गोरिदम का वर्णन करते हैं। – Emile

+0

विधायक पीपी इस समय लगभग सबसे अच्छा सामान्य एमएल * सिद्धांत * पुस्तक है, यह कुछ अन्य पुस्तकों के रूप में डरावना नहीं है, जब तक आपके पास कुछ कैलेंज गणित है। यह पुस्तक मुफ्त ऑनलाइन उपलब्ध है http://www.stat.stanford.edu/~tibs/ElemStatLearn/ (लेकिन मर्फी की पुस्तक के रूप में पहुंचने योग्य नहीं)। आप मशीन लर्निंग इन एक्शन के लिए कुछ और व्यावहारिक जाना चाहते हैं। – Bull

2

@TooTone: मेरी राय मशीन में एक्शन सीखना ओपी को किसी विशेष समस्या के लिए किस तकनीक का उपयोग करने का निर्णय लेने में मदद कर सकता है, क्योंकि पुस्तक अलग-अलग एमएल एल्गोरिदम और पेशेवरों, विपक्षों और उनमें से प्रत्येक के लिए "काम करता है" का स्पष्ट वर्गीकरण देती है। मैं सहमत हूं कि कोड पढ़ने के लिए कुछ मुश्किल है, खासकर उन लोगों के लिए जो मैट्रिक्स परिचालनों में उपयोग नहीं करते हैं। 10 लाइन पायथन कार्यक्रम में शोध के वर्षों में शोध किया गया है, इसलिए तैयार रहें कि इसे समझने में एक दिन लगेगा (मेरे लिए कम से कम)।

+0

मैंने "मशीन लर्निंग फॉर हैकर्स" पढ़ा जो आर का उपयोग करता है, क्योंकि मुझे कुछ आर पता था, लेकिन अंत में मैंने कामना की थी कि मैं "मशीन लर्निंग इन एक्शन" पढ़ूंगा, जो इसके बजाय अजगर का उपयोग करता है, क्योंकि पाइथन अधिक मुख्यधारा दिखता है और पीटर हैरिंगटन की पुस्तक में सामान्य रूप से अधिक अनुकूल समीक्षा। फिर भी संपादन, कोड की पठनीयता आदि के संदर्भ में दोनों पुस्तकों के साथ समस्याएं प्रतीत होती हैं। एमएल पर कई बहुत ही मजबूत सैद्धांतिक किताबें प्रतीत होती हैं, जैसे उपुल अनुशंसा करता है, लेकिन वास्तव में कोई व्यावहारिक नहीं है। – TooTone

0

एक सरल प्रारंभिक जगह के रूप में मैं विचार है कि मैं क्या आदानों है और क्या outputs मैं चाहता हूँ, जो अक्सर किसी भी स्थिति में विकल्प संकीर्णता से। उदाहरण के लिए, यदि मेरे पास प्रत्येक इनपुट के लिए संख्याओं और लक्ष्य श्रेणी की बजाय श्रेणियां हैं, तो निर्णय पेड़ एक अच्छा विचार है। अगर मेरे पास कोई लक्ष्य नहीं है, तो मैं केवल क्लस्टरिंग कर सकता हूं। यदि मेरे पास संख्यात्मक इनपुट और संख्यात्मक आउटपुट है तो मैं तंत्रिका नेटवर्क या अन्य प्रकार के प्रतिगमन का उपयोग कर सकता हूं। मैं निर्णय पेड़ों का भी उपयोग कर सकता हूं जो प्रतिगमन समीकरण उत्पन्न करते हैं। इसके बाद पूछे जाने वाले और प्रश्न हैं, लेकिन यह शुरू करने के लिए एक अच्छी जगह है।

3

scikit-सीखते हैं।संगठन ने इस इन्फोग्राफिक को प्रकाशित किया है, जो सहायक हो सकता है, भले ही आप sklearn लाइब्रेरी का उपयोग नहीं कर रहे हों।

enter image description here

संबंधित मुद्दे