6

हम जानते हैं की वहाँ classifiers के एक हजार की तरह हैं, हाल ही में मुझे बताया गया था कि, कुछ लोगों का कहना है adaboostखोल एक से बाहर की तरह है।राज्य के अत्याधुनिक वर्गीकरण एल्गोरिदम

  • वहाँ बेहतर एल्गोरिदम ( साथ कि मतदान के विचार)
  • क्या में कला के राज्य classifiers.Do आप एक उदाहरण है है कर रहे हैं?

उत्तर

1

हैस्टी एट अल। (2013, सांख्यिकीय शिक्षा के तत्व) ने निष्कर्ष निकाला है कि ग्रेडियंट बूस्टिंग मशीन सबसे अच्छा "ऑफ-द-शेल्फ" विधि है। आपके पास समस्या का स्वतंत्र है। परिभाषा (पृष्ठ 352 देखें): एक "ऑफ-द-शेल्फ" विधि वह है जो डेटा प्रीप्रोकैसिंग या सीखने की प्रक्रिया के सावधानीपूर्वक ट्यूनिंग के समय के बिना डेटा पर सीधे लागू किया जा सकता है।

और थोड़ा पुराने अर्थ: वास्तव में, Breiman (NIPS कार्यशाला, 1996) "दुनिया में सबसे अच्छा ऑफ-द-शेल्फ वर्गीकारक" के रूप में पेड़ के साथ AdaBoost को (भी Breiman (1998) देखें) कहा जाता है।

5

सबसे पहले, adaboost एक मेटा-एल्गोरिदम है जिसका उपयोग आपके पसंदीदा वर्गीकृत (शीर्ष पर) के संयोजन के साथ किया जाता है। दूसरा, क्लासिफायर जो एक समस्या डोमेन में अच्छी तरह से काम करते हैं, अक्सर दूसरे में अच्छी तरह से काम नहीं करते हैं। No Free Lunch विकिपीडिया पेज देखें। तो, आपके प्रश्न का उत्तर नहीं दिया जा रहा है। फिर भी, यह जानना दिलचस्प हो सकता है कि लोग अभ्यास में क्या उपयोग कर रहे हैं।

+0

तो, आप लोग क्या उपयोग करते हैं ??? – cMinor

2

Apache Mahout (खुला स्रोत, जावा) भाप का एक बहुत लेने के लिए लगता है।

2

Weka एक बहुत ही लोकप्रिय और स्थिर मशीन लर्निंग लाइब्रेरी है। यह काफी समय से आसपास रहा है और Java में लिखा गया है।

+0

हाल ही में मैंने इसका उपयोग करके डॉ। को देखा, इसलिए मुझे यह स्वीकार करना होगा कि आपने जल्द ही जवाब दिया है। – cMinor

3

वीका और महाउट एल्गोरिदम नहीं हैं ... वे मशीन लर्निंग लाइब्रेरी हैं। उनमें एल्गोरिदम की एक विस्तृत श्रृंखला के कार्यान्वयन शामिल हैं। इसलिए, आपकी सबसे अच्छी शर्त लाइब्रेरी चुनना है और कुछ अलग-अलग एल्गोरिदम आज़माएं ताकि यह देखने के लिए कि कौन सी आपकी विशेष समस्या के लिए सबसे अच्छा काम करती है (जहां "सर्वश्रेष्ठ काम करता है" प्रशिक्षण लागत, वर्गीकरण लागत और वर्गीकरण सटीकता का कार्य बनने वाला है)।

यदि यह मैं था, तो मैं बेवकूफ बेयस, के-निकटतम पड़ोसियों और समर्थन वेक्टर मशीनों के साथ शुरू करूंगा। वे बहुत अलग ट्रेडऑफ के साथ अच्छी तरह से स्थापित, अच्छी तरह से समझने के तरीकों का प्रतिनिधित्व करते हैं। बेवकूफ बेयस सस्ते है, लेकिन विशेष रूप से सटीक नहीं है। के-एनएन प्रशिक्षण के दौरान सस्ता है लेकिन वर्गीकरण के दौरान महंगा हो सकता है, और जब यह आमतौर पर बहुत सटीक होता है तो यह अतिरंजना के लिए अतिसंवेदनशील हो सकता है। एसवीएम ट्रेन करने के लिए महंगे हैं और बहुत सारे मेटा-पैरामीटर ट्विक करने के लिए हैं, लेकिन वे लागू करने के लिए सस्ते हैं और आम तौर पर कम से कम के-एनएन के रूप में सटीक हैं।

यदि आप हमें हल करने की कोशिश कर रहे समस्या के बारे में अधिक बताते हैं, तो हम अधिक ध्यान केंद्रित करने में सक्षम हो सकते हैं। लेकिन अगर आप सिर्फ एक ट्रू एल्गोरिदम की तलाश में हैं, तो कोई नहीं है - कोई निशुल्क लंच प्रमेय गारंटी नहीं देता है।

संबंधित मुद्दे