2010-07-02 15 views
40

Weka शायद सबसे लोकप्रिय सामान्य उद्देश्य मशीन लर्निंग लाइब्रेरी है। लेकिन यह मेरे अनुभव में काफी धीमा हो सकता है।सबसे तेज़ सामान्य मशीन लर्निंग लाइब्रेरी?

मैं Shark को देखकर किया गया है, Waffles, dlib, Plearn, और MLC++ विकल्प के रूप में। इनमें से शार्क और डीएलआईबी सबसे आशाजनक दिखते हैं।

क्या इन पुस्तकालयों के प्रदर्शन परीक्षण की बात आने पर किसी को भी कोई अनुभव है?

+0

आपको http://code.google.com/p/eureqa-api/ में रुचि भी हो सकती है जो – Inverse

+0

उच्च प्रदर्शन समीकरण खोज करता है * जो * आप जिस मॉडल को सीखना चाहते हैं उस पर निर्भर करता है। सीआरएफ? SVM? HMM? – bmargulies

+4

वीका ** अविश्वसनीय रूप से धीमा ** है। –

उत्तर

39

मेरे लिए, सबसे महत्वपूर्ण बात यह है कि "क्या इस टूलकिट में एल्गोरिदम या सुविधा है जिसे मैं आजमा देना चाहता हूं?" चूंकि ये टूलकिट सुविधाओं का एक बिल्कुल विविध सेट प्रदान करते हैं, आपको सबसे पहले इसे कम करने की कोशिश करनी चाहिए कि आप क्या करना चाहते हैं।

तो, उदाहरण के लिए, यदि आपके पास विभिन्न विकासवादी अनुकूलन एल्गोरिदम को आजमाने की ज्वलंत इच्छा है तो मैं Shark जैसे कुछ के साथ जाऊंगा।

दूसरी तरफ, मैं अपने अधिकांश कामों के लिए dlib पसंद करता हूं, लेकिन इसका मतलब यह नहीं है कि मैंने इसे लिखा है :) हालांकि, यदि आप बाइनरी वर्गीकरण में रुचि रखते हैं तो मुझे अपने वर्तमान पसंदीदा का सुझाव दें उस के लिए विधि, svm_c_ekm_trainer। मैं अक्सर इसका उपयोग सैकड़ों हजारों अंकों के डेटासेट पर गैर-रैखिक एसवीएम को प्रशिक्षित करने के लिए करता हूं। यह आमतौर पर कुछ मिनट (या कभी-कभी सेकंड भी) में चलता है जबकि क्लासिक एसएमओ एल्गोरिदम में इसे समाप्त होने में घंटे या दिन लगते हैं।

इसी तरह के प्रश्न के कुछ अच्छे जवाब भी बहुत पहले नहीं पूछा गया था: Which machine learning library to use

+1

धन्यवाद डेविस! Dlib के साथ महान काम! मैं वास्तव में ऐसा कुछ ढूंढ रहा हूं जिसमें बहुत सारी कार्यक्षमता है ताकि मैं उस समय का अधिकतर उपयोग कर सकूं, लेकिन आवश्यकतानुसार अन्य चीजों में बाहर निकल जाऊंगा। – griffin

संबंधित मुद्दे