मैं वर्तमान में एक एमएल कार्य के साथ प्रयोग कर रहा हूं जिसमें एक वर्गीकरण मॉडल की पर्यवेक्षित प्रशिक्षण शामिल है। आज तक, मुझे ~ 5 एम प्रशिक्षण उदाहरण और ~ 5M उदाहरण पार-सत्यापन के लिए मिला है। प्रत्येक उदाहरण में, 46 फीचर्स हैं, हालांकि मैं निकट भविष्य में 10 और उत्पन्न करना चाहता हूं, इसलिए किसी भी समाधान को सुधार के लिए कुछ जगह छोड़नी चाहिए।मशीन लर्निंग कार्य: किस उपकरण का उपयोग करना है?
मेरी समस्या निम्न है: इस समस्या से निपटने के लिए मैं किस टूल का उपयोग करता हूं? मैं यादृच्छिक जंगलों या एसवीएम का उपयोग करना चाहता हूं, हालांकि मुझे डर है कि बाद वाला मेरे मामले में बहुत धीमा हो सकता है। मैंने महाउट पर विचार किया है, लेकिन इसे दूर कर दिया गया है क्योंकि ऐसा लगता है कि कमांड लाइन स्क्रिप्ट के साथ गड़बड़ी के साथ कॉन्फ़िगर की एक निश्चित मात्रा की आवश्यकता होती है। मैं सीधे कुछ (अच्छी तरह से प्रलेखित!) पुस्तकालय के खिलाफ कोड या एक जीयूआई के साथ अपने मॉडल को परिभाषित करना चाहता हूं।
मुझे यह भी निर्दिष्ट करना चाहिए कि मैं कुछ ऐसा ढूंढ रहा हूं जो विंडोज़ (साइगविन जैसी चीजों के बिना) पर चल रहा है, और जो समाधान .NET के साथ अच्छी तरह से खेलते हैं, उनकी बहुत सराहना की जाती है।
आपको लगता है कि कल्पना कर सकते हैं, जब समय, आ जाएगा, कोड एक Cluster Compute Eight Extra Large InstanceAmazon EC2 पर पर चलने दी जाएगी, इसलिए कुछ भी है कि राम और बहु-कोर सीपीयू की व्यापक उपयोग करता है का स्वागत है।
इतना ही नहीं बल्कि, मैं निर्दिष्ट करना होगा कि मेरे डाटासेट घना है (कि में वहाँ कोई लापता मूल्य/सभी स्तंभों प्रत्येक वेक्टर के लिए मान है)
असंख्य उपकरण उपलब्ध हैं (शुरुआत के लिए, KDnuggets पर सॉफ़्टवेयर सूची देखें: http://www.kdnuggets.com/software/index.html)। यद्यपि आपकी समस्या का विवरण उनमें से कुछ को समाप्त करता है, फिर भी एक संख्या शेष है जो पर्याप्त हो सकती है। मुझे यकीन नहीं है कि, वास्तव में, ".NET के साथ अच्छी तरह से खेलें" का मतलब है, लेकिन किसी भी सार्थक टूल को मॉडल की एक रिपोर्ट या स्रोत कोड प्रदान करना चाहिए जिसे आसानी से .NET कोड में अनुवादित किया जा सकता है। – Predictor
लिंक के लिए धन्यवाद, जैसे ही मैंने इसे लिखा है, इसे जांच लेंगे। .NET के साथ अच्छी तरह से खेलने के लिए इसका मतलब है कि नौकरी शुरू करने के लिए प्रोग्राम करने योग्य इंटरफ़ेस वाला कुछ या यह भी .NET लाइब्रेरी (या उपयोग करने योग्य रैपर) है जो कुछ नहीं है। – em70