में उपयोग करने योग्य सबसे तेज़ एसवीएम कार्यान्वयन मैं पाइथन में कुछ पूर्वानुमान मॉडल तैयार कर रहा हूं और विज्ञान के सीखने के एसवीएम कार्यान्वयन का उपयोग कर रहा हूं। यह वास्तव में महान, उपयोग करने में आसान, और अपेक्षाकृत तेज़ रहा है।पायथन
दुर्भाग्यवश, मैं अपने रनटाइम से बाध्य होना शुरू कर रहा हूं। मैं 650 फीचर्स के साथ लगभग 4-5000 के पूर्ण डेटासेट पर आरबीएफ एसवीएम चलाता हूं। प्रत्येक रन में लगभग एक मिनट लगते हैं। लेकिन 5 गुना क्रॉस सत्यापन + ग्रिड सर्च (ठीक खोज के लिए मोटे का उपयोग करके) के साथ, यह मेरे काम के लिए थोड़ा सा असफल हो रहा है। तो आम तौर पर, क्या लोगों को पाइथन में उपयोग किए जा सकने वाले सबसे तेज़ एसवीएम कार्यान्वयन के मामले में कोई सिफारिशें हैं? वह, या मेरे मॉडलिंग को गति देने के किसी भी तरीके?
मैंने LIBSVM के GPU कार्यान्वयन के बारे में सुना है, ऐसा लगता है कि यह काम कर सकता है। मुझे पाइथन में उपयोग करने योग्य किसी अन्य जीपीयू एसवीएम कार्यान्वयन के बारे में पता नहीं है, लेकिन यह निश्चित रूप से दूसरों के लिए खुला होगा। साथ ही, GPU का उपयोग करके रनटाइम में काफी वृद्धि होती है?
मैंने यह भी सुना है कि विज्ञान में रैखिक एसवीएम + फीचर मैप का उपयोग करके आरबीएफ एसवीएम को अनुमानित करने के तरीके हैं। यह सुनिश्चित नहीं है कि लोग इस दृष्टिकोण के बारे में क्या सोचते हैं। फिर, इस दृष्टिकोण का उपयोग करने वाले किसी भी व्यक्ति, क्या यह रनटाइम में एक महत्वपूर्ण वृद्धि है?
कार्यक्रम की गति बढ़ाने के लिए सभी विचारों का स्वागत है।
धन्यवाद ओग्रीसेल। मैं इसे देख लूंगा। निश्चित रूप से दिलचस्प लग रहा है। Sklearn एसवीएम प्रकाश प्रारूप में निर्यात कर सकते हैं? यह निश्चित रूप से उपयोगी होगा। आपके पूर्व उत्तर के जवाब में, दुर्भाग्यवश, मैं टाइम्सरीज़ से निपट रहा हूं, इसलिए यादृच्छिक नमूनाकरण + ट्रेन/टेस्ट में थूकना थोड़ा और जटिल हो जाता है। यकीन नहीं है कि मेरे मॉडल को प्रशिक्षित करने के लिए subsampling सब सीधा होगा। धन्यवाद! – tomas
क्षमा करें त्वरित जोड़ों ogrisel, क्या आप जानते हैं कि sklearn में उपयोगिता समारोह एसवीएम प्रकाश प्रारूप में निर्यात कर सकते हैं? – tomas
वास्तव में यह दस्तावेज़ से गायब है लेकिन यह वहां है: https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/datasets/svmlight_format.py#L142 – ogrisel