समानांतर नौकरियों के रूप में चलाने के लिए कैसे स्केलर टीएफआईडीएफ वेक्टरिज़र (और COUNT वेक्टरिज़र) चलाते हैं? अन्य sklearn मॉडल में n_jobs = -1 पैरामीटर के समान कुछ।स्केलर टीएफआईडीएफ वेक्टरिज़र समानांतर नौकरियों के रूप में चलाने के लिए
उत्तर
यह सीधे संभव नहीं है क्योंकि इन वेक्टरizers के लिए आवश्यक शब्दावली तक पहुंच को समानांतर/वितरित करने का कोई तरीका नहीं है।
समानांतर दस्तावेज़ वेक्टरेशन करने के लिए, HashingVectorizer
का उपयोग करें। Scikit दस्तावेज़ बैच में एक वर्गीकृत ट्रेन (और मूल्यांकन) करने के लिए इस वेक्टरिज़र का उपयोग कर an example प्रदान करते हैं। समान कार्यप्रवाह समानांतरता के लिए भी काम करता है क्योंकि समांतर श्रमिकों के बीच किसी भी संचार के बिना इनपुट शब्द उसी वेक्टर इंडेक्स में मैप किए जाते हैं।
आंशिक टर्म-डॉक मैट्रिस को अलग से गणना करें और सभी नौकरियों को पूरा करने के बाद उन्हें संयोजित करें। इस बिंदु पर आप समेकित मैट्रिक्स पर TfidfTransformer
भी चला सकते हैं।
इनपुट शर्तों की शब्दावली को संग्रहीत करने का सबसे महत्वपूर्ण दोष यह है कि यह पता लगाना मुश्किल है कि अंतिम मैट्रिक्स (यानी उलटा परिवर्तन) में कौन से कॉलम मैप किए गए हैं। एकमात्र कुशल मैपिंग एक शब्द पर हैशिंग फ़ंक्शन का उपयोग करना है यह देखने के लिए कि कौन सा कॉलम/इंडेक्स असाइन किया गया है। एक व्यस्त परिवर्तन के लिए, आपको यह सभी अद्वितीय शर्तों (यानी आपकी शब्दावली) के लिए ऐसा करने की आवश्यकता होगी।
- 1. जेनकिन्स/हडसन में समानांतर में चलाने के लिए नौकरियों को कैसे परिभाषित किया जाए?
- 2. powershell में चलाएँ एन समानांतर नौकरियों
- 3. OpenMP - जो मैं में चलाने के लिए चाहते हैं - चल रहा है समानांतर कोड समानांतर कोड
- 4. sklearn: एक वेक्टरिज़र को गति देने के लिए कैसे करें (उदाहरण के लिए Tfidfvectorizer)
- 5. सिद्धांत को समानांतर चलाने के लिए xUnit कैसे बनाएं?
- 6. सरणी के लिए लाइनों के साथ स्केलर
- 7. उपयोगकर्ता के रूप में चलाने के लिए एक डेमॉन चलाने के लिए पिड फ़ाइल संग्रहीत करना
- 8. बैच स्क्रिप्ट व्यवस्थापक के रूप में चलाने के लिए
- 9. क्वार्ट्ज.Net शेड्यूलर विंडोज सेवाओं के रूप में चलाने के लिए
- 10. मैं समानांतर में अपने एकीकरण परीक्षण चलाने के लिए जेनकींस का उपयोग कैसे कर सकता हूं?
- 11. लूप के लिए समानांतर
- 12. Heroku पर देरी की नौकरियों को मुफ्त में चलाने के लिए
- 13. स्प्रिंग बैच: विभिन्न नौकरियों के लिए अलग-अलग नौकरी लॉन्चर
- 14. साझा चर के साथ समानांतर के लिए समानांतर
- 15. क्या पृष्ठभूमि में चलाने के लिए इंगित करने के लिए लिनक्स क्रॉन नौकरियों को "&" के साथ निर्दिष्ट किया जाना चाहिए?
- 16. समानांतर रूप से समानांतर कैसे लिखें। Async विधियों के साथ
- 17. पायथन बनाम स्कैला (स्पार्क नौकरियों के लिए)
- 18. ओपनएमपी समांतर कोड में, समानांतर में मेमसेट चलाने के लिए कोई लाभ होगा?
- 19. मैं पर्ल में 'inf' मान के लिए स्केलर कैसे देखूं?
- 20. समानांतर खोज के लिए elasticsearch में EsRejectedExecutionException
- 21. डाउनस्ट्रीम नौकरियों के लिए पाइपलाइन पास पैरामीटर
- 22. ईएमआर पर यार्न स्पार्क नौकरियों को चलाने के लिए सभी नोड्स आवंटित क्यों नहीं करता है?
- 23. समानांतर प्रसंस्करण के लिए Xvfb एकाधिक डिस्प्ले?
- 24. एसक्यूएल नौकरी कैसे नौकरी चलाने के लिए?
- 25. समानांतर में चलाने के लिए "fib" लिखना: -एन 2 धीमा है?
- 26. विज्ञान और टीएफआईडीएफ का उपयोग करके विज्ञान के साथ विशेषताएं
- 27. जेनकिंस बिल्डिंग नौकरियों के लिए नियम और व्यंजन
- 28. एसक्यूएल एजेंट नौकरी - ड्रॉप डाउन सूची "के रूप में चलाने के लिए" खाली है
- 29. रेल 3 में क्रॉन नौकरियों के लिए समाधान
- 30. क्या स्पार्क में समानांतर चलाने वाले अनुप्रयोग में चरण हैं?
मुझे यह जवाब पसंद है, और मैं इसे लागू करने का प्रयास कर रहा हूं, लेकिन मैं समांतर 'हैशिंग वेक्टरोरिज़र' के परिणामों को संयोजित करने के बारे में कैसे जा सकता हूं? –
एनवीएम। मैं समझ गया। मैंने 'scipy.sparse.vstack' का इस्तेमाल किया। –
क्या आप इसी शब्दावली को वापस पाने के बारे में और बता सकते हैं? –