5

साथ ImageNet मॉडल प्रशिक्षित करने के लिए कई महीने साथ काम करने के बाद की कोशिश कर रहा है, मैं अपने स्वयं के मॉडल को सफलतापूर्वक प्रशिक्षित करने में सक्षम किया गया है। उदाहरण के लिए मेरे अपने मॉडल से आगे, मैं 1000 कक्षाओं के साथ ImageNet को प्रशिक्षित करने में सक्षम हूं।क्षेत्र सीएनएन (आर-सीएनएन)

अब मेरी परियोजना में, मैं अपनी रुचि वर्ग के क्षेत्र को निकालने की कोशिश कर रहा हूं। इसके बाद मैंने Fast R-CNN के डेमो को संकलित और चलाया है और यह ठीक काम करता है, लेकिन नमूना मॉडल में केवल 20 वर्ग होते हैं और मैं अधिक कक्षाएं लेना चाहता हूं, उदाहरण के लिए उन सभी को।

मैं पहले से ही ImageNet की bounding boxes डाउनलोड किया है, वास्तविक छवियों के साथ।

अब, मैं खाली चले गए हैं, मैं अगले चरणों को समझ नहीं सकता है और वहाँ इसे कैसे करना के प्रलेखन नहीं है। मुझे मिली एकमात्र चीज़ यह है कि आईएनआरआईए व्यक्ति मॉडल को कैसे प्रशिक्षित किया जाए, और वे डेटासेट + एनोटेशन + पायथन स्क्रिप्ट प्रदान करते हैं।

मेरे प्रश्न हैं:

  • है कि मैं नहीं छूटा है वहाँ शायद किसी भी ट्यूटोरियल या गाइड है?
  • क्या पहले से ही 1000 वर्गों के साथ प्रशिक्षित एक मॉडल है जो छवियों को वर्गीकृत करने और बाध्यकारी बक्से निकालने में सक्षम है?

अग्रिम में बहुत बहुत धन्यवाद।

सम्मान।

राफेल।

उत्तर

4

Dr Ross Girshik वस्तु का पता लगाने पर बहुत काम किया है। आप fast RCNN पर अपने विस्तृत गिट से बहुत कुछ सीख सकते हैं: आपको डेमो के साथ कैफे शाखा खोजने में सक्षम होना चाहिए। मैंने इसे स्वयं नहीं इस्तेमाल किया, लेकिन यह बहुत समझ में आता है।

एक और दिशा आपको दिलचस्प लग सकते LSDA है: कमजोर पर्यवेक्षण का उपयोग कर कई वर्गों के लिए वस्तु का पता लगाने को प्रशिक्षित करने के।

बीटीडब्ल्यू, क्या आपने faster-rcnn में देखा है?

+0

हैलो @Shai, उत्तर देने के लिए धन्यवाद। ईमानदार होने के लिए मुझे एलएसडीए या तेज़-आरसीएनएन के बारे में पता नहीं था, मैं उन दोनों को तुरंत देखने जा रहा हूं। एलएसडीए स्पष्ट दिखता है। रॉस गिरशिक के गिट का मुद्दा यह है कि मैं समझने में सक्षम नहीं हूं कि नियमित कैफे की तरह "डाउनलोड सेट" नहीं है, इसलिए यह केवल 20-कक्षाओं के साथ पूर्व-प्रशिक्षित मॉडल या ट्रेन मॉडल डाउनलोड करने की अनुमति देता है .. यदि आप उल्लेख करते हैं तो चीजें "स्पष्ट" होने पर मैं गहराई से विचार करूंगा, क्योंकि शायद मुझे कुछ विवरण मिले जो मुझे चाहिए ... बाकी ढांचे को देखेंगे और जवाब अपडेट करेंगे। धन्यवाद! –

+0

@RafaelRuiz AFAIK फास्ट-आरसीएनएन गिट में वीओसी एनोटेशन के आधार पर एक प्रशिक्षण स्क्रिप्ट (पायथन में) है, मुझे विश्वास है (= मैंने इसे स्वयं नहीं किया है) इसे अन्य एनोटेटेड सेटों के साथ भी काम में बदला जा सकता है। – Shai

+0

मैं कोशिश करूंगा, बहुत बहुत धन्यवाद। मैंने अब उस स्क्रिप्ट को देखा है, लेकिन मैं अन्य दस्तावेज के साथ उलझन में था जैसे INRIA व्यक्ति मॉडल: \ –

संबंधित मुद्दे