10

हम Google Tensorflow का उपयोग करके छवि वर्गीकरण बनाने की योजना बना रहे हैं।Google tensorflow छवि वर्गीकरण के लिए Miminum आवश्यकताएं

मुझे आश्चर्य है कि न्यूनतम क्या हैं और एक संकल्पक गहरे तंत्रिका नेटवर्क का उपयोग कर कस्टम छवि वर्गीकरण को प्रशिक्षित करने के लिए इष्टतम आवश्यकताएं क्या हैं?

सवाल विशेष रूप से कर रहे हैं:

  • कैसे वर्ग प्रति कई छवियों कम से कम प्रदान की जानी चाहिए?
  • हम appx करने की आवश्यकता है। प्रति वर्ग प्रशिक्षण छवियों की एक ही राशि प्रदान करें या प्रति वर्ग की राशि अलग हो सकती है?
  • प्रशिक्षण डेटा में गलत छवि डेटा का असर क्या है? जैसे एक टेनिस जूता की 500 छवियां और अन्य जूते के 50।
  • क्या हाल ही में प्रकाशित आरंभ-वी 3 मॉडल की तुलना में अधिक कक्षाओं के साथ वर्गीकरण को प्रशिक्षित करना संभव है? मान लें: 30.000।
+1

आप स्थापना के समय-v3 नेटवर्क परिभाषा है, ताकि आप इसे बदल सकते हैं, या बस वर्गीकरण (तैनाती संस्करण) के लिए इस्तेमाल किया छीन नीचे संस्करण है? –

उत्तर

6

"कैसे वर्ग प्रति कई छवियों कम से कम प्रदान की जानी चाहिए?"

निर्भर करता है कि आप कैसे ट्रेन करते हैं।

स्क्रैच से एक नया मॉडल, विशुद्ध रूप से देखरेख प्रशिक्षण हैं: छवियों की संख्या पर एक सामान्य नियम के लिए, यदि आप MNIST और CIFAR कार्य देख सकते हैं। ये कक्षा प्रति 5,000 छवियों के साथ ठीक काम करने लगते हैं। ऐसा है कि आप खरोंच से प्रशिक्षण कर रहे हैं।

आप शायद ImageNet पर प्रशिक्षित मॉडल के साथ अपने नेटवर्क को बूटस्ट्रैप कर सकते हैं। इस मॉडल में पहले से ही अच्छी सुविधाएं होंगी, इसलिए यह कई श्रेणियों के बिना नई श्रेणियों को वर्गीकृत करना सीखने में सक्षम होना चाहिए। मुझे नहीं लगता कि यह आपको एक विशिष्ट संख्या बताने के लिए पर्याप्त अध्ययन है।

तो लेबल हटाया गया डेटा, वर्ग प्रति शायद केवल 100 लेबल किए गए चित्र के साथ प्रशिक्षण। इस विषय पर हाल ही में बहुत से शोध कार्य हैं, हालांकि इमेजनेट के रूप में बड़े कार्यों को स्केल नहीं करते हैं। सरल लागू करने के लिए:

http://arxiv.org/abs/1507.00677 

जटिल लागू करने के लिए: "।? हम appx करने की आवश्यकता है प्रति कक्षा प्रशिक्षण छवियों का एक ही राशि प्रदान करते हैं या वर्ग प्रति राशि भिन्न हो सकता है"

http://arxiv.org/abs/1507.02672 
http://arxiv.org/abs/1511.06390 
http://arxiv.org/abs/1511.06440 

यह प्रति वर्ग के विभिन्न उदाहरणों के साथ काम करना चाहिए।

"प्रशिक्षण डेटा में गलत छवि डेटा का असर क्या है? उदाहरण के लिए टेनिस जूते और 50 अन्य जूते के 500 छवियां।"

आप लेबल चौरसाई तकनीक इस पत्र में वर्णित का उपयोग करना चाहिए:

http://arxiv.org/abs/1512.00567 

लेबल त्रुटि दर के अपने अनुमान के आधार पर लेबल चिकना।

"क्या हाल ही में प्रकाशित आरंभ-वी 3 मॉडल की तुलना में अधिक कक्षाओं के साथ वर्गीकरण को प्रशिक्षित करना संभव है? मान लें: 30.000।"

हाँ

+0

क्या इंसेप्शन-वी 3 प्रशिक्षण-समय नेट उपलब्ध है (सभी प्रशिक्षण पैरामीटर के साथ)? –

4

कैसे वर्ग प्रति कई छवियों कम से कम प्रदान की जानी चाहिए?

क्या हमें एपएक्स की आवश्यकता है। प्रति वर्ग प्रशिक्षण छवियों की एक ही राशि प्रदान करें या प्रति वर्ग की राशि अलग हो सकती है?

प्रशिक्षण डेटा में गलत छवि डेटा का असर क्या है? जैसे एक टेनिस जूता की 500 छवियां और अन्य जूते के 50।

ये तीन प्रश्न वास्तव में TensorFlow विशिष्ट नहीं हैं। लेकिन संक्षिप्त उत्तर है, यह असंतुलित डेटा सेट और शोर लेबल से निपटने में अपने मॉडल के लचीलेपन पर निर्भर करता है।

यह हाल ही में प्रकाशित स्थापना के समय-v3 मॉडल की तुलना में अधिक वर्गों के साथ एक वर्गीकारक प्रशिक्षित करने के लिए संभव है? मान लें: 30.000।

हां, निश्चित रूप से। इसका मतलब एक बहुत बड़ी वर्गीकृत परत होगी, इसलिए आपका प्रशिक्षण समय लंबा हो सकता है। इसके अलावा, टेंसरफ्लो में कोई सीमा नहीं है।

+1

मैं मानता हूं कि तीन प्रश्न वास्तव में टीएफ विशिष्ट नहीं हैं, फिर भी वे इससे संबंधित हैं। एक उचित रूप से अच्छी तरह से काम करने वाले वर्गीकरण के लिए, प्रति वर्ग कितनी प्रशिक्षण छवियां सुझाएंगी? – Jabb

संबंधित मुद्दे