6

मेरे पास संगीतकारों की वेबसाइटों से कई .jpeg हैं। इन छवियों में आगामी शो और बैंड फोटो (वास्तविक जीवन में बैंड की तस्वीरें) के लिए पोस्टर शामिल हैं।मैं कैसे पता लगा सकता हूं कि एक फोटो एक पोस्टर है (यथार्थवादी नहीं)?

यहाँ एक उदाहरण पोस्टर है:

enter image description here

मैं किसी भी आधुनिक तकनीक या एल्गोरिदम में अच्छी तरह से वाकिफ नहीं कर रहा हूँ (? यदि वे मौजूद), लेकिन यह है कि मैं क्या सोचा था कि मैं के लिए लग सकता है है:

  • छवि में टेक्स्ट आमतौर पर एक पोस्टर का मृत त्याग होता है।
  • शायद यथार्थवादी तस्वीरें (यानी गैर-पोस्टर) एक अलग रंग वितरण का पालन करें?
  • पोस्टर शायद उनमें चेहरे होने की संभावना कम है - लेकिन यह एक बहुत ही कमजोर दावा है।

क्या कोई वर्गीकरण एल्गोरिदम है जो यह पता लगा सकता है कि कोई छवि पोस्टर है या नहीं?

उत्तर

11

आपका प्रश्न बहुत व्यापक है। पोस्टर या फोटो अच्छी तरह से परिभाषित वस्तु नहीं है। एक पोस्टर क्या है? वास्तविक जीवन में, पोस्टर अक्सर फोटो, या फोटो का संयोजन, या थोड़ा सुधारित फोटो होते हैं।

यदि हम आपके प्रश्न के पहले भाग में प्रस्तुत करने के लिए संकुचित हैं - बैंड फोटो बनाम आगामी पोस्टर्स पोस्ट करते हैं, तो जवाब है - शायद हां (भले ही मैंने इसे कभी भी नहीं देखा)। जैसा कि आप एक बाइनरी क्लासिफायरफायर की तलाश में हैं, मैं कुछ मशीन लर्निंग मॉडल लेने का सुझाव दूंगा (बेवकूफ बेयस पर्याप्त होना चाहिए, लेकिन यदि आप अधिक जटिल सुविधाओं का उपयोग करना चाहते हैं तो एसवीएम, ईएलएम, या कुछ यादृच्छिक वन/निर्णय वृक्ष का प्रयास करें) और इसे लागू करें

बाइनरी विशेषताएं:: डेटा वाली वैक्टर में एन्कोड करने के लिए

  • "वहाँ छवि पर किसी भी शब्द है?" - आप बाहरी पाठ का पता लगाने एल्गोरिथ्म
  • की आवश्यकता होगी "वहाँ छवि पर एक नंबर है" - घटनाओं दिनांकों होना चाहिए
  • "वहाँ छवि पर एक तारीख है" "वहाँ छवि पर कोई चेहरा है"

अनुभवहीन Bayes का उपयोग करते हुए सशर्त propabilities P(poster|there is a word) का निर्माण होगा, P(poster|there is a number) आदि जो केवल आप एक वर्गीकारक नहीं दे देंगे, लेकिन यह भी कितना महत्वपूर्ण रहे हैं अपने featuers (संभावना 0.5 के पास एक सुझाव है, कोई विशेष सुविधा है कि कुछ ऐसी जानकारियां दी निकम्मा)।

मैं संभावित फ़ोटो, फोटो सत्र शैलियों इत्यादि की विस्तृत श्रृंखला के कारण हिस्टोग्राम इत्यादि का उपयोग नहीं करता। जब तक कि आप वास्तव में बड़े प्रशिक्षण सेट को तैयार नहीं करना चाहते हैं।

यदि यह पर्याप्त नहीं है, तो आप इन्हें अधिक जटिल सुविधाओं में बदल सकते हैं और अधिक शक्तिशाली क्लासिफायरफायर तब बेइव्स का उपयोग कर सकते हैं।

परिसर विशेषताएं:

  • कितने शब्द छवि पर देखते हैं?
  • छवि पर कितने संख्याएं हैं?
  • छवि पर कितने तिथियां हैं?
  • छवि पर कितने चेहरे हैं?
  • छवि हिस्टोग्राम

और एक अंतिम विकल्प, अगर सब कुछ विफल रहता है, तो आप कुछ आधुनिक मॉडल को प्रशिक्षित करने, कच्चे छवियों पर दीप विश्वास नेटवर्क की तरह की कोशिश कर सकते। इसे गंभीर कम्प्यूटेटियल शक्ति की आवश्यकता होगी, लेकिन वैज्ञानिक समुदाय के लिए परिणाम भी बहुत मूल्यवान होंगे।

संबंधित मुद्दे

 संबंधित मुद्दे