5

मैं अपनी तस्वीर में एक निश्चित वस्तु की तलाश कर रहा हूं:विशिष्ट वस्तु/छवि पहचान कार्य के लिए सर्वश्रेष्ठ दृष्टिकोण?

ऑब्जेक्ट: मध्य में एक एक्स के साथ एक आयत की रूपरेखा। यह एक आयताकार चेकबॉक्स की तरह दिखता है। बस इतना ही। तो, कोई लाइन नहीं, बस लाइनें। आयताकार की लंबाई चौड़ाई से समान अनुपात होगी लेकिन यह तस्वीर में कोई आकार या कोई रोटेशन हो सकता है।

मैंने छवि पहचान दृष्टिकोण का एक पूरा समूह देखा है। लेकिन मैं इस विशिष्ट कार्य के लिए सर्वश्रेष्ठ निर्धारित करने की कोशिश कर रहा हूं। सबसे महत्वपूर्ण बात यह है कि वस्तु रेखाओं से बना है और एक भरे आकार नहीं है। इसके अलावा, कोई परिप्रेक्ष्य विरूपण नहीं है, इसलिए आयताकार वस्तु हमेशा फोटोग्राफ में सही कोण रखेगी।

कोई विचार? मैं ऐसा कुछ उम्मीद कर रहा हूं जिसे मैं काफी आसानी से कार्यान्वित कर सकता हूं।

धन्यवाद सब कुछ।

+0

एक्स का विमान हमेशा मुझे लगता है कि छवि के विमान के समानांतर होगा? तो एक्स का कोई परिप्रेक्ष्य विकृति नहीं है? –

+0

अद्यतन प्रश्न, ऊपर देखें। (बिल्कुल कोई विकृति नहीं, दृष्टिकोण ऑब्जेक्ट के लिए पूरी तरह से ऑर्थोगोनल होगा, मुझे उम्मीद है कि शब्दावली सही है, लेकिन मुझे लगता है कि आप जानते हैं कि मेरा क्या मतलब है)। – Ryan

उत्तर

0

आप छवि में ऑब्जेक्ट की पहचान करने के लिए स्थानीय सुविधाओं का उपयोग कर सकते हैं। Feature detection wiki

उदाहरण के लिए, आप कुछ रेफरेंस छवि पर विशेषताओं की गणना कर सकते हैं जिसमें केवल उस ऑब्जेक्ट को शामिल किया गया है जिसे आप ढूंढ रहे हैं और परिणामों को सहेजते हैं, मान लीजिए, एक सादे पाठ फ़ाइल में। उसके बाद आप रेफरेंस वाले लोगों के साथ नई गणना की गई विशेषताओं (ऑब्जेक्ट वाले कुछ जटिल दृश्यों वाली छवियों) की तुलना करके ऑब्जेक्ट की खोज कर सकते हैं।

यहाँ स्थानीय सुविधाओं पर कुछ अच्छा संसाधन है: Local Invariant Feature Detectors: A Survey

3

आप कर सकते थे एक कोने डिटेक्टर (जैसे हैरिस) का उपयोग करते हुए बॉक्स के कोनों, समाप्त होता है और एक्स के चौराहे यही समस्या को सरल खोजने की कोशिश सही विन्यास में अंक खोजने के लिए।

संपादित करें (प्रतिक्रिया टिप्पणी करने के लिए):

मैं आप अपनी छवि में कोने अंक प्राप्त कर सकते हैं यह सोचते हैं रहा हूँ, आयत के 4 कोनों, एक्स के 4 लाइन अंत और एक्स का केंद्र है, पृष्ठभूमि में शोर या वस्तुओं के कारण छवि में कुछ अन्य कोनों। इससे बिंदुओं के दिए गए सेट से, सही कॉन्फ़िगरेशन में 9 अंकों का सेट ढूंढने में समस्या को सरल बना दिया जाता है।

मेरा पहला प्रयास प्रत्येक कोने बिंदु ए को देखने के लिए होगा। फिर मैं ए के करीब बिंदु बी पर फिर से शुरू करूंगा। अगर मुझे लगता है कि (उदाहरण के लिए) ए आयत के ऊपरी बाएं कोने है और बी है निचले दाएं कोने में, मैं आसानी से गणना कर सकता हूं, जहां मैं छवि में अन्य कोने बिंदुओं की अपेक्षा करता हूं। मैं कुछ निकटतम पड़ोसी खोज (या FLANN जैसी लाइब्रेरी) का उपयोग यह देखने के लिए करता हूं कि वहां कोनों हैं जहां मैं उनसे अपेक्षा करता हूं। अगर मुझे उन बिंदुओं का एक सेट मिल सकता है जो इन अपेक्षित स्थितियों से मेल खाते हैं, तो मुझे पता है कि प्रतीक कहां होगा, अगर यह छवि में मौजूद है।

आपको यह प्रयास करना होगा कि यह आपके आवेदन के लिए पर्याप्त है या नहीं। यदि आपके पास बहुत अधिक झूठे सकारात्मक हैं (अन्य वस्तुओं के कोनों का सेट जो गोपनीय रूप से आयताकार + एक्स बनाते हैं), तो आप जांच सकते हैं कि रेखाएं हैं (यानी सही दिशा में उच्च विपरीत) जहां आप उन्हें उम्मीद करेंगे। और आप जांच सकते हैं कि कम विपरीत है जहां पैटर्न में कोई लाइन नहीं है। एक बार जब आप उस वस्तु में बिंदुओं को जानते हैं जो उस ऑब्जेक्ट में कोनों/रेखा समाप्ति से मेल खाते हैं, तो यह अपेक्षाकृत सरल होना चाहिए।

+0

क्या आप कोने या किनारे का पता लगाने के बाद "खोज" को निष्पादित करने के तरीके पर कुछ और बता सकते हैं। क्योंकि मैंने दोनों को लागू किया है और देख सकता हूं कि यह निश्चित रूप से ऑब्जेक्ट सुविधाओं को उठाता है। लेकिन एल्गोरिदम चलाने में सक्षम होने में मेरा अगला कदम क्या है और यह या तो सत्य या गलत लौटा है कि ऑब्जेक्ट इस दी गई तस्वीर में रहता है या नहीं। वास्तविक विशेषता "खोज" वह है जो मैं कमजोर हूं। धन्यवाद। – Ryan

1

मैं Generalized Hough Transform का सुझाव दूंगा। ऐसा लगता है कि आपके पास काफी सरल, निश्चित आकार है। सामान्यीकृत हफ़ ट्रांसफॉर्म उस आकार को छवि में किसी भी घूर्णन या पैमाने पर पहचानने में सक्षम होना चाहिए। हालांकि, आपको मूल छवि को थ्रेसहोल्ड करने की आवश्यकता है, या इस विधि को उपयोगी होने के लिए इसे किसी भी तरीके से प्री-प्रोसेस करना है।

संबंधित मुद्दे