7

मैं अलग-अलग डेटा क्लस्टरिंग एल्गोरिदम के साथ खेल रहा हूं जो नोड्स का प्रतिनिधित्व करने वाले यादृच्छिक डेटा बिंदुओं के बीच क्लस्टर ढूंढने पर काम कर रहा है, मैं पढ़ता रहता हूं कि डेटा क्लस्टरिंग छवि पहचान के लिए उपयोग की जाती है। मैं कनेक्शन बनाने में असफल रहा हूं, क्लस्टरिंग डेटा किसी छवि को पहचानने या चेहरे की पहचान में कैसे मदद करता है। क्या कोई इसे समझा सकता है?छवि क्लस्टरिंग छवि या पैटर्न पहचान में मदद करता है

उत्तर

12

यह कोई आश्चर्य की बात है कि क्लस्टरिंग बड़े पैमाने पर पैटर्न मान्यता के लिए प्रयोग किया जाता है, और विशेष रूप से छवि मान्यता है: क्लस्टरिंग एक को कम करने की प्रक्रिया है, और इस मेगापिक्सेल युग जरूरत में छवियों नीचे उबलते ... यह भी एक प्रक्रिया है जो श्रेणियों का उत्पादन और यह निश्चित रूप से उपयोगी है।

हालांकि छवि पहचान के लिए तकनीक के रूप में क्लस्टरिंग के उपयोग के कई दृष्टिकोण हैं। इस विविधता के कारणों में से एक यह है कि अलग-अलग उद्देश्यों के लिए क्लस्टरिंग को विभिन्न स्तरों पर लागू किया जा सकता है: वर्गीकरण के लिए या अन्य उद्देश्यों के लिए, मूल पिक्सेल स्तर से फीचर लेवल (फीचर एक लाइन, एक ज्यामितीय आंकड़ा ...) से।

बहुत उच्च स्तर पर, क्लस्टरिंग एक सांख्यिकीय उपकरण है, यह किसी विशेष श्रेणी से संबंधित किसी विशेष श्रेणी को परिभाषित करने में विभिन्न आयामों के सापेक्ष महत्व की खोज करने में मदद करता है।

एक [कई की] इस तरह के एक उपकरण के उपयोग [एस], है सीखने पर्यवेक्षण, जिससे (छवियों कहते हैं) मानव चयनित आइटम का एक सेट क्लस्टर आधारित तर्क में खिलाया जाता है के साथ, किसी विशेष आइटम से जुड़े लेबल के साथ ("यह एक सेब है", "यह एक और सेब है", "यह नींबू है" ...), क्लस्टरिंग तर्क तब निर्धारित करता है कि इनपुट के प्रत्येक आयाम में मदद के लिए कितना महत्वपूर्ण है वस्तुओं के प्रत्येक समूह (सेब, नींबू ...) एक विशिष्ट समूह में फिट होते हैं (उदाहरण के लिए रंग अपेक्षाकृत कम मायने रखता है, लेकिन आकार, या बिंदुओं की उपस्थिति, या जो कुछ भी हो सकता है)। इस प्रशिक्षण चरण के बाद, नई छवियों को तर्क में खिलाया जा सकता है और यह देखकर कि यह छवि गिरती है, यह एक विशिष्ट क्लस्टर के करीब कितना करीब है, यह "मान्यता प्राप्त" है (केले के रूप में!)।

जब छवि प्रसंस्करण की बात आती है तो किसी को यह याद रखना होगा कि जो भी क्लस्टरिंग तर्क में "खिलाया गया" है, वह आवश्यक रूप से कच्चे पिक्सल (वास्तव में, शायद ही कभी) नहीं है, लेकिन विभिन्न "ऑब्जेक्ट्स" के विभिन्न "तत्व" को चित्रित करना मूल डेटा (अनिवार्य रूप से अपेक्षाकृत उच्च आयाम वैक्टर का संग्रह, कुछ अन्य लोगों के विपरीत नहीं जो किसी अन्य डेटा क्लस्टरिंग उदाहरणों में सामने आ सकते हैं), और प्रक्रिया के पिछले चरणों द्वारा उत्पादित किया गया है। उदाहरण के लिए चेहरे की पहचान का एक महत्वपूर्ण तत्व शायद आंखों के केंद्र के बीच सटीक दूरी है। पिछले चरणों में, छवि को इस तरह से संसाधित किया जाता है कि आंखें कहां से आती हैं (संभावित रूप से किसी अन्य क्लस्टरिंग-आधारित तर्क पर निर्भर)। फिर आंखों के बीच की दूरी, कई अन्य तत्वों के साथ अंतिम क्लस्टरिंग तर्क को खिलाया जाता है।

पिछला वर्णन छवि पहचान के लिए क्लस्टरिंग के उपयोग का केवल एक उदाहरण है। दरअसल, इस डोमेन में, तंत्रिका नेटवर्क के विभिन्न रूपों का बहुत सफलतापूर्वक उपयोग किया गया है, और यह तर्क दिया जा सकता है कि एक अर्थ में इन तंत्रिका नेटवर्क क्लस्टरिंग जानकारी हैं। तंत्रिका जाल की सफलता के कारणों में से एक कारण इलाके आयाम के मूल इनपुट में पाया गया है, और पदानुक्रमित फैशन में काम करने की उनकी क्षमता के प्रति अधिक सम्मान करने की क्षमता में पड़ सकता है।

इस लेखन के लिए एक अच्छा निष्कर्ष ऑनलाइन संसाधनों की एक छोटी सूची होगी, लेकिन मुझे इस समय समय के लिए दबाया गया है ..."जारी रखा जाएगा" ;-)

अगले दिन संपादित: (असफल विषय पर एक परिचयात्मक ऑनलाइन ग्रंथ सूची प्रदान करने के लिए प्रयास)

क्लस्टरिंग के विषय पर साहित्य के लिए मेरे खोज कृत्रिम दृष्टि के लिए लागू के रूप में और इमेज प्रोसेसिंग पता चला दो अलग-अलग ... समूहों ;-)

    ऐसी छवि प्रसंस्करण और कंप्यूटर दृष्टि जम्मू Parkey पब विले के लिए एल्गोरिदम, या मशीन विजन के रूप में
  • पुस्तकें: थ्योरी, एल्गोरिदम, चलन एम सेल एट। अल कैम्ब्रिज यूपी। ऐसी किताबें आम तौर पर शोर में कमी, एज पहचान, रंग या तीव्रता रूपांतरण, और छवि प्रसंस्करण श्रृंखला के कई अन्य तत्वों से जुड़ी सभी महत्वपूर्ण तकनीकों को कवर करती हैं, जिनमें से अधिकांश क्लस्टरिंग या यहां तक ​​कि सांख्यिकीय विधियों को शामिल नहीं करती हैं, और वे केवल एक अध्याय आरक्षित करते हैं या पैटर्न, या अन्य कार्यों के लिए लागू होने के रूप में, क्लस्टरिंग के लिए दो, या यहां तक ​​कि मामूली उल्लेख।
  • विद्वानों के कागजात और सम्मेलन हैंडबुक, जो विशेष रूप से कृत्रिम दृष्टि पर लागू क्लस्टरिंग तकनीकों को कवर करते हैं, और सबसे कम और गहन फैशन में (उदा: फुकुनगा और नरेंद्र एल्गोरिदम पर बदलाव, चरित्र पहचान में अनुप्रयोगों के लिए, या चयन के लिए तेज़ तरीके जो भी संदर्भ में निकटतम पड़ोसी उम्मीदवारों का।)

संक्षेप में मुझे कोई विशिष्ट पुस्तक या आलेख सुझाव देने के लिए बीमार लग रहा है।

आपको Google पुस्तकें कहने में शीर्षक, "कृत्रिम दृष्टि" या "छवि पहचान" या कुछ या ऊपर वर्णित शीर्षकों में शीर्षक ब्राउज़ करने के लिए जानकारी मिल सकती है। "इस पुस्तक के बारे में" लिंक में पाए गए पूर्वावलोकन सुविधा और टैग क्लाउड (क्लस्टरिंग का एक अन्य अनुप्रयोग) के साथ, कोई भी विभिन्न पुस्तकों की सामग्री का अच्छा विचार प्राप्त कर सकता है और शायद उनमें से कुछ खरीदने का फैसला कर सकता है। दुर्भाग्यवश कम पाठक और क्षेत्र में संभावित रूप से आकर्षक अनुप्रयोग इन पुस्तकों को अपेक्षाकृत महंगे बनाते हैं। स्पेक्ट्रम के दूसरे छोर पर, आप कभी-कभी मुफ्त में, क्षेत्र में उन्नत विषयों पर चर्चा करने वाले शोध पत्र डाउनलोड कर सकते हैं। ये नियमित (वेब) Google, या विशेष भंडारों जैसे CiteSeer पर भी दिखाई देंगे।

उस क्षेत्र में अपनी खोज के साथ शुभकामनाएं!

+0

ty, अगले भाग की प्रतीक्षा – anon

संबंधित मुद्दे