कई अन्य डेवलपर्स के रूप में, मैंने खुद को ऐप्पल की नई एआरकेट तकनीक में गिरा दिया है। यह बहुत अच्छा है। हालांकि, एक विशिष्ट प्रोजेक्ट के लिए, मैं दृश्य में (वास्तविक जीवन) छवियों को पहचानने में सक्षम होना चाहता हूं, या तो उस पर कुछ प्रोजेक्ट करने के लिए (जैसे वोफोरिया अपनी लक्षित छवियों के साथ करता है), या किसी ईवेंट को ट्रिगर करने के लिए इसका उपयोग करने के लिए मेरे आवेदन मेंऐप्पल विजन छवि पहचान
इसे पूरा करने के तरीके पर मेरे शोध में, मैंने ऐप्पल द्वारा विजन और कोरएमएल फ्रेमवर्क पर ठोकर खाई। यह आशाजनक प्रतीत होता है, हालांकि मैं अभी तक अपने सिर को लपेटने में सक्षम नहीं हूं।
जैसा कि मैं इसे समझता हूं, मुझे विजन फ्रेमवर्क का उपयोग करके आयताकारों को ढूंढकर और कोरम मॉडल में उन्हें खिलाकर वही करना चाहिए जो कि मॉडल मॉडल में पूर्वनिर्धारित लक्षित छवियों से तुलना करता है। इसके बाद यह उस लक्ष्य छवि को थूकने में सक्षम होना चाहिए।
हालांकि यह मेरे सिर में अच्छा लगता है, मुझे अभी तक ऐसा करने का कोई तरीका नहीं मिला है। मैं इस तरह के मॉडल बनाने के बारे में कैसे जाउंगा, और यह भी संभव है?
मजेदार, मैं सोच रहा था कि यह वास्तव में कल कैसे काम करता है। पूछने के लिए धन्यवाद! – LinusGeffarth