2009-12-15 11 views
5

के लिए छवि पहचान मैं एक ऐप विकसित करने की सोच रहा हूं जो छवि पहचान प्रणाली होने से लाभ उठा सकता है। मैंने आईफोन और एंड्रॉइड ऐप में इस तरह की चीज देखी है। एक पुस्तक की एक तस्वीर लें और ऐप आपको अमेज़ॅन ले जाता है जहां आप वह पुस्तक पा सकते हैं। मैं सामान्य छवि पहचान की तलाश नहीं कर रहा हूं, लेकिन लगभग 10k छवियों की लाइब्रेरी से एक छवि को चुनने की क्षमता अधिक है।एंड्रॉइड/आईफोन

इस तरह की चीज़ों के लिए कौन सी सेवाएं उपलब्ध हैं?

+0

छवि पहचान कंप्यूटर विजन का एक विशाल उप-क्षेत्र है, यह किसी भी सटीक एल्गोरिदम सिफारिशों से पहले पहचान के साथ हल करने के इरादे से संबंधित समस्या के बारे में अधिक जानने में मदद करेगा (परिपक्व और अत्यधिक प्रभावी कंप्यूटर्स दृष्टि तकनीकों में से कई कुछ हद तक विशिष्ट डोमेन में समस्याएं हल करें)। – JasonWyatt

+0

जो मैं वास्तव में देख रहा हूं वह लोकप्रिय व्यापार कार्ड गेम जैसे मैजिक द गदरिंग से कार्ड खेलने की छवियों को लेने की क्षमता है, और कार्ड पर डेटा खींच सकता है, या शायद डेटाबेस से मूल्य खींच सकता है। मैं उपयोगकर्ताओं की कार्ड की छवि लेने के लिए सेल फोन कैमरा का उपयोग करने की क्षमता चाहता हूं, और उसके बाद उस कार्ड के डेटा को डेटाबेस से बाहर खींचें। तो सभी छवियां 2 डी होने जा रही हैं। और डेटासेट लगभग 10k विकल्प या तो काफी छोटा होगा। –

उत्तर

1

Google Goggles कुछ अमेज़ॅन यादगारों के समान कुछ करता है। यदि टेक्स्ट की पहचान की जा सकती है तो यह ओसीआर का उपयोग करता है और वे इसे Google छवियों से समान छवि खोज के साथ उपयोग करना चाहते हैं। मुझे लगता है कि वे इस छवि के साथ किसी छवि के लिए हैश उत्पन्न करते हैं कि यदि छवियां समान हैं तो छवियां समान हैं।

मेरा सबसे अच्छा अनुमान चरित्र पहचान से शुरू करने और अपने कार्ड के शीर्षक के लिए एक टेक्स्ट खोज करने का प्रयास करेगा। इसका मतलब है कि आपके उपयोगकर्ता को एक विशिष्ट स्थिति में भी एक बहुत स्पष्ट छवि बनाना है। लेकिन पहले आवेदन के लिए यह पहले से ही बहुत अच्छा होगा। जैसे कोई जादू खेल रहा है, मैं अपने कार्डों को व्यापार और सूचीकरण के लिए टूल खरीदूंगा।

+0

यह एक अच्छा विचार है ... मैंने ओसीआर मान्यता के हिस्से के बारे में नहीं सोचा था। यह निश्चित रूप से चीजों को सरल बना देगा और उपयोगकर्ता को तस्वीर में पूरा कार्ड नहीं होने की अनुमति देगा। –

1

असल में, वास्तविक अमेज़ॅन कर्मचारी को आपको यह बताने का कोई तरीका नहीं है कि मैं इसकी पुष्टि करने का कोई तरीका नहीं हूं, मैं निश्चित रूप से निश्चित हूं कि अमेज़ॅन यादगार विशेषताएं वास्तव में भीड़ के काम का काम करती हैं- बहुत से लोगों का सामना करना डेटा के माध्यम से इसे कंप्यूटर की तरह दिखने के लिए यह कर रहा है। मुझे लगता है कि वे वास्तव में Mechanical Turk सिस्टम का उपयोग कर सकते हैं।

संपादित करें: इसके अलावा, मुझे this SO question मिल गया जो आपको रूचि दे सकता है। यह विशेष रूप से कार्ड खेलने के लिए है, लेकिन कुछ जवाब (जैसे कि मशीन लर्निंग उदाहरण) को जादू कार्ड के साथ क्या करना है, इसके लिए और अधिक सहायक होने के लिए संशोधित किया जा सकता है।

+0

अच्छी तरह से विचार करते हुए कि पूरी प्रक्रिया 10 सेकंड से कम लेती है ... मुझे संदेह है कि यह है। जब तक छवि अमेज़ॅन को प्रेषित की जाती है, और नया पृष्ठ वापस भेज दिया जाता है, हम प्रसंस्करण समय में लगभग 1-2sec देख रहे हैं, जो एक तेज़ तुर्क होना चाहिए। –

+0

यदि आप उस पर एक स्पष्ट शीर्षक के साथ कुछ की तस्वीर लेते हैं (जिसे लगभग किसी भी समय मानव द्वारा पहचाना जा सकता है), हाँ इसमें केवल 10 सेकंड लगते हैं। यादृच्छिक वस्तु की तस्वीर लेने का प्रयास किया, इसमें काफी समय लगता है। इसके अलावा, Google अमेज़ॅन रिमेम्बर और मैकेनिकल तुर्क, आपको उन हिट मिलेगी जहां लोगों ने सिस्टम का परीक्षण किया है और पुष्टि की है कि कम से कम कुछ समय वे मैकेनिकल तुर्क सिस्टम का उपयोग कर रहे हैं। अमेज़ॅन ने कभी नहीं कहा है कि वे अमेज़ॅन यादगार कैसे करते हैं, इसलिए यह अनुमान है। मेरा एकमात्र बिंदु यह है कि अमेज़ॅन याद रखने वाले कम से कम हिस्से को फिक्र किया जाता है, इसलिए वे सबसे अच्छा उदाहरण नहीं हो सकते हैं। –

 संबंधित मुद्दे

  • कोई संबंधित समस्या नहीं^_^