2012-06-04 10 views
7

मेरे पास एन-संख्या नमूना आकार के साथ छवि होने पर क्या मतलब-stat-equation का उपयोग करना चाहिए?छवि पर सबसे पसंदीदा क्षेत्र खोजें

मुझे एक अनोखी समस्या है जिसके लिए मैं कुछ सलाह लेने की उम्मीद कर रहा था, ताकि मुझे कुछ भी याद न हो। समस्या: विभिन्न चयन अनुपात में क्षेत्रों के उपयोगकर्ता चयन के आधार पर छवि पर सबसे पसंदीदा/पसंद/महत्वपूर्ण क्षेत्र ढूंढने के लिए।

परिदृश्य: Image of a dog पर विचार करें, और विभिन्न संकल्पों में इस छवि पर क्षेत्र का चयन करने वाले सैकड़ों उपयोगकर्ता, अधिकांश चयनों में फोकस का स्पष्ट क्षेत्र कुत्ते युक्त क्षेत्र होगा। मैं x1, x2, y1, y2 को समन्वयित कर सकता हूं और उन्हें डीबी में डाल सकता हूं, अब अगर मैं संकल्प के एक सेट में स्वचालित रूप से इस छवि के संस्करण उत्पन्न करना चाहता हूं तो मुझे अधिकतम आकर्षण के साथ क्षेत्र को पहचानने में सक्षम होना चाहिए उपयोगकर्ता तरीकों मुझे लगता है कि काम कर सकता हैं:

  1. सभी चयन और आधार है कि में चयन की औसत केंद्र बिंदु का पता लगाएं। - बहुत सरल लेकिन सटीक नहीं होगा।
  2. कुछ मीगोरिदम का उपयोग करें जैसे कि मी मीन्स या ईएम क्लस्टरिंग लेकिन मुझे नहीं पता कि कौन सा सबसे अच्छा अनुकूल होगा।

मेरी समस्या के लिए कुछ प्रतिभाशाली समाधान की ओर देख रहे

समस्या पर अधिक जानकारी: वास्तविक छवि सबसे शायद हो जाएगा एक 1024x768 छवि हो, और उस पर किए गए चयन सबसे आम का हो जाएगा मोबाइल फोन संकल्प। उद्देश्य उपयोगकर्ता चयनों के आधार पर बुद्धिमान सीखने के द्वारा स्वचालित रूप से मोबाइल फोन वॉलपेपर उत्पन्न करना है।

+0

आप क्या हासिल करने और पेश करने की उम्मीद कर रहे हैं? 5 शीर्ष बॉक्स क्षेत्रों, रंगीन "हॉटस्पॉट" क्षेत्रों या कुछ और? –

+0

वास्तविक छवि संकल्प में बहुत अधिक होगी और मैं स्वचालित रूप से उपयोगकर्ता इनपुट का उपयोग कर मोबाइल फोन के लिए वॉलपेपर जेनरेट करने की उम्मीद कर रहा हूं। – Suyash

+0

क्या परिणाम आपको पसंद करेंगे यदि 2 कोनों समान रूप से लोकप्रिय चयन क्षेत्र हैं? कोनों में से एक या उनके बीच एक क्षेत्र ले लो? –

उत्तर

2

मुझे विश्वास है कि आप दो अलग समस्याओं से ऊपर की पहचान की है:

एक: अंक की पहचान

इसके लिए आपको पहचान करने के लिए अनुमानी किसी प्रकार विकसित करने की आवश्यकता है कि क्या एक बिंदु होना चाहिए माना या नहीं।

मेरा मानना ​​है कि आपने उल्लेख किया है कि इस छवि पर सैकड़ों उपयोगकर्ता चयन स्थान होंगे? क्लस्टर के लिए सैकड़ों अंक हो सकते हैं। आउटलायर्स को छोड़कर (उन बिंदुओं को हटाकर जिन पर एक विशेष दूरी के भीतर पड़ोसियों की एक निश्चित संख्या नहीं है)

आप अपने डेटासेट को कम करने के लिए कुछ भी कर सकते हैं।


दो: अंक

मुझे विश्वास है कि कश्मीर साधन क्लस्टरिंग सबसे अच्छा इस विशेष समस्या के लिए अनुकूल होगा की क्लस्टरिंग। LINK

आपकी विशेष समस्या मानक एल्गोरिदम समझाते हुए मानक कार्टेशियन समन्वय क्लस्टरिंग उदाहरणों को बारीकी से दर्पण करने लगती है।

जो आप करने की कोशिश कर रहे हैं वह एनपी-हार्ड प्रतीत होता है, लेकिन शास्त्रीय अनुमानों से संतुष्ट होना चाहिए।

एक बार क्लस्टर्ड होने के बाद, आप उस क्लस्टर के भीतर सटीक अनुमान के लिए औसत अंक ले सकते हैं।

अलावा में:

आप डाटासेट लगता है यह पहले से ही कसकर क्लस्टर की जाएगी। (यानी अधिकांश लोग कुत्ते के चेहरे को चुनते हैं, न कि इसके धड़ के पक्ष में।) आपको स्थानीय मिनीमा से अवगत होना चाहिए। LINK ये वास्तव में आपके एल्गोरिदम में एक रिंच फेंक सकते हैं। विशेष रूप से क्लस्टर की एक छोटी संख्या के साथ। ध्यान रखें कि इसका मुकाबला करने के लिए आपको थोड़ा गतिशील प्रोग्रामिंग की आवश्यकता हो सकती है। आप आमतौर पर अपने एल्गोरिदम में कुछ भिन्नता पेश कर सकते हैं, जिससे औसत बिंदु इन स्थानीय मिनीमा के "पॉप आउट" की अनुमति दे सकते हैं। Local Minima/Maxima

आशा है कि इससे मदद मिलती है!

+0

मुझे इसे लागू करने से पहले बहुत सारे अध्ययन करना होगा, लेकिन हाँ मैंने जो कुछ सोचा और बहुत कुछ! – Suyash

+0

हाहा, मुझे पता है तुम्हारा क्या मतलब है। मैं रोबोटिक्स इंजीनियरिंग और कंप्यूटर साइंस में एक छात्र प्रमुख हूं, कृत्रिम बुद्धि में ध्यान केंद्रित करता हूं। इसलिए, यदि आपके पास $ 50ka साल अतिरिक्त है, तो मैं स्कूल में आपके लिए एक अच्छा शब्द डालूंगा – Peaches491

+1

लॉल .. अगर मेरे पास $ 50ka साल अतिरिक्त था तो मैं इस सवाल से नहीं पूछूंगा, एक किराए पर लेता अब तक टीम ..: पी – Suyash

2

मुझे लगता है कि आप अपनी समस्या से अलग तरीके से संपर्क कर सकते हैं। यदि आपने Seam Carving के बारे में नहीं सुना है तो मेरा सुझाव है कि आप इसे जांच लें, क्योंकि आपके द्वारा उपयोग किए जाने वाले डेटा के लिए यह बिल्कुल उपयुक्त है। विचार यह है कि किसी छवि को आकार देने के बजाय इसे क्रॉप करने के बजाय, आप पिक्सल के पथ को हटा सकते हैं जो आवश्यक रूप से सीधे रेखा में नहीं हैं। यह आपको 'रोचक' जानकारी को बनाए रखने के दौरान एक छवि का आकार बदलने की अनुमति देता है।

आमतौर पर आप कम से कम ऊर्जा के पथ चुनते हैं, जहां ऊर्जा यहां कुछ माप है कि मार्ग के साथ रंग/तीव्रता कितनी बदलती है। यह तब विफल हो जाएगा जब आपके पास ऐसी छवि के क्षेत्र हों जो बहुत महत्वपूर्ण हैं (कुत्ते के चेहरे की तरह), लेकिन जहां उन क्षेत्रों की ऊर्जा जरूरी नहीं है। चूंकि आपके पास उपयोगकर्ता डेटा इंगित करता है कि छवि के कौन से हिस्से बहुत महत्वपूर्ण हैं, आप प्रत्येक पिक्सेल के साथ किसी क्षेत्र का चयन करते समय प्रत्येक पिक्सेल को स्पष्ट रूप से थोड़ा ऊर्जा जोड़कर छवि के उन क्षेत्रों के चारों ओर बनाना सुनिश्चित कर सकते हैं।

This video कार्रवाई में सीम नक्काशी दिखाता है, यह देखने के लिए अच्छा है कि अगर आपको नहीं लगता कि आप इसका उपयोग करेंगे। मुझे लगता है कि यह कोशिश करने लायक है, हालांकि, मैंने इसे कुछ दिलचस्प आकार बदलने वाले अनुप्रयोगों के लिए पहले उपयोग किया है, और यह वास्तव में लागू करने में बहुत आसान है।

+0

बहुत ही रोचक! हालांकि अधिकांश छवियों में बड़े चेहरे और इंसान होंगे और इस तरह के आकार बदलने से उनके चेहरे विकृत हो जाएंगे। लेकिन निश्चित रूप से मेरे मन में इतनी सारी चीजों पर लागू है! आपका बहुत बहुत धन्यवाद! – Suyash

+0

@ सुयाशा: लेकिन यही कारण है कि आपकी स्थिति इतनी महान है, अगर आपको मनुष्यों ने आपको बताया है कि छवि के कौन से क्षेत्र महत्वपूर्ण हैं तो आप उस समस्या से बच सकते हैं। –

+0

मैं छवियों पर कुछ परीक्षण चलाऊंगा और यदि यह काम करता है तो कमाल !! मैं वर्तमान में अपने php कार्यान्वयन को देख रहा हूं, अभी तक उपयोग के कुछ भी नहीं मिला .. – Suyash

संबंधित मुद्दे