2009-01-09 17 views
5

प्रतिपादन कितना कठिन एक वस्तु की एक छवि लेने के लिए (एक पूर्वनिर्धारित वस्तु का इस मामले में), और एक एल्गोरिथ्म को विकसित जटिलता बदलती के एक पृष्ठभूमि के साथ एक तस्वीर से बाहर सिर्फ इतना है कि वस्तु कटौती करने के लिए किया जाएगा।छवि मान्यता और 3 डी

यह करने के लिए इसके अलावा, एक तस्वीर के वस्तु (जैसे कि एक घर, कार, कुत्ते - लेकिन एक प्रकार का हमेशा) एक 3 डी प्रस्तुत करना में तब्दील किया जा करने की आवश्यकता होगी। मुझे पता है कि 3 डी रेंडरिंग इंजन उपलब्ध हैं (एक लागत, मुफ्त, या कुछ खंड के साथ), लेकिन इसके लिए ऑब्जेक्ट (विषय) को काम करने के लिए सभी प्रकार के तरीकों से मापा जाना चाहिए - उदा। यदि यह एक व्यक्ति है, तो हमें ऊंचाई, कंधे के वक्रता, चेहरे की त्रिज्या, प्रत्येक उंगली की लंबाई इत्यादि मापने की आवश्यकता है

इस समस्या को हल करने की व्यवहार्यता क्या होगी? किसी को भी इस शोध क्षेत्र में विशेषज्ञता रखने वाले किसी भी अच्छे लिंक को पता है? मैंने इस समस्या के लिए ओपन सोर्स सॉल्यूशंस देखा है जो मुझे ऑब्जेक्ट को मापने की आसानी के सवाल के साथ छोड़ देता है जबकि इसे फसल करने के लिए चारों ओर ट्रेसिंग करता है।

http://benmartin3d.com/WIP/Project1/image1small.jpg,

लेकिन प्रभावी ढंग से:

धन्यवाद


अनिवार्य रूप से मैं एक 2d छवि (जो एक जटिल से अधिक ऑब्जेक्ट युक्त तस्वीर की तुलना में आसान है, आदि विशिष्ट छवि) ले जाना चाहते हैं मैं इसे 3 डी छवि में बदलना चाहता हूं, तो क्या मैं 3 डी प्रतिपादन/मॉडलिंग इंजन बनाने में शामिल नहीं करना चाहता हूं?

इसके अलावा, मैंने जो लिंक प्रदान किया है, वह कुछ गुण सेट के साथ 3 डीएस अधिकतम में जाता है, और एक रेंडर किया जाता है।

+0

ऐसा लगता है कि आपके पास अतिरिक्त जानकारी/बाधाएं हो सकती हैं जिन्हें आप साझा नहीं कर रहे हैं। सबसे पहले, पुनर्निर्माण करने के लिए आपको कम से कम दो छवियों की आवश्यकता है। दूसरा पुनर्निर्माण स्वयं पैमाने के बारे में कुछ भी नहीं बताता है। किसी छवि में किसी चीज़ का आकार निर्धारित करने के लिए आपको एक संदर्भ होना चाहिए। –

+0

बिलकुल नहीं। मैं इस क्षेत्र के बारे में कुछ भी नहीं जानता (एक सामान्य वेब डेवलपर होने वाला पहला और सबसे महत्वपूर्ण)। यही कारण है कि मैं इस समस्या को हल करने के लिए कोड की एक पंक्ति लिखने से पहले यहां राय प्राप्त कर रहा हूं और समस्या का शोध कर रहा हूं। – dotnetdev

उत्तर

4

ऐसा लगता है जैसे आप कंप्यूटर दृष्टि के डोमेन में कई चीजें करना चाहते हैं।

  1. वस्तु मान्यता
  2. 3 डी पुनर्निर्माण (छवि से 3 डी मॉडल बनाने के)
  3. छवि विभाजन (काट सिर्फ वस्तु आप पृष्ठभूमि से लेकर चिंतित हैं)
  4. (यानी पूर्वनिर्धारित वस्तु को ढूंढने)

मैंने उन्हें सबसे कठिन (मेरी सीमित समझ के अनुसार) के क्रम में क्रमबद्ध किया है। सब एक साथ मैं कहूंगा कि यह एक बहुत ही जटिल समस्या है। मैं और अधिक जानकारी के लिए निम्न विकिपीडिया लिंक पर दिखेगा:

Computer Vision Overview (Wikipedia)

The Eight Point Algorithm (for 3d reconstruction)

Image Segmentation

+1

छवि विभाजन मुश्किल नहीं है, अगर आप मान सकते हैं कि आप कुछ नियमों का पालन करते हैं तो आप क्या कर रहे हैं। उदाहरण के लिए मुझे स्कूल से याद किया गया चावल का अनाज फोटोग्राफ किया गया था क्योंकि वे एक कन्वेयर बेल्ट के साथ आगे बढ़े थे। विभाजन के माध्यम से, उनके आकार और गुणवत्ता को मापा जा सकता है। –

+1

मैं मानता हूं कि विभाजन एक बेहद सीमित वातावरण में सरल हो सकता है जैसे फैक्ट्री बहुत सजातीय वस्तुओं के साथ। लेकिन आम तौर पर वस्तुओं को विभाजित करने की समस्या मुश्किल है। –

0

मान लिया जाये कि यह संभव है, कि, बहुत मुश्किल होगा विशेष रूप से वस्तु का केवल एक ही छवि के साथ। रास्टरराइज़र को वस्तुओं की गहराई और दूरी पर अनुमान लगाना पड़ता है।

जो आप वर्णन करते हैं वह Microsoft PhotoSynth के समान लगता है।

1

आप सही हैं यह समस्या का एक बेहद मुश्किल सेट है, विशेष रूप से 2 डी छवि से 3 डी जानकारी डालने का। केवल एक बहुत सीमित समझ मौजूद है कि हमारी दृश्य प्रणाली 2 डी छवियों से 3 डी जानकारी को कैसे फैलती है, इस तरह के एक दृष्टिकोण को "Shape from Shading" के रूप में जाना जाता है और लिंक की गई Google खोज से पता चलता है कि हम कितना (और इसके परिणामस्वरूप कितने कम) जानते हैं।

रोब

1

यह एक बहुत ही कठिन कार्य है। सबसे कठिन हिस्सा छवि से ऑब्जेक्ट को पहचान या विभाजित नहीं कर रहा है, बल्कि 2-डी छवि से ऑब्जेक्ट की 3-डी ज्यामिति का उल्लंघन करता है। यदि आप एक स्टीरियोस्कोपिक कैमरा (या लेजर स्कैनर, यदि आपके पास पहुंच है तो) का उपयोग कर सकते हैं तो आपको और सफलता मिलेगी;)।

2-डी छवियों के मामले में, "आकार-से-छायांकन" के लिए googling का प्रयास करें। यह 2-डी छवि से 3-डी आकार डालने का एक तरीका है। यह रोशनी की स्थिति और सतह गुणों (बीआरडीएफ और ज्यामिति) के बारे में धारणा करता है जो कई मामलों में असफल हो सकते हैं, लेकिन यदि आप इसे केवल पूर्वनिर्धारित वर्गों (उदाहरण के लिए मानव चेहरे) के लिए उपयोग कर रहे हैं तो यह उचित रूप से अच्छी तरह से काम कर सकता है।