2010-06-20 13 views
8

मैं इस स्नातक छात्र और इस कार्यक्रम में मेरा अंतिम वर्ष हूं। जैसा कि किसी भी कंप्यूटिंग डिग्री में मुझे किसी भी विषय के बारे में एक परियोजना (व्यक्तिगत) करना है जो कंप्यूटिंग के तहत आ जाएगा। मैं कुछ ऐसा करना चाहता हूं जो कंप्यूटर दृष्टि (ऑब्जेक्ट का पता लगाने या सटीक होने के लिए ट्रैकिंग) के अंतर्गत आएगा। इस विषय पर जानकारी के बारे में खोज करते समय मुझे पता चला कि पहले से ही ऐसे कई लोग हैं जिन्होंने इन प्रकार की परियोजनाएं की हैं। मेरा सवाल यह है कि अगर मैं वीडियो में किसी ऑब्जेक्ट को ट्रैक करने जैसी परियोजना करता हूं तो क्या मुझे अपने एल्गोरिदम के साथ आना होगा या क्या कोई एल्गोरिदम उपलब्ध है मुझे कोडिंग कर के लिए करने के लिए। (मैं जावा में परिचित हूँ और अजगर का एक सा शुरू कर दिया)कंप्यूटर दृष्टि, परियोजना विचार?

कृपया मुझे एक विषय और कैसे शुरू करने के लिए की एक छोटी विचार उठा में मार्गदर्शन या जहां से

+0

परियोजना करने से पहले आपने छवि प्रसंस्करण और कंप्यूटर दृष्टि का अध्ययन कैसे किया होगा? पिछले अनुभव की मात्रा का एक बड़ा प्रभाव होगा जिस पर परियोजनाएं व्यवहार्य हैं। –

+0

@ किगुराई मैंने किसी भी सीवी का पालन नहीं किया है, मुझे इसमें दिलचस्पी है – peedarpk

+0

तो मैं शायद कुछ ऐसा करने पर ध्यान केंद्रित करूंगा जो ठंडा है लेकिन बहुत मुश्किल नहीं है। एक साधारण उदाहरण लेने के लिए वीडियो में ऑब्जेक्ट को ट्रैक करना बहुत मुश्किल नहीं है। –

उत्तर

1

वहाँ शुरू करने के लिए अस्तित्व में पहले से ही कई कंप्यूटर दृष्टि और छवि विश्लेषण एल्गोरिदम हैं। मैंने कुछ साल पहले स्नातक विद्यालय में एक कक्षा ली थी जो दिलचस्प था, इसलिए मैं सुझाव देता हूं कि विषय पर एक पाठ के लिए अपनी विश्वविद्यालय पुस्तकालय या किताबों की दुकान के माध्यम से क्या उपलब्ध है, इस पर एक अच्छा संभाल लें।

इस तकनीक के लिए वास्तविक दुनिया के अनुप्रयोग हैं। ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) एक ऐसा क्षेत्र है जिसने कुछ बड़े प्रोफ़ाइल एप्लिकेशन को बड़े पैमाने पर देखा है।

आपने एक दिलचस्प विषय चुना है, मज़े करो! :)

6

मैंने अपने ग्रेड अध्ययन के दौरान कंप्यूटर दृष्टि में एक बुनियादी पाठ्यक्रम किया था और हमने पहली परियोजनाओं में से एक को एक प्रणाली को लागू करने के लिए किया था जो छवियों की एक श्रृंखला को एक सहज 360 डिग्री पैनोरमा में सिलाई करता था।

यह शामिल:

  1. अलग-अलग चित्र में भेदभाव सुविधाओं का पता लगाने (सुविधा निष्कर्षण झारना का प्रयोग करके),
  2. अन्य छवियों (फीचर मिलान) में सर्वश्रेष्ठ मिलान सुविधाओं,
  3. चित्र स्वचालित रूप से संरेखित (होमोग्राफी अनुमान),
  4. उनके ओवरलैप और कैमरे के रिश्तेदार पदों (कैमरा अनुमान अनुमान),
  5. छवियों को सिलेंडर में प्रोजेक्ट करना कैल समन्वय प्रणाली (छवि warping),
  6. और फिर, आखिरकार, परिणामी तस्वीरों को एक एकल निर्बाध पैनोरमा (छवि मिश्रण) में मिलाएं।

इस परियोजना के साथ चुनौती कोड को तेज छवि सिलाई के लिए अनुमति देने के लिए पर्याप्त कुशल बनाना है।

आप इस परियोजना के साथ आपकी सहायता के लिए इंटरनेट पर बहुत सारे संसाधन पा सकते हैं।

+1

से कोई लेना देना नहीं है, यह वास्तव में ऑब्जेक्ट डिटेक्शन या ट्रैकिंग के लिए आवश्यक नहीं है। –

3

यदि आप वास्तव में कुछ अच्छा और दिलचस्प करना चाहते हैं, तो वीडियो में एक गतिविधि पहचान एल्गोरिदम विकसित करने का प्रयास करें। उदाहरण के लिए, "आदमी छोड़ने वाली कार", "इमारत में प्रवेश करने वाले लोग" आदि। यह एक छोटा काम नहीं है और यूजी थीसिस के लिए पर्याप्त चुनौतीपूर्ण नहीं है। जब आप एल्गोरिदम पर ध्यान केंद्रित करते हैं, तो आप वीडियो प्रोसेसिंग और ऑब्जेक्ट डिटेक्शन इत्यादि में ग्राउंड-वर्क करने के लिए ओपनसीवी जैसे टूलकिट का उपयोग कर सकते हैं।

+0

एफवाईआई के रूप में यह डीएआरपीए और रक्षा विभागों जैसे स्थानों में एक सक्रिय शोध क्षेत्र है। – Mikos

+7

जब तक कि किसी ने कंप्यूटर दृष्टि में कुछ पाठ्यक्रम पहले ही नहीं ले लिए हैं, तो मैं कहूंगा कि यह एक बहुत ही उन्नत परियोजना है। –

+0

जरूरी नहीं, ओपी कुछ विशिष्ट गतिविधि तक सीमित हो सकता है और इसे कम लटकाने वाला फल बना सकता है। – Mikos

0

नीचे कंप्यूटर दृष्टि परियोजना विचारों कि आपको दिलचस्प लग सकते हैं:

  1. MNIST अंकों के एक कई गुना सीखना
  2. छवि पुनर्प्राप्ति के लिए दृश्य शब्द
  3. गैर-पैरामीट्रिक क्लस्टरिंग का उपयोग करके छवि विभाजन
  4. वीडियो वर्गीकरण CNNs का उपयोग कर
  5. छवि CNNs और पीसीए embedding
  6. Kalman फिल्टर ट्रैकिंग
  7. वीडियो संपीड़न superpixels के आधार पर
  8. ऑप्टिकल वर्ण पहचान तंत्रिका जाल का उपयोग कर
  9. दृश्य और सिमेंटिक एम्बेडिंग (पैदा करने के आधार पर खोज छवियों के लिए कैप्शन)

गहरी सीखने वाली परियोजनाओं के साथ शुरू करने के लिए, मैं केरास लाइब्रेरी की सिफारिश करता हूं जो ओ चलाता है n Theano/Tensor कई examples के साथ बैकएंड के रूप में फ़्लो करें। इसके अलावा, आपको वास्तव में सहायक होने के लिए ओपनसीवी tutorials मिलेगा। साथ ही, आप नीचे दी गई कुछ परियोजनाओं के कार्यान्वयन को निम्नलिखित github पृष्ठ पर पा सकते हैं।

संबंधित मुद्दे