यदि वीडियो में संरचना है, यानी कई शॉट्स हैं, तो वीडियो सारांश के लिए मानक तकनीकों में शामिल हैं (ए) शॉट डिटेक्शन, फिर (बी) प्रत्येक शॉट का प्रतिनिधित्व करने के लिए पहले, मध्य या एनएच फ्रेम का उपयोग करें। देखें [1]।
हालांकि, मान लीजिए कि आप एक कैमरा स्रोत से ली गई फ्रेमों की एक सतत स्ट्रीम में एक दिलचस्प फ्रेम खोजना चाहते हैं। अर्थात। एक दृश्य। यह "मुख्य फ्रेम पहचान" समस्या है जिसे आईआर/सीवी (सूचना पुनर्प्राप्ति, कंप्यूटर विजन) ग्रंथों में व्यापक रूप से चर्चा की जाती है। कुछ चित्रकारी दृष्टिकोण:
- [2] एक फ्रेम रंग हिस्टोग्राम की गणना सभी फ्रेमों के लिए की जाती है और कुंजी-फ्रेम निकटतम हिस्टोग्राम के साथ होता है। अर्थात। हम इसके रंग वितरण के मामले में सबसे अच्छा फ्रेम चुनते हैं।
- [3] में हम मानते हैं कि कैमरा स्थिरता फ्रेम महत्व का संकेतक है। जैसा कि उपरोक्त बिस्तरों द्वारा सुझाया गया है। हम ऑप्टिक-प्रवाह का उपयोग करके अभी भी फ्रेम चुनते हैं और इसका उपयोग करते हैं।
- [4] प्रत्येक फ्रेम को कुछ उच्च आयामी सामग्री स्थान में पेश किया जाता है, हम उन फ्रेमों को अंतरिक्ष के कोनों पर पाते हैं और वीडियो का प्रतिनिधित्व करने के लिए उनका उपयोग करते हैं।
- [5] फ्रेम में सामग्री की जगह में उनकी लंबाई और नवीनता का उपयोग करके महत्व के लिए मूल्यांकन किया जाता है।
सामान्यतः, यह एक बड़ा क्षेत्र है और बहुत सारे दृष्टिकोण हैं। आप नवीनतम विचारों के लिए छवि और वीडियो पुनर्प्राप्ति (सीआईवीआर) पर अंतर्राष्ट्रीय सम्मेलन जैसे अकादमिक सम्मेलनों को देख सकते हैं। मुझे लगता है कि [6] वीडियो अबास्ट्रक्शन (कुंजी-फ्रेम पहचान और संक्षेपण) का एक उपयोगी विस्तृत सारांश प्रस्तुत करता है।
आपके "30 बिटमैप्स का सर्वश्रेष्ठ खोज" समस्या के लिए मैं [2] जैसे दृष्टिकोण का उपयोग करूंगा। एक फ्रेम प्रतिनिधित्व स्थान की गणना करें (उदाहरण के लिए फ्रेम के लिए रंग हिस्टोग्राम), सभी फ्रेम का प्रतिनिधित्व करने के लिए एक हिस्टोग्राम की गणना करें, और दोनों के बीच न्यूनतम दूरी के साथ फ्रेम का उपयोग करें (उदाहरण के लिए एक दूरी मीट्रिक चुनें जो आपके स्थान के लिए सबसे अच्छा है। मैं पृथ्वी की कोशिश करूंगा प्रेमी की दूरी)।
- एमएस ल्यू। दृश्य सूचना पुनर्प्राप्ति के सिद्धांत। स्प्रिंगर वेरलाग, 2001।
- बी गनसेल, वाई फू, और एएम। Tekalp। पदानुक्रमित अस्थायी वीडियो विभाजन और सामग्री विशेषता। मल्टीमीडिया स्टोरेज एंड आर्काइविंग सिस्टम्स II, एसपीआईई, 3229: 46-55, 1 99 7।
- डब्ल्यू वुल्फ। गति विश्लेषण द्वारा कुंजी फ्रेम चयन। ध्वनिक, भाषण, और सिग्नल प्रोसेसिंग पर आईईईई अंतर्राष्ट्रीय सम्मेलन में, पृष्ठ 1228-1231, 1 99 6।
- एल झाओ, डब्ल्यू क्यूई, एसजेड। ली, एसक्यू यांग, और एच जे झांग। निकटतम फ़ीचर लाइन का उपयोग करके कुंजी-फ्रेम निष्कर्षण और शॉट पुनर्प्राप्ति। आईडब्ल्यू-एमआईआर, एसीएम एमएम, पेज 217-220, 2000.
- एस उचिहाशी। वीडियो मंगा: अर्थात् अर्थपूर्ण वीडियो सारांश उत्पन्न करना। प्रो में । एसीएम मल्टीमीडिया 99, ऑरलैंडो, एफएल, नवंबर, पेज 383-292, 1 999।
- वाई ली, टी झांग, और डी। ट्रेटर। वीडियो एब्स्ट्रक्शन तकनीक का एक सिंहावलोकन। तकनीकी रिपोर्ट, हिमाचल प्रदेश प्रयोगशाला, जुलाई 2001
आपको आरंभिक 30 बिटमैप्स कैसे प्राप्त हुए; क्या वे यादृच्छिक या हस्तनिर्मित हैं? – Unreason