2016-08-16 10 views
5

मैं थोड़ी देर के लिए सीएनएन के साथ गहरी शिक्षा कर रहा हूं और मुझे एहसास है कि मॉडल के लिए इनपुट हमेशा छवियों को स्क्वायर किया जाता है।संक्रामक तंत्रिका नेटवर्क हमेशा इनपुट छवियों के लिए इनपुट क्यों हैं?

मुझे लगता है कि न तो संकल्प संचालन या तंत्रिका नेटवर्क आर्किटेक्चर को ऐसी संपत्ति की आवश्यकता होती है।

तो, इसका कारण क्या है?

कोई टिप्पणी की सराहना करें!

उत्तर

1

क्योंकि वर्ग छवियां आंखों को प्रसन्न करती हैं। लेकिन जब डोमेन की आवश्यकता होती है तो गैर स्क्वायर छवियों पर अनुप्रयोग होते हैं। उदाहरण के लिए एसवीएनएन मूल डेटासेट कई अंकों की एक छवि है, और इसलिए आयताकार छवियों को रूपांतरण के रूप में उपयोग किया जाता है, here

1

स्क्वायर छवियों के लिए आवश्यक नहीं है।

  • स्केलिंग: मैं इसके लिए दो "कारणों" देख छवियों एक और पहलू अनुपात (और परिदृश्य/पोर्ट्रेट मोड) औसत में यह कम से कम त्रुटि परिचय हो सकता है से स्वचालित रूप से बढ़ाया रहे हैं, तो
  • प्रकाशनों/दृश्यावलोकन: वर्ग छवियों एक साथ प्रदर्शित करने के लिए
1

सुहास पिल्लई से आसान कर रहे हैं:

समस्या convolutional परतों के साथ नहीं है, यह पूरी तरह से जुड़ा है नेटवर्क की परतें, जिन्हें न्यूरॉन्स की फ़िक्स संख्या की आवश्यकता होती है। उदाहरण के लिए, एक छोटा 3 परत नेटवर्क + सॉफ्टमैक्स परत लें। यदि पहले 2 परतें संक्रामक + अधिकतम पूलिंग हैं, मानते हैं कि आयाम संकल्प से पहले और बाद में समान हैं, और पूलिंग मंद/2 को कम करता है, जो आमतौर पर है। में 4 फिल्टर के साथ 3 * 32 * 32 (सी, डब्ल्यू, एच) की छवि के लिए दूसरी परत में पहली परत और 6 फ़िल्टर, के बाद आउटपुट + 2 परत के अंत में संकल्पक + अधिकतम पूलिंग 6 होगा * 8 * 8 , जबकि 3 * 64 * 64 के साथ एक छवि के लिए, दूसरी परत आउटपुट के अंत में 6 * 16 * 16 होगा। पूरी तरह से कनेक्ट करने से पहले, हम इसे सिंगल वेक्टर (6 * 8 * 8 = 384 न्यूरॉन्स) के रूप में फैलाते हैं और पूरी तरह से जुड़े ऑपरेशन करते हैं। तो, विभिन्न आकार छवियों के लिए आपके पास अलग-अलग आयाम पूरी तरह से जुड़े परत नहीं हो सकते हैं। इससे निपटने का एक तरीका स्थानिक पिरामिड पूलिंग का उपयोग कर रहा है, जहां आप अंतिम संक्रामक परत के आउटपुट को पर एक निश्चित संख्या में डिब्बे (आईई न्यूरॉन्स) पर पूल करते हैं, जैसे कि कनेक्टेड परत में न्यूरॉन्स की संख्या समान है। आप पूरी तरह से संक्रामक नेटवर्क भी देख सकते हैं, जो गैर स्क्वायर छवियां ले सकते हैं।

संबंधित मुद्दे