2016-05-08 16 views
9

बोलो केरास में प्रलेखन से उदाहरण कोड का एक टुकड़ा है। ऐसा लगता है कि पहला संकल्प 3 रंग चैनलों के साथ 256x256 छवि स्वीकार करता है। इसमें 64 आउटपुट फिल्टर हैं (मुझे लगता है कि ये फीचर मैप्स के समान हैं जिन्हें मैंने कहीं और पढ़ा है, क्या कोई मेरे लिए यह पुष्टि कर सकता है)। मुझे क्या भ्रमित करता है कि आउटपुट आकार (कोई नहीं, 64, 256, 256) है। मैं उम्मीद करता हूं कि यह (कोई नहीं, 64 * 3, 256, 256) होगा क्योंकि इसे प्रत्येक रंगीन चैनलों के लिए रूपांतरण करने की आवश्यकता होगी। मैं क्या सोच रहा हूं कि केरास रंगीन चैनलों को कैसे संभालता है। हालांकि संकल्प के बावजूद मूल्यों को एक साथ औसत (ग्रे पैमाने पर परिवर्तित) किया जाता है?केरास संकल्प परत रंग चैनलों के साथ क्या करती है?

# apply a 3x3 convolution with 64 output filters on a 256x256 image: 
model = Sequential() 
model.add(Convolution2D(64, 3, 3, border_mode='same', input_shape=(3, 256, 256))) 
# now model.output_shape == (None, 64, 256, 256) 

# add a 3x3 convolution on top, with 32 output filters: 
model.add(Convolution2D(32, 3, 3, border_mode='same')) 
# now model.output_shape == (None, 32, 256, 256) 

उत्तर

5

3 इनपुट चैनल के साथ आकार 3 * 3 के एक फिल्टर 3 * 3 * 3 मानकों के होते हैं, इसलिए प्रत्येक चैनल के लिए घुमाव के दाने का वजन अलग हैं।

यह आउटपुट प्राप्त करने के लिए प्रत्येक चैनल (शायद एक पूर्वाग्रह अवधि के साथ) के रूपांतरण परिणामों को बताता है। इसलिए उत्पादन आकार इनपुट चैनलों की संख्या से स्वतंत्र है, उदाहरण के लिए, (कोई नहीं, 64, 256, 256) (कोई नहीं, 64 * 3, 256, 256)।

मैं 100% निश्चित नहीं हूं लेकिन मुझे लगता है कि एक फीचर मैप इनपुट में ऐसे एक फ़िल्टर को लागू करने के आउटपुट को संदर्भित करता है (उदाहरण के लिए 256 * 256 मैट्रिक्स)।

संबंधित मुद्दे