आप 16-परत (तालिका 1, स्तंभ डी) के साथ VGG नेट का उल्लेख तो 138M
मापदंडों के कुल संख्या इस नेटवर्क के, यानी सब convolutional परतों सहित को संदर्भित करता है, लेकिन यह भी पूरी तरह से जुड़ा हुआ वाले।
3 x conv3-256
परतों से बनी 3 convolutional चरण को देखते हुए:
- पहले एक एन = 128 इनपुट विमानों और एफ = 256 उत्पादन विमानों,
दो अन्य लोगों
- है एन = 256 है इनपुट विमान और एफ = 256 आउटपुट विमान।
इन परतों में से प्रत्येक के लिए संकल्प कर्नेल 3x3 है। मानकों के संदर्भ में इस देता है:
- 128x3x3x256 (वजन) + 256 (पूर्वाग्रहों) = 1 एक के लिए 295,168 पैरामीटर,
- 256x3x3x256 (वजन) दो अन्य लोगों के लिए + 256 (पूर्वाग्रहों) = 590,080 मानकों ।
जैसा कि ऊपर बताया गया है, आपको सभी परतों के लिए ऐसा करना है, लेकिन पूरी तरह से जुड़े हुए लोगों को भी अंतिम 138 एम नंबर प्राप्त करने के लिए इन मानों को जोड़ना है।
-
अद्यतन: परतों के बीच में टूटने दे:
conv3-64 x 2 : 38,720
conv3-128 x 2 : 221,440
conv3-256 x 3 : 1,475,328
conv3-512 x 3 : 5,899,776
conv3-512 x 3 : 7,079,424
fc1 : 102,764,544
fc2 : 16,781,312
fc3 : 4,097,000
TOTAL : 138,357,544
पूरी तरह से जुड़ा हुआ परतों (एफसी) के लिए विशेष रूप से
:
fc1 (x): (512x7x7)x4,096 (weights) + 4,096 (biases)
fc2 : 4,096x4,096 (weights) + 4,096 (biases)
fc3 : 4,096x1,000 (weights) + 1,000 (biases)
(x) को देखने के लेख की धारा 3.2: पूरी तरह से जुड़े परतों को पहले संकल्पक परतों में परिवर्तित किया जाता है (पहला 7 × 7 रूपांतरण के लिए एफसी परत। परत, अंतिम दो एफसी परतें 1 × 1 रूपांतरण के लिए। परतों)।
fc1
सही पूरी तरह से जुड़ा हुआ परतों को खिलाने से पहले स्थानिक संकल्प ऊपर precised के रूप में के बारे में विवरण 7x7 पिक्सल है। के रूप में कागज की धारा 2.1 के भीतर विस्तृत इसका कारण यह है इस VGG नेट convolutions से पहले स्थानिक गद्दी का उपयोग करता है:
[...] रूपा के स्थानिक गद्दी। परत इनपुट ऐसा है कि स्थानिक संकल्प को दृढ़ता के बाद संरक्षित किया जाता है, यानी।पैडिंग 3 × 3 रूपांतरण के लिए 1 पिक्सेल है। परतों।
इस तरह के एक गद्दी के साथ
, और एक 224x224 पिक्सल इनपुट छवि के साथ काम कर, संकल्प के रूप में परतों में आगे बढ़ने के कम हो जाती है: 112x112, 56x56, 28x28, पिछले घुमाव/पूलिंग चरण जो 512 सुविधा नक्शे है के बाद 14x14 और 7x7।
यह एक फीचर वेक्टर fc1
को आयाम के साथ पास करता है: 512x7x7।
सभी परतों का अपना पूरा गणना दे दें ताकि हम देख सकते हैं कि क्या गलत है। यह देखने के लिए एक प्रारंभिक बिंदु है कि कुल संख्या की गणना कैसे करें: http://learning.eng.cam.ac.uk/pub/Public/Turner/Teaching/ml-lecture-3-slides.pdf – runDOSrun
'एस' क्या करता है व्याख्यान की 10 वीं स्लाइड में खड़े हो जाओ? Subsampling के लिए 'स्ट्राइड'? @runDOSrun – nn0p
यहां एक समान प्रश्न का मेरा उत्तर यहां दिया गया है: http://stackoverflow.com/a/39687866/1621562। पैरामीटर की कुल संख्या की गणना करने के लिए आप एक साधारण पायथन लिपि लिख सकते हैं (यदि आप कैफे का उपयोग कर रहे हैं)। Https://gist.github.com/kaushikpavani/a6a32bd87fdfe5529f0e908ed743f779 –