टेन्सफोर्लो परीक्षण के लिए स्पीड बेंचमार्क

मैं संदेह कर रहा हूं कि मेरे जीपीयू बॉक्स पर टेंसफोर्लो सही तरीके से कॉन्फ़िगर किया गया है, क्योंकि यह एक साधारण रैखिक प्रतिगमन मॉडल (बैचसाइज = 32, 1500 इनपुट फीचर्स, 150 आउटपुट चर) को प्रशिक्षित करने के लिए लगभग 100x धीमी प्रति पुनरावृत्ति है। मेरे लैपटॉप की तुलना में मेरी फैंसी जीपीयू मशीन पर।टेन्सफोर्लो परीक्षण के लिए स्पीड बेंचमार्क

मैं एक आधुनिक सीपीयू आदि के साथ टाइटन एक्स का उपयोग कर रहा हूं, एनवीडिया-एसएमआई का कहना है कि मैं केवल 10% जीपीयू उपयोग पर हूं, लेकिन मुझे उम्मीद है कि यह छोटे बैचसाइज की वजह से है। मैं गणना ग्राफ में डेटा को स्थानांतरित करने के लिए feed_dict का उपयोग नहीं कर रहा हूं। सब कुछ एक tf.decode_csv और tf.train.shuffle_batch के माध्यम से आ रहा है।

क्या किसी के पास कोई भी सिफारिश है कि आसानी से जांचें कि मेरा इंस्टॉल सही है या नहीं? क्या कोई साधारण गति मानक हैं? मेरे लैपटॉप और जीपीयू मशीन के बीच गति अंतर इतना नाटकीय है कि मुझे उम्मीद है कि चीजें ठीक से कॉन्फ़िगर नहीं की गई हैं।

स्रोत

2016-02-29 DBelanger

कुछ उदाहरण GPU के लिए अनुकूलित नहीं कर रहे हैं और 100x धीमी प्राप्त कर सकते हैं जब GPU क्योंकि प्रतियों की सक्षम किया गया है, यहाँ एक https है: //github.com/tensorflow/tensorflow/issues/838 –

tensorflow/tensorflow/models/image/mnist/convolutional.py आज़माएं, जो प्रति-चरण समय प्रिंट करेंगे।

टेस्ला K40c पर कि 16 ms के बारे में प्रत्येक चरण में मिलना चाहिए, जबकि बारे में 120 ms के लिए केवल सीपीयू मेरी 3 वर्ष पुराने मशीन

स्रोत

2016-02-29 21:40:42

बस रिकॉर्ड के लिए। मैं एक GeForce GTX 960M का उपयोग कर रहा हूं और 16.1 से 17.7 तक चरण समय प्राप्त करता हूं, लेकिन ज्यादातर 16.2। – user728785

यदि आप tensorflow (जहां फ़ाइल स्थित है) का स्थापित स्थान खोज रहे हैं, तो यहां देखें: http://stackoverflow.com/questions/33616732/where-is-the-folder-for-installing-tensorflow-with- पीपी-मैक-ओएसएक्स – jrieke

लगता है कि convolutional.py को हटा दिया गया है, फिर भी आप इसे गीथब इतिहास में देख सकते हैं - https://github.com/tensorflow/tensorflow/blob/6431560b7ec3565154cb9cdc9c827db78ccfebe7/tensorflow/models/image/mnist/convolutional। पीई # एल 265 –

Yaroslavs जवाब विस्तार पर: यहाँ पूरे परीक्षण प्रक्रिया (CUDA और cudNN कैसे करना है पहले से ही स्थापित)

git clone https://github.com/tensorflow/models.git

tensorflow के लिए एक Virtuel पर्यावरण बनाएँ और स्थापित tensorflow

virtualenv --system-site-packages -p python3 tf-venv3 
source tf-venv3/bin/activate 
pip install --upgrade pip 
pip install --upgrade tensorflow-gpu

अपने Virtuel पर्यावरण

python models/tutorials/image/mnist/convolutional.py

मेरे GTX भीतर मॉडल भागो 1070 जरूरतों ~ कदम प्रति 5ms

स्रोत

2017-06-02 11:14:19

टेन्सफोर्लो परीक्षण के लिए स्पीड बेंचमार्क

उत्तर

संबंधित मुद्दे