2016-01-11 42 views
17

के माध्यम से मशीन लर्निंग करने के लिए GeForce या Quadro GPU के बीच चयन करना Quadro GPUs बनाम GeForce GPUs का उपयोग करते हुए TensorFlow प्रदर्शन में कोई उल्लेखनीय अंतर है?TensorFlow

उदा। क्या यह डबल परिशुद्धता संचालन या कुछ और जो GeForce कार्ड में गिरावट का कारण बनता है?

मैं टेंसरफ्लो के लिए एक जीपीयू खरीदने जा रहा हूं, और जानना चाहता था कि एक GeForce ठीक होगा या नहीं। धन्यवाद और आपकी मदद की सराहना करें

+5

यह 100% राय आधारित नहीं है। – Goddard

+1

यह प्रश्न राय आधारित नहीं है, tensorflow एक विशिष्ट अनुप्रयोग है और इन कार्डों के बीच विशिष्ट हार्डवेयर अंतर हैं। प्रश्न मुख्य मतभेदों में से एक को भी इंगित करता है और पूछता है कि प्रोग्रामिंग लाइब्रेरी उस तकनीक का उपयोग करती है या नहीं। – gordatron

उत्तर

25

मुझे लगता है कि GeForce टाइटन महान है और व्यापक रूप से मशीन लर्निंग (एमएल) में उपयोग किया जाता है। एमएल में, ज्यादातर मामलों में एकल परिशुद्धता पर्याप्त है।

जीटीएक्स लाइन (वर्तमान में GeForce 10) के प्रदर्शन पर अधिक जानकारी विकिपीडिया, here में पाया जा सकता है।

वेब के अन्य स्रोत इस दावे का समर्थन करते हैं। यहां एक उद्धरण from doc-ok in 2013 (permalink) है।

तुलना के लिए, एक "प्रवेश स्तर" $ 700 Quadro 4000 एक $ 530 उच्च अंत GeForce GTX 680 की तुलना में काफी धीमी है, कम से कम कई Vrui अनुप्रयोगों का उपयोग कर मेरी माप, और के अनुसार निकटतम प्रदर्शन-बराबर एक करने के लिए GeForce GTX 680 मुझे $ 3660 के लिए एक क्वाड्रो 6000 मिल सकता था।

एमएल के लिए विशिष्ट, गहरी सीखने सहित, वहाँ है एक Kaggle forum discussion dedicated to this subject (दिसम्बर 2014, permalink) है, जो तस्वीर, GeForce, और टेस्ला श्रृंखला के बीच तुलना के ऊपर जाता है:

Quadro GPUs नहीं हैं वैज्ञानिक गणना के लिए, टेस्ला जीपीयू हैं। क्वाड्रो कार्ड सीएडी को तेज करने के लिए डिज़ाइन किए गए हैं, इसलिए वे ट्रेन तंत्रिका जाल में आपकी सहायता नहीं करेंगे। उनका उपयोग शायद उस उद्देश्य के लिए ठीक हो सकता है, लेकिन यह पैसे की बर्बादी है।

टेस्ला कार्ड वैज्ञानिक गणना के लिए हैं, लेकिन वे सुंदर महंगा होते हैं। अच्छी खबर यह है कि GeForce कार्ड पर टेस्ला कार्ड द्वारा प्रदान की जाने वाली कई सुविधाएं तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए आवश्यक नहीं हैं।

उदाहरण के लिए, टेस्ला कार्ड्स में आमतौर पर ईसीसी मेमोरी होती है, जो के लिए अच्छा है लेकिन आवश्यकता नहीं है। डबल परिशुद्धता कंप्यूटेशंस के लिए उनके पास बहुत बेहतर समर्थन है, लेकिन तंत्रिका नेटवर्क प्रशिक्षण के लिए एकल परिशुद्धता बहुत अधिक है, और इसके लिए वे GeForce कार्ड के समान प्रदर्शन करते हैं।

टेस्ला कार्ड की एक उपयोगी विशेषता यह है कि तुलनात्मक GeForce कार्ड की तुलना में उनके पास अधिक रैम है। यदि आप बड़े मॉडल को प्रशिक्षित करने की योजना बना रहे हैं (या रैम-गहन एफएफटी-आधारित संकल्पों जैसे गणनाओं का उपयोग करें) तो अधिक रैम हमेशा स्वागत है।

यदि आप क्वाड्रो और जीईफ़ोर्स के बीच चयन कर रहे हैं, तो निश्चित रूप से GeForce चुनें। यदि आप टेस्ला और जीईफ़ोर्स के बीच चयन कर रहे हैं, तो GeForce, चुनें जब तक कि आपके पास बहुत पैसा नहीं है और वास्तव में अतिरिक्त रैम का उपयोग कर सकता है।

नोट: सावधान रहें क्या मंच आप पर काम कर रहे हैं और क्या डिफ़ॉल्ट परिशुद्धता उस में है। उदाहरण के लिए, here in the CUDA forums (अगस्त 2016), एक डेवलपर के पास दो टाइटन एक्स (GeForce श्रृंखला) का मालिक है और उनमें से किसी भी आर या पायथन स्क्रिप्ट में प्रदर्शन लाभ नहीं दिखता है। आर को डबल परिशुद्धता में डिफॉल्ट करने के परिणामस्वरूप इसका निदान किया जाता है, और उनके सीपीयू (ज़ीऑन प्रोसेसर) की तुलना में नए जीपीयू पर खराब प्रदर्शन होता है। टेस्ला जीपीयू को डबल परिशुद्धता के लिए सर्वश्रेष्ठ प्रदर्शन के रूप में उद्धृत किया गया है। इस मामले में, सभी नंबरों को फ्लोट 32 में कनवर्ट करना 12.437 से एनवीबीएलएस 0.324 के साथ प्रदर्शन को बढ़ाता है जिसमें एक टिटान एक्स पर गैमैट्रिक्स + फ्लोट 32 है (पहले बेंचमार्क देखें)। इस मंच चर्चा से उद्धरण:

टाइटन एक्स का डबल सटीक प्रदर्शन बहुत कम है।

+4

"क्वाड्रो जीपीयू वैज्ञानिक गणना के लिए नहीं हैं, टेस्ला जीपीयू हैं" +1 –

+0

हां, निश्चित रूप से टाइटन एक्स या नया 1080 टली – fabrizioM

+4

लेकिन क्वाड्रोस में 24 जीबी जीपीयू मेमोरी है, जो भविष्य के गहरे सीखने के मॉडल के लिए बहुत अच्छा होगा। किसी ने इसका जिक्र क्यों नहीं किया? या यह वास्तव में इतना धीमा है कि यह बिल्कुल लायक नहीं है –