2009-10-29 13 views
20

क्या किसी के पास Intel Math Kernel Library और AMD Math Core Library दोनों के लिए प्रोग्रामिंग अनुभव है? मैं उच्च प्रदर्शन सांख्यिकीय गणना के लिए एक निजी कंप्यूटर बना रहा हूं और खरीदने के लिए घटकों पर बहस कर रहा हूं। एएमडी मैथ कोर लाइब्रेरी की अपील यह है कि यह मुफ़्त है, लेकिन मैं अकादमिक में हूं इसलिए एमकेएल महंगा नहीं है। लेकिन मुझे इस पर विचार सुनने में दिलचस्पी होगी:इंटेल एमकेएल बनाम एएमडी मैथ कोर लाइब्रेरी

  1. जो एक बेहतर एपीआई प्रदान करता है?
  2. जो लाइसेंसिंग और हार्डवेयर लागत सहित प्रति डॉलर औसतन बेहतर प्रदर्शन प्रदान करता है।
  3. क्या AMCL-GPU एक कारक है जिसे मुझे विचार करना चाहिए?
+0

मुझे आश्चर्य है कि एएमडी प्रोसेसर पर एमकेएल काम करने के लिए कोई चाल है या नहीं। – Royi

+0

@ ड्रैज़िक मैं समझता हूं कि एमकेएल अनुकूलन और सभी के साथ एएमडी प्रोसेसर के साथ भी काम करता है। – becko

उत्तर

9

इंटेल MKL और ACML इतने पर समान एपीआई है, लेकिन MKL Blas (और CBLAS) सहित एक अमीर समर्थित कार्यक्षमता का सेट/LAPACK/FFTs/वेक्टर है और सांख्यिकीय गणित/विरल प्रत्यक्ष और पुनरावृत्ति समाधानकर्ताओं/विरल BLAS, और। इंटेल एमकेएल को इंटेल और एएमडी प्रोसेसर दोनों के लिए भी अनुकूलित किया गया है और इसमें एक सक्रिय उपयोगकर्ता मंच है जो आप सहायता या मार्गदर्शन के लिए बदल सकते हैं। दो पुस्तकालयों का एक स्वतंत्र मूल्यांकन यहां पोस्ट किया गया है: (http://www.advancedclustering.com/company-blog/high-performance-linpack-on-xeon-5500-v-opteron-2400.html)

• शेन सीडर, उन्नत क्लस्टरिंग, (एचपीसीवायर द्वारा भी चलाया गया: बेंचमार्क चैलेंज: नेहलेम बनाम इस्तांबुल): "हमारे हालिया परीक्षण और वास्तविक दुनिया के अनुभव के माध्यम से, हमने पाया है कि इंटेल कंपाइलर्स और इंटेल मैथ कर्नेल लाइब्रेरी (एमकेएल) आमतौर पर सर्वश्रेष्ठ प्रदर्शन प्रदान करते हैं। इंटेल की टूलकिट पर बसने के बजाए हमने इंटेल, जीएनयू कंपाइलर्स और पोर्टलैंड ग्रुप सहित विभिन्न कंपाइलर्स की कोशिश की। हमने विभिन्न रैखिक बीजगणित पुस्तकालयों का परीक्षण भी किया: एमकेएल, एएमडी कोर मैथ लाइब्रेरी (एसीएमएल), और टेक्सास विश्वविद्यालय से libGOTO। सभी परीक्षणों से पता चला है कि हम इंटेल कंपाइलर्स और इंटेल मैथ लाइब्रेरी दोनों का उपयोग करते समय उच्चतम प्रदर्शन प्राप्त कर सकते हैं - यहां तक ​​कि एएमडी सिस्टम पर भी - इसलिए इन्हें उन्हें हमारे मानक के आधार के रूप में उपयोग किया जाता था। "[बेंचमार्क परीक्षण ने 4-कोर दिखाया नेहलेम एक्स 5550 2.66GHz 74.0 जीएफ बनाम इस्तांबुल 2435 2.6GHz 99.4 जीएफ पर; 50% अधिक कोर के बावजूद इस्तांबुल केवल 34% तेज]

उम्मीद है कि इससे मदद मिलती है।

2

मैंने अपने बीएलएएस/लैपैक दिनचर्या के लिए एएमसीएल का उपयोग किया है, इसलिए यह शायद आपके प्रश्न का उत्तर नहीं देगा, लेकिन मुझे आशा है कि यह किसी के लिए उपयोगी होगा। उन्हें वेनिला ब्लास/लैपैक से तुलना करना, उनके प्रदर्शन को मेरे विशेष उपयोग मामले में 2-3 बेहतर कारक था। मैंने इसे रैखिक हल और ईजिनसिस्टम कंप्यूटेशंस दोनों के लिए घने नॉनसिमेट्रिक जटिल मैट्रिस के लिए उपयोग किया। आपको पता होना चाहिए कि फ़ंक्शन घोषणाएं वेनिला रूटीन के समान नहीं हैं। मुझे प्रीप्रोसेसर मैक्रोज़ की पर्याप्त मात्रा की आवश्यकता होती है ताकि मुझे दोनों के बीच स्वतंत्र रूप से स्विच करने की अनुमति मिल सके। विशेष रूप से एएमसीएल में सभी एलएपीएक्स दिनचर्या को कार्य सरणी की आवश्यकता नहीं होती है। एएमसीएल एकमात्र लाइब्रेरी है जिसका उपयोग आप करेंगे, यह एक बड़ी सुविधा है।

3

वास्तव में, ACML में LAPACK रूटीन के दो संस्करण हैं। अंडरस्कोर (_) के पीछे वाले लोग सी-वर्जन रूटीन हैं, जो विक्टर ने कहा है, वर्कस्पेस सरणी की आवश्यकता नहीं है और आप पैरामीटर के संदर्भों के बजाय मूल्यों को पास कर सकते हैं। अंडरस्कोर वाले लोग हालांकि वेनिला फोरट्रान दिनचर्या हैं। Libacml_dll.dll पर "डंपबिन/निर्यात" करें और आप देखेंगे।

संबंधित मुद्दे