5

मैं समर्पित I/O सॉफ़्टवेयर के बारे में शोध कर रहा हूं जो उपभोक्ता हार्डवेयर पर चलती है। अनिवार्य रूप से यह बाद में प्रसंस्करण के लिए विशाल डेटा धाराओं को बचाने के लिए उबलता है। अभी मैं x86 पर प्रदर्शन कारकों का अनुमान लगाने के लिए एक मॉडल की तलाश में हूं। उदाहरण के लिएअनुमान लगाता है कि प्रोसेसर आवृत्ति I/O प्रदर्शन को प्रभावित करती है

लें नई Macbook Pro:

उच्च गति थंडरबोल्ट आई/ओ (इनपुट/आउटपुट) तकनीक दोनों दिशाओं में प्रति स्थानांतरण गति के दूसरे एक अद्भुत 10 gigabits उद्धार

1.25 GB/s अच्छा लगता है लेकिन दिन के अधिकांश प्रोसेसर 2 Ghz के आसपास घूमते हैं। एकाधिक कोर तब तक थोड़ा अंतर डालते हैं जब तक कि प्रति नेटवर्क चैनल केवल एक ही असाइन नहीं किया जा सके।

इसलिए भले ही एक लघु ऑपरेटिंग सिस्टम और नेटवर्क/डिस्क संचालन के सीमा खुद के रूप में सॉफ्टवेयर में कार्य करता है, भंडारण के साथ बहते हुए डेटा की मात्रा नहीं किया जा सकता से अधिक P/(2 * N)[1] प्रति सेकंड हिस्सा। हालांकि यह किसी न किसी प्रदर्शन सीमा को इंगित करता है, मुझे लगता है कि यह पर्याप्त से बहुत दूर है।

प्रोसेसर आवृत्ति और अन्य हार्डवेयर विनिर्देशों के संबंध में I/O प्रदर्शन का अनुमान लगाने वाले अन्य विचारों को क्या करना चाहिए? सादगी के लिए, यहां मान लें कि भंडारण तुरंत सभी परिस्थितियों में करता है।

[1] पी - प्रोसेसर आवृत्ति; एन - कलन विधि भूमि के ऊपर

+0

दिलचस्प सवाल। – murrekatt

+2

आपको यह भी याद रखना होगा कि बहुत से उच्च गति डेटा स्थानान्तरण कस्टम हार्डवेयर इंटरफ़ेस –

+0

@ मार्क हॉल - अच्छा बिंदु, इनपुट के लिए धन्यवाद के माध्यम से डीएमए (डायरेक्ट मेमोरी एक्सेस) का उपयोग कर रहे हैं। – Saul

उत्तर

2

हार्डवेयर कारकों को सीमित करने आई/ओ बस प्रदर्शन, FSB घड़ी-दर, शायद कर रहे हैं, PCIe कहते हैं, और अधिक हाल ही के बाद से स्मृति नियंत्रक CPUs themselves को northbridge से बढ़ रहे हैं।

फिर, आपको यह पता लगाना होगा कि इनपुट पर आपको किस तरह की प्रसंस्करण की आवश्यकता है, और आउटपुट का उत्पादन करने के लिए कितना काम करना है। ये, कम से कम एक सीपीयू पर चल रहे पारंपरिक सॉफ्टवेयर के लिए, प्रोसेसर घड़ी पर निर्भर हैं, लेकिन न केवल। कैश, निर्देश-स्तर समांतरता आदि जैसी हार्डवेयर सुविधाओं का लाभ उठाने के लिए अपना कोड लिखना अभी भी एक काला कला है लेकिन आपको परिमाण प्रदर्शन बढ़ाने का आदेश दे सकता है।

असल में मैं जो कह रहा हूं वह यह है कि सभी सॉफ़्टवेयर बराबर नहीं बनाए जाते हैं, और आप शायद इसे ध्यान में रखना चाहते हैं।

1

इसी तरह, हार्डडिस्क नियंत्रकों हार्डडिस्क तय करेगा मैं/हे प्रदर्शन, ग्राफिक्स कार्ड अधिकतम संकल्प तय और मैं/हे प्रदर्शन ताज़ा होगी, और इतने पर। वास्तव में सवाल को समझ में नहीं आता है, सीपीयू इस तरह की चीजों में कम और कम शामिल हो रहा है (ठीक है, पिछले 10 वर्षों से रहा है)।

मुझे संदेह है कि प्रश्न एकीकृत जीपीयू के साथ सीपीयू पर भी असर डालेगा, क्योंकि बफर आउटपुट स्क्रीन पर आउटपुट बाहरी मेमोरी में एक बार फिर से मदरबोर्ड पर नियंत्रक के साथ साझा कर रहा है।

यह सब buffered है, इसलिए मैं केवल फाइल प्रदर्शन को प्रभावित करने वाले CPUs देख सकता हूं यदि आप किसी भी तरह हार्डवेयर बफर आकार को किसी तरह से दंडित करने के लिए मजबूर करते हैं। संपादित करें: और मुझे पूरा यकीन है कि ऐप्पल आपको ऐसी चीजों से करने से रोक देगा। ;)

थंडरबॉल्ट के लिए विशेष रूप से, यह न्यूनतम CPU मॉडल के बारे में अधिक है, जो कि मशीन में मौजूद थंडरबॉल्ट चिप सेट संस्करण द्वारा आवश्यक बस गति के प्रकारों का समर्थन करता है।

थंडरबॉल्ट कच्चे डेटा यातायात प्रणाली है और प्रदर्शन चश्मे संभावित अधिकतम हैं, इसलिए ऐप्पल चश्मा में सभी तारांकन। मेरा मानना ​​है कि यह वास्तव में बाधाओं को कम करेगा और सामान्य रूप से अंतराल से कई चीजें करने के लिए अंतराल मुक्त बुद्धिमान डेटा दे देगा।

सीपीयू आवश्यक डेटा के लिए एक छोटा सा समय निष्क्रिय हो जाएगा, लेकिन डेटा की प्रसंस्करण गति समान है। मूवी बजाने या बनाने के दौरान, कोडेक प्रसंस्करण का समय वही होगा, लेकिन आपको अभी भी अंतराल की कमी/कमी महसूस होगी क्योंकि जब डेटा की आवश्यकता होती है तो डेटा वहां होता है।I/O के लिए, बाधा इसके बजाय आपके हार्डडिस्क की पढ़ने/लिखने की गति बन जाएगी, और सीपीयू बाधा (फाइल कॉपी ऑपरेशंस के लिए, कम से कम फाइंडर में कुछ कोड) एक ही रहेंगे।

दूसरे शब्दों में, उदाहरण के लिए केवल सीपीयू-गहन कार्य जैसे कि मूवी एन्कोडिंग को तेजी से सीपीयू से लाभ होगा, जबकि थंडरबॉल्ट बनाम इंटरफेस के मिश्रण के लाभ धीमी और तेज़ CPU दोनों के साथ मशीनों को बढ़ावा देंगे।

+0

मुझे डिस्क पर सीधे लिखने वाले किसी भी नेटवर्क इंटरफेस से अवगत नहीं है। यहां तक ​​कि डीएमए के साथ भी एक सीपीयू और कुछ सॉफ्टवेयर रैम से पढ़ने और डिस्क पर लिखने के लिए लेता है। यह वह जगह है जहां सीपीयू फ्रीक्वेंसी, आर्किटेक्चर और अन्य कारक आते हैं। उन पर कोई विचार? – Saul

+0

@ सॉल, संपादन देखें। –

+0

सब सच। हालांकि मैं ** समर्पित प्रणाली ** की तर्ज पर और सोच रहा था। दूसरे शब्दों में कोई आईओएस नहीं, कोई ग्राफिक्स नहीं, कोई आवाज नहीं, कोई परिधीय नहीं, कुछ भी नहीं। बस नंगे I/O (नेटवर्क और डिस्क)। प्रदर्शन कारक ** ** ** मामले में क्या होगा? स्पष्ट रूप से एक 64-बिट प्रोसेसर में ** उच्च ** डाटा थ्रूपुट 32-बिट से प्रति सेकेंड है क्योंकि पूर्व लंबे डेटा भाग पर चल रहा है। आदि। मैं एक अलग प्रश्न के लिए एचडीडी मुद्दों को आरक्षित करना चाहता हूं और यहां मानता हूं कि भंडारण सभी परिस्थितियों में तत्काल प्रदर्शन करता है। – Saul

संबंधित मुद्दे