2011-05-28 20 views
81

dd चलाते समय आप इष्टतम अवरोध की गणना कैसे करते हैं? मैंने थोड़ा सा शोध किया है और मुझे कुछ भी नहीं मिला है कि यह कैसे पूरा किया जाएगा।डीडी: इष्टतम अवरोध की गणना कैसे करें?

मैं इस धारणा के तहत हूं कि एक बड़ा अवरोध परिणामस्वरूप dd होगा ... क्या यह सच है?

मैं dd दो समान 500GB Hitachi HDDs कि 4GB DDR3 1333MHz रैम के साथ एक इंटेल कोर i3 चल रहा एक बॉक्स पर 7200rpm पर चलाने के बारे में हूँ, इसलिए मैं यह पता लगाने की क्या उपयोग करने के लिए कोशिश कर रहा हूँ blocksize। (मैं एक फ्लैश ड्राइव से उबंटू 10.10 x86 बूट करने जा रहा हूं, और इसे से चला रहा हूं।)

उत्तर

71

इष्टतम ब्लॉक आकार ऑपरेटिंग सिस्टम (और इसके संस्करण), और विभिन्न हार्डवेयर सहित विभिन्न कारकों पर निर्भर करता है बसों और डिस्क शामिल हैं। कई यूनिक्स सिस्टम (लिनक्स और सहित कम से कम बीएसडी के कुछ प्रकारों) कि देता है क्या गिरी सोचता है कि इष्टतम ब्लॉक आकार है struct stat में st_blksize सदस्य को परिभाषित:

#include <sys/stat.h> 
#include <stdio.h> 

int main(void) 
{ 
    struct stat stats; 

    if (!stat("/", &stats)) 
    { 
     printf("%u\n", stats.st_blksize); 
    } 
} 

सबसे अच्छा तरीका है प्रयोग करने के लिए हो सकता है: विभिन्न ब्लॉक आकारों और समय के साथ एक गीगाबाइट कॉपी करें। (प्रत्येक रन से पहले कर्नेल बफर कैश साफ़ करना याद रखें: echo 3 > /proc/sys/vm/drop_caches)।

हालांकि, अंगूठे के नियम के रूप में, मुझे पता चला है कि एक बड़ा पर्याप्त ब्लॉक आकार dd एक अच्छी नौकरी करता है, और कहता है कि 64 कीबी और 1 एमआईबी मामूली हैं, 4 कीबी बनाम 64 की तुलना में किबा। (हालांकि, स्वीकार्य रूप से, यह कुछ समय हो गया है क्योंकि मैंने ऐसा किया था। मैं डिफ़ॉल्ट रूप से मेबिबेट का उपयोग करता हूं, या बस dd आकार चुनें।)

+7

मुझे खेद है कि इसे कभी जवाब के रूप में स्वीकार नहीं किया जा रहा है ... धन्यवाद! – eckza

+0

कैश छोड़ने के बारे में याद रखने के बारे में उत्कृष्ट बिंदु। यह मेरे माप को गड़बड़ कर रहा था! (हालांकि मामूली समस्या: यह अंडरस्कोर के साथ "ड्रॉप_caches" है। स्पष्ट रूप से संपादन कम से कम 6 वर्ण होने की आवश्यकता है ... :() – Tom

3

यह पूरी तरह से सिस्टम निर्भर है। इष्टतम समाधान खोजने के लिए आपको प्रयोग करना चाहिए। bs=8388608 से शुरू करने का प्रयास करें। (जैसा कि हिताची एचडीडी में 8 एमबी कैश होता है।)

+3

बहुत सारे डीडी संस्करण शॉर्टेंड स्वीकार करते हैं: यानी जीएनयू/लिनक्स पर 'बीएस = 8 एम' या' बीएसडी – pascal

+1

लॉल पर बीएस = 8 एम', सोचा था कि आप कहेंगे "बीएस = 8388608' से शुरू करने का प्रयास करें और प्रत्येक चरण में एक बार कमी करें" – lindhe

4

आप dd-opt का उपयोग करने की कोशिश कर सकते हैं, जो मैंने लिखा था।

(सुधार/शोधन स्वागत करते हैं!)

+1

वाह - और यह रूबी में लिखा गया है? अच्छा! मैं निश्चित रूप से इसे एक भंवर दे रहा हूँ ! – eckza

+11

वर्तमान में (2012-08-09), डीडी-ऑप्ट अभी तक मैक ओएस एक्स – Henno

0
  • बेहतर performace के लिए सबसे बड़ी ब्लॉकसाइज आप रैम समायोजित कर सकते हैं का उपयोग करें (कम मैं भेज देंगे/ओ ओएस पर कॉल)
  • बेहतर accurancy और डेटा रिकवरी सेट के लिए
  • इनपुट के मूल क्षेत्र आकार के ब्लॉकसाइज

रूपा = noerror साथ dd प्रतियां डेटा, समन्वयन विकल्प के रूप में, किसी भी त्रुटि यह मुठभेड़ों ब्लॉक के शेष का परिणाम देगा के साथ प्रतिस्थापित किया जा रहा शून्य बाइट्स। बड़े ब्लॉक आकार अधिक तेज़ी से प्रतिलिपि बनाए जाएंगे, लेकिन प्रत्येक बार जब कोई त्रुटि आती है तो ब्लॉक के शेष को अनदेखा किया जाता है।

source

6

मैं अपने इष्टतम ब्लॉकसाइज पाया है 8 MB होने के लिए मैं साफ करने के लिए (कुछ कहते हैं: धोने) की जरूरत (डिस्क कैश के बराबर?) एक संपीड़ित छवि बनाने से पहले एक डिस्क पर खाली जगह इसका मैं प्रयोग किया है:

cd /media/DiskToWash/ 
dd if=/dev/zero of=zero bs=8M; rm zero 

मैं 4K से 100M के मूल्यों के साथ प्रयोग किया।

dd दे थोड़ी देर मैं इसे (Ctlr + सी) को मार डाला के लिए चलाने के लिए और उत्पादन को पढ़ने के लिए के बाद:

36+0 records in 
36+0 records out 
301989888 bytes (302 MB) copied, 15.8341 s, 19.1 MB/s 

dd प्रदर्शित करता है इनपुट/आउटपुट दर (इस मामले में 19.1MB/s) के रूप में यह है यह देखने में आसान है कि आपके द्वारा चुने गए मूल्य पिछले एक या बदतर से बेहतर प्रदर्शन कर रहे हैं या नहीं।

मेरे स्कोर:

bs= I/O rate 
--------------- 
4K 13.5 MB/s 
64K 18.3 MB/s 
8M 19.1 MB/s <--- winner! 
10M 19.0 MB/s 
20M 18.6 MB/s 
100M 18.6 MB/s 
+1

के अलावा ऑपरेटिंग सिस्टम पर काम नहीं करता है क्या आपने केवल एक बार प्रत्येक टेस्ट चलाया था? मुझे लगता है कि आप ≥64K से क्या देख सकते हैं, बफर है पहले से ही भरा हुआ है और अंतर सिर्फ यादृच्छिक भिन्नता है। –

+0

मैंने सिस्टम को संभावित रूप से बाधित करने के बड़े मूल्यों में से एक बार सुना है। व्यक्ति बड़ी फाइल के साथ काम कर रहा था। अगर मैं इसके बारे में अधिक सुन सकता तो यह अच्छा होगा। –

+0

मेरा अनुभव भी सुझाव देता है कि '8 एम' को हरा करना मुश्किल है। –

44

के रूप में अन्य लोगों ने कहा, वहाँ कोई सार्वभौमिक सही ब्लॉक आकार है, एक स्थिति के लिए इष्टतम क्या है या हार्डवेयर का एक टुकड़ा दूसरे के लिए बेहद अक्षम हो सकता है। इसके अलावा, डिस्क के स्वास्थ्य के आधार पर "इष्टतम" की तुलना में एक अलग ब्लॉक आकार का उपयोग करना बेहतर हो सकता है।

आधुनिक हार्डवेयर पर बहुत विश्वसनीय है कि एक चीज यह है कि 512 बाइट्स का डिफ़ॉल्ट ब्लॉक आकार लगभग इष्टतम विकल्प की तुलना में धीमी गति का क्रम होता है। संदेह में, मुझे पता चला है कि 64K एक सुंदर ठोस आधुनिक डिफ़ॉल्ट है। हालांकि 64K आमतौर पर इष्टतम ब्लॉक आकार नहीं है, मेरे अनुभव में यह डिफ़ॉल्ट से बहुत अधिक कुशल होता है। 64K भी मज़बूती से performant होने का एक बहुत ठोस इतिहास रहा है: आप यहाँ 64K के एक ब्लॉक आकार की सिफारिश करने, 2002 के लगभग Eug-फिरना मेलिंग सूची से संदेश प्राप्त कर सकते हैं,: http://www.mail-archive.com/[email protected]/msg12073.html

इष्टतम उत्पादन ब्लॉक आकार का निर्धारण करने के लिए, मैं निम्नलिखित स्क्रिप्ट लिखी है जो विभिन्न ब्लॉक आकारों की एक सीमा पर डीडी के साथ एक 128 एम परीक्षण फ़ाइल लिखने का परीक्षण करती है, 512 बाइट्स के अधिकतम से अधिकतम 64 एम तक। चेतावनी दीजिये, यह स्क्रिप्ट आंतरिक रूप से डीडी का उपयोग करती है, इसलिए सावधानी के साथ उपयोग करें।

dd_obs_test.sh:

#!/bin/bash 

# Since we're dealing with dd, abort if any errors occur 
set -e 

TEST_FILE=${1:-dd_obs_testfile} 
TEST_FILE_EXISTS=0 
if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=1; fi 
TEST_FILE_SIZE=134217728 

if [ $EUID -ne 0 ]; then 
    echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2 
fi 

# Header 
PRINTF_FORMAT="%8s : %s\n" 
printf "$PRINTF_FORMAT" 'block size' 'transfer rate' 

# Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M 
for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864 
do 
    # Calculate number of segments required to copy 
    COUNT=$(($TEST_FILE_SIZE/$BLOCK_SIZE)) 

    if [ $COUNT -le 0 ]; then 
    echo "Block size of $BLOCK_SIZE estimated to require $COUNT blocks, aborting further tests." 
    break 
    fi 

    # Clear kernel cache to ensure more accurate test 
    [ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches 

    # Create a test file with the specified block size 
    DD_RESULT=$(dd if=/dev/zero of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync 2>&1 1>/dev/null) 

    # Extract the transfer rate from dd's STDERR output 
    TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?') 

    # Clean up the test file if we created one 
    if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fi 

    # Output the result 
    printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE" 
done 

View on GitHub

मैं केवल एक डेबियन (उबंटू) सिस्टम पर और OSX Yosemite पर इस स्क्रिप्ट परीक्षण किया है, तो यह शायद पर काम करने के लिए कुछ फेरबदल ले जाएगा अन्य यूनिक्स स्वाद।

डिफ़ॉल्ट रूप से कमांड वर्तमान निर्देशिका में dd_obs_testfile नाम की एक परीक्षण फ़ाइल तैयार करेगा।

$ ./dd_obs_test.sh /path/to/disk/test_file 

स्क्रिप्ट का आउटपुट का परीक्षण ब्लॉक आकार और इतने की तरह अपने-अपने स्थानांतरण दरों की एक सूची है: वैकल्पिक रूप से, आप स्क्रिप्ट नाम के बाद एक पथ प्रदान करके एक कस्टम परीक्षण फाइल करने के लिए एक मार्ग प्रदान कर सकते हैं:

$ ./dd_obs_test.sh 
block size : transfer rate 
     512 : 11.3 MB/s 
     1024 : 22.1 MB/s 
     2048 : 42.3 MB/s 
     4096 : 75.2 MB/s 
     8192 : 90.7 MB/s 
    16384 : 101 MB/s 
    32768 : 104 MB/s 
    65536 : 108 MB/s 
    131072 : 113 MB/s 
    262144 : 112 MB/s 
    524288 : 133 MB/s 
    1048576 : 125 MB/s 
    2097152 : 113 MB/s 
    4194304 : 106 MB/s 
    8388608 : 107 MB/s 
    16777216 : 110 MB/s 
    33554432 : 119 MB/s 
    67108864 : 134 MB/s 

(नोट: अंतरण दर की इकाई ओएस द्वारा अलग अलग होंगे) आप कम या ज्यादा एक ही प्रक्रिया का उपयोग कर सकता, बजाय/dev से पढ़ने की

इष्टतम पढ़ने ब्लॉक आकार का परीक्षण करने के लिए, लेकिन/शून्य और writi डिस्क पर एनजी, आप डिस्क से पढ़ेंगे और/dev/null पर लिखेंगे। यह करने के लिए एक स्क्रिप्ट तो ऐसा दिखाई देगा:

dd_ibs_test.sh:

#!/bin/bash 

# Since we're dealing with dd, abort if any errors occur 
set -e 

TEST_FILE=${1:-dd_ibs_testfile} 
if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=$?; fi 
TEST_FILE_SIZE=134217728 

# Exit if file exists 
if [ -e $TEST_FILE ]; then 
    echo "Test file $TEST_FILE exists, aborting." 
    exit 1 
fi 
TEST_FILE_EXISTS=1 

if [ $EUID -ne 0 ]; then 
    echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2 
fi 

# Create test file 
echo 'Generating test file...' 
BLOCK_SIZE=65536 
COUNT=$(($TEST_FILE_SIZE/$BLOCK_SIZE)) 
dd if=/dev/urandom of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync > /dev/null 2>&1 

# Header 
PRINTF_FORMAT="%8s : %s\n" 
printf "$PRINTF_FORMAT" 'block size' 'transfer rate' 

# Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M 
for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864 
do 
    # Clear kernel cache to ensure more accurate test 
    [ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches 

    # Read test file out to /dev/null with specified block size 
    DD_RESULT=$(dd if=$TEST_FILE of=/dev/null bs=$BLOCK_SIZE 2>&1 1>/dev/null) 

    # Extract transfer rate 
    TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?') 

    printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE" 
done 

# Clean up the test file if we created one 
if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fi 

View on GitHub

इस मामले में एक महत्वपूर्ण अंतर यह है कि परीक्षण फ़ाइल एक फ़ाइल है कि स्क्रिप्ट ने लिखा है है ।इस आदेश को किसी मौजूदा फ़ाइल पर इंगित न करें या मौजूदा फ़ाइल शून्य से ओवरराइट की जाएगी!

मेरे विशेष हार्डवेयर के लिए मैंने पाया कि 128K एचडीडी पर सबसे इष्टतम इनपुट ब्लॉक आकार था और 32 के एसएसडी पर सबसे इष्टतम था।

हालांकि इस उत्तर में मेरे अधिकांश निष्कर्ष शामिल हैं, मैंने इस स्थिति में पर्याप्त समय में भाग लिया है कि मैंने इसके बारे में एक ब्लॉग पोस्ट लिखा है: http://blog.tdg5.com/tuning-dd-block-size/ आप वहां किए गए परीक्षणों पर अधिक विशिष्टताएं पा सकते हैं।

+0

मैंने 512 जी एसएसडी के साथ 2015 आरएमबीपी पर, दूसरी स्क्रिप्ट चलाई है, प्रदर्शन को पढ़ने का परीक्षण किया है। सबसे अच्छा ब्लॉक आकार 8388608 था: 3.582 जीबी बाइट्स/सेकंड। –

+0

सुधार: मैंने 512 जीबी एसएसडी के साथ 2015 आरएमबीपी पर दूसरी पटकथा को पढ़ा है, प्रदर्शन को पढ़ा है। सबसे अच्छा ब्लॉक आकार 524288 (5.754 जीबी/सेकंड) था। दूसरा सबसे अच्छा ब्लॉक आकार 131072 (5.133 जीबी/सेकंड) था। (मैंने अपनी आखिरी टिप्पणी के लिए मूल्यों को उत्पन्न करने में गलत तरीके से परिणामों को हल किया।) –

+0

'dd_obs_test.sh'' conv = fsync' मैकोज़ पर काम नहीं करता है और इसे हटाया जा सकता है। – rynop

संबंधित मुद्दे