2011-12-30 10 views
18

सभी अन्य कारकों बराबर (जैसे अनुकूलन स्तर) जा रहा है, कैसे एक ELF में डिबग प्रतीकों हो रही है या ऐसा नहीं करता है प्रभावित करते हैं:डीबग प्रतीक जीसीसी द्वारा संकलित लिनक्स निष्पादन योग्य के प्रदर्शन को कैसे प्रभावित करते हैं?

  1. लोड होने का समय।
  2. रनटाइम मेमोरी पदचिह्न।
  3. रनटाइम प्रदर्शन?

और किसी भी नकारात्मक प्रभाव को कम करने के लिए क्या किया जा सकता है?

संपादित मैं इस सवाल को देखा है लेकिन मैं चर्चा बेकार लगता है, के रूप में कोड अनुकूलन कारक समस्या उलझन में है। Why does my code run slower with multiple threads than with a single thread when it is compiled for profiling (-pg)?

उत्तर

21

डीबग प्रतीक कोड/डेटा अनुभागों से पूरी तरह से अलग-अलग वर्गों में स्थित हैं। आप objdump के साथ देख सकते हैं:

$ objdump -h a.out 

a.out:  file format elf64-x86-64 

Sections: 
Idx Name   Size  VMA    LMA    File off Algn 
    0 .interp  0000001c 0000000000400200 0000000000400200 00000200 2**0 
        CONTENTS, ALLOC, LOAD, READONLY, DATA 
    1 .note.ABI-tag 00000020 000000000040021c 000000000040021c 0000021c 2**2 
        CONTENTS, ALLOC, LOAD, READONLY, DATA 
    2 .note.gnu.build-id 00000024 000000000040023c 000000000040023c 0000023c 2**2 
        CONTENTS, ALLOC, LOAD, READONLY, DATA 
    3 .hash   00000018 0000000000400260 0000000000400260 00000260 2**3 
        CONTENTS, ALLOC, LOAD, READONLY, DATA 
    4 .gnu.hash  0000001c 0000000000400278 0000000000400278 00000278 2**3 
        CONTENTS, ALLOC, LOAD, READONLY, DATA 
    5 .dynsym  00000048 0000000000400298 0000000000400298 00000298 2**3 
        CONTENTS, ALLOC, LOAD, READONLY, DATA 
    6 .dynstr  00000038 00000000004002e0 00000000004002e0 000002e0 2**0 
        CONTENTS, ALLOC, LOAD, READONLY, DATA 
    7 .gnu.version 00000006 0000000000400318 0000000000400318 00000318 2**1 
        CONTENTS, ALLOC, LOAD, READONLY, DATA 
    8 .gnu.version_r 00000020 0000000000400320 0000000000400320 00000320 2**3 
        CONTENTS, ALLOC, LOAD, READONLY, DATA 
    9 .rela.dyn  00000018 0000000000400340 0000000000400340 00000340 2**3 
        CONTENTS, ALLOC, LOAD, READONLY, DATA 
10 .rela.plt  00000018 0000000000400358 0000000000400358 00000358 2**3 
        CONTENTS, ALLOC, LOAD, READONLY, DATA 
11 .init   00000018 0000000000400370 0000000000400370 00000370 2**2 
        CONTENTS, ALLOC, LOAD, READONLY, CODE 
12 .plt   00000020 0000000000400388 0000000000400388 00000388 2**2 
        CONTENTS, ALLOC, LOAD, READONLY, CODE 
13 .text   000001c8 00000000004003b0 00000000004003b0 000003b0 2**4 
        CONTENTS, ALLOC, LOAD, READONLY, CODE 
14 .fini   0000000e 0000000000400578 0000000000400578 00000578 2**2 
        CONTENTS, ALLOC, LOAD, READONLY, CODE 
15 .rodata  00000004 0000000000400588 0000000000400588 00000588 2**2 
        CONTENTS, ALLOC, LOAD, READONLY, DATA 
16 .eh_frame_hdr 00000024 000000000040058c 000000000040058c 0000058c 2**2 
        CONTENTS, ALLOC, LOAD, READONLY, DATA 
17 .eh_frame  0000007c 00000000004005b0 00000000004005b0 000005b0 2**3 
        CONTENTS, ALLOC, LOAD, READONLY, DATA 
18 .ctors  00000010 0000000000600630 0000000000600630 00000630 2**3 
        CONTENTS, ALLOC, LOAD, DATA 
19 .dtors  00000010 0000000000600640 0000000000600640 00000640 2**3 
        CONTENTS, ALLOC, LOAD, DATA 
20 .jcr   00000008 0000000000600650 0000000000600650 00000650 2**3 
        CONTENTS, ALLOC, LOAD, DATA 
21 .dynamic  000001a0 0000000000600658 0000000000600658 00000658 2**3 
        CONTENTS, ALLOC, LOAD, DATA 
22 .got   00000008 00000000006007f8 00000000006007f8 000007f8 2**3 
        CONTENTS, ALLOC, LOAD, DATA 
23 .got.plt  00000020 0000000000600800 0000000000600800 00000800 2**3 
        CONTENTS, ALLOC, LOAD, DATA 
24 .data   00000010 0000000000600820 0000000000600820 00000820 2**3 
        CONTENTS, ALLOC, LOAD, DATA 
25 .bss   00000010 0000000000600830 0000000000600830 00000830 2**3 
        ALLOC 
26 .comment  00000039 0000000000000000 0000000000000000 00000830 2**0 
        CONTENTS, READONLY 
27 .debug_aranges 00000030 0000000000000000 0000000000000000 00000869 2**0 
        CONTENTS, READONLY, DEBUGGING 
28 .debug_pubnames 0000001b 0000000000000000 0000000000000000 00000899 2**0 
        CONTENTS, READONLY, DEBUGGING 
29 .debug_info 00000055 0000000000000000 0000000000000000 000008b4 2**0 
        CONTENTS, READONLY, DEBUGGING 
30 .debug_abbrev 00000034 0000000000000000 0000000000000000 00000909 2**0 
        CONTENTS, READONLY, DEBUGGING 
31 .debug_line 0000003b 0000000000000000 0000000000000000 0000093d 2**0 
        CONTENTS, READONLY, DEBUGGING 
32 .debug_str 00000026 0000000000000000 0000000000000000 00000978 2**0 
        CONTENTS, READONLY, DEBUGGING 
33 .debug_loc 0000004c 0000000000000000 0000000000000000 0000099e 2**0 
        CONTENTS, READONLY, DEBUGGING 

आप अतिरिक्त वर्गों (27 33 के माध्यम से) देख सकते हैं। ये अनुभाग रनटाइम पर लोड नहीं होंगे, इसलिए कोई प्रदर्शन जुर्माना नहीं होगा। gdb का प्रयोग करके आप क्रम

$ gdb ./a.out 
(gdb) break main 
(gdb) run 
(gdb) info files 
// blah blah .... 
Local exec file: 
     `/home/kghost/a.out', file type elf64-x86-64. 
     Entry point: 0x4003b0 
     0x0000000000400200 - 0x000000000040021c is .interp 
     0x000000000040021c - 0x000000000040023c is .note.ABI-tag 
     0x000000000040023c - 0x0000000000400260 is .note.gnu.build-id 
     0x0000000000400260 - 0x0000000000400278 is .hash 
     0x0000000000400278 - 0x0000000000400294 is .gnu.hash 
     0x0000000000400298 - 0x00000000004002e0 is .dynsym 
     0x00000000004002e0 - 0x0000000000400318 is .dynstr 
     0x0000000000400318 - 0x000000000040031e is .gnu.version 
     0x0000000000400320 - 0x0000000000400340 is .gnu.version_r 
     0x0000000000400340 - 0x0000000000400358 is .rela.dyn 
     0x0000000000400358 - 0x0000000000400370 is .rela.plt 
     0x0000000000400370 - 0x0000000000400388 is .init 
     0x0000000000400388 - 0x00000000004003a8 is .plt 
     0x00000000004003b0 - 0x0000000000400578 is .text 
     0x0000000000400578 - 0x0000000000400586 is .fini 
     0x0000000000400588 - 0x000000000040058c is .rodata 
     0x000000000040058c - 0x00000000004005b0 is .eh_frame_hdr 
     0x00000000004005b0 - 0x000000000040062c is .eh_frame 
     0x0000000000600630 - 0x0000000000600640 is .ctors 
     0x0000000000600640 - 0x0000000000600650 is .dtors 
     0x0000000000600650 - 0x0000000000600658 is .jcr 
     0x0000000000600658 - 0x00000000006007f8 is .dynamic 
     0x00000000006007f8 - 0x0000000000600800 is .got 
     0x0000000000600800 - 0x0000000000600820 is .got.plt 
     0x0000000000600820 - 0x0000000000600830 is .data 
     0x0000000000600830 - 0x0000000000600840 is .bss 
// blah blah .... 

पर उन्हें जांच कर सकते हैं तो केवल दंड है कि आप अतिरिक्त डिस्क स्थान की जरूरत है इस जानकारी को संग्रहीत करने के लिए है। तुम भी डिबग जानकारी निकालने के लिए strip उपयोग कर सकते हैं:

$ strip a.out 

उपयोग objdump इसे फिर से जाँच करने के लिए, आप अंतर देखेंगे।

संपादित करें:

इसके बजाय देख वर्गों, वास्तव में लोडर अपने Program Header, जो objdump -p द्वारा देखा जा सकता के अनुसार योगिनी फ़ाइल लोड करता है। (निम्न उदाहरण एक अलग योगिनी द्विआधारी उपयोग कर रहा है)

$ objdump -p /bin/cat 

/bin/cat:  file format elf64-x86-64 

Program Header: 
    PHDR off 0x0000000000000040 vaddr 0x0000000000000040 paddr 0x0000000000000040 align 2**3 
     filesz 0x00000000000001f8 memsz 0x00000000000001f8 flags r-x 
    INTERP off 0x0000000000000238 vaddr 0x0000000000000238 paddr 0x0000000000000238 align 2**0 
     filesz 0x000000000000001c memsz 0x000000000000001c flags r-- 
    LOAD off 0x0000000000000000 vaddr 0x0000000000000000 paddr 0x0000000000000000 align 2**21 
     filesz 0x00000000000078bc memsz 0x00000000000078bc flags r-x 
    LOAD off 0x0000000000007c28 vaddr 0x0000000000207c28 paddr 0x0000000000207c28 align 2**21 
     filesz 0x0000000000000678 memsz 0x0000000000000818 flags rw- 
DYNAMIC off 0x0000000000007dd8 vaddr 0x0000000000207dd8 paddr 0x0000000000207dd8 align 2**3 
     filesz 0x00000000000001e0 memsz 0x00000000000001e0 flags rw- 
    NOTE off 0x0000000000000254 vaddr 0x0000000000000254 paddr 0x0000000000000254 align 2**2 
     filesz 0x0000000000000044 memsz 0x0000000000000044 flags r-- 
EH_FRAME off 0x0000000000006980 vaddr 0x0000000000006980 paddr 0x0000000000006980 align 2**2 
     filesz 0x0000000000000274 memsz 0x0000000000000274 flags r-- 
    STACK off 0x0000000000000000 vaddr 0x0000000000000000 paddr 0x0000000000000000 align 2**4 
     filesz 0x0000000000000000 memsz 0x0000000000000000 flags rw- 
    RELRO off 0x0000000000007c28 vaddr 0x0000000000207c28 paddr 0x0000000000207c28 align 2**0 
     filesz 0x00000000000003d8 memsz 0x00000000000003d8 flags r-- 

कार्यक्रम हेडर बताओ जो खंड क्या झंडे rwx साथ लोड किया जाएगा, एक ही झंडे के साथ एकाधिक अनुभागों एक भी क्षेत्र के लिए विलय हो जाएगा।

BTW

:

लोडर वर्गों की परवाह नहीं करता जब योगिनी फ़ाइल लोड है, लेकिन यह जब जरूरत प्रतीकों को हल करने के लिए कई प्रतीक संबंधित वर्गों दिखेगा।

+2

ध्यान दें कि प्रत्येक खंड पर मुख्य विशेषता 'ALLOC' है - .debug अनुभागों में यह नहीं है, यह दर्शाता है कि वे रनटाइम पर लोड नहीं होंगे (सामान्य निष्पादन द्वारा)। मुझे यहां अधिक जानकारी मिली: http://www.tortall.net/projects/yasm/manual/html/objfmt-elf-section.html – Justicle

-2

डीबग प्रतीकों अनुकूलन को प्रभावित करने के तरीके के त्वरित विवरण के लिए आप Why does my code run slower with multiple threads than with a single thread when it is compiled for profiling (-pg)? पर देख सकते हैं।

अपने 3 सवालों के जवाब देने के लिए:

  1. लोड अवधि बढ़ जाएगी जब डिबग प्रतीकों आप शून्य के साथ संकलित हैं से ऊपर वाली डिस्क पर मौजूद नहीं
  2. पदचिह्न बड़ा
  3. हो जाएगा मौजूद हैं अनुकूलन तो आप वास्तव में कुछ भी खोना नहीं है। यदि आप अनुकूलन सेट करते हैं, तो डीबग प्रतीकों के कारण अनुकूलित कोड कम अनुकूलित किया जाएगा।
+9

मुझे पूरा यकीन है कि # 3 सत्य नहीं है; डीबग प्रतीकों की उपस्थिति या अनुपस्थिति कोड पीढ़ी को प्रभावित नहीं करती है। (डीबग प्रतीक ऑप्टिमाइज्ड बाइनरी में अचूक या आंशिक रूप से अनुपलब्ध हो सकते हैं।) – duskwuff

+6

आपके द्वारा लिंक किए गए प्रश्न का स्वीकार्य उत्तर यह बताता है कि पूछताछकर्ता के पास _profiling_ चालू है - इसमें रनटाइम जुर्माना है। डीबग प्रतीक नहीं करते हैं। – Mat

+1

धन्यवाद - मुझे उस विशेष प्रश्न को उपयोगी नहीं मिला क्योंकि चर्चा को अनुकूलन के साथ मिश्रित किया गया था। ध्यान दें कि यह उत्तर सीधे आपके सभी बिंदुओं के विपरीत है http://stackoverflow.com/a/8676610/94239 – Justicle

संबंधित मुद्दे