2013-01-10 14 views
5

उदाहरण के लिए मेरे पास है जब:स्ट्रिंग अक्षर के लिए संकलित आउटपुट में .rodata और .rodata.str1.4 खंड के बीच क्या अंतर है?

const char mesg [] = "Hello World"; 

यह सीधे .rodata में डाल दिया जाता है, लेकिन जब मेरे पास है:

const char* mesg = "Hello World"; 

यह .rodata.str1.4

में सीधे डाल दिया है क्या उन दोनों के बीच का अंतर है और जब हम सूचक का उपयोग करते हैं तो हम .rodata.str1.4 का उपयोग क्यों करते हैं?

+0

क्या कंपाइलर, संस्करण और संकलन कमांड? –

+0

क्लैंग 3.5 स्थानीय स्ट्रिंग अक्षरों के लिए '.rodata.str1.1' पर रखता है, ग्लोबल्स के लिए 'डेटा', इसलिए मैं काफी पुन: पेश नहीं करता हूं। –

उत्तर

3

मैं प्रयोगों की एक जोड़ी है, ऐसा लगता संकलक वस्तु फ़ाइलों में विशेष वर्गों में तार स्थानों की तरह था। रोचक चीज तब होती है जब बाइनरी संकलित होती है, स्ट्रिंग्स को उम्मीद के अनुसार .rodata में समाप्त होता है। आगे के प्रयोगों से पता चलता है कि क्या होता है कि यदि आपके पास अलग-अलग वस्तुओं में एक ही स्ट्रिंग है तो वे परिणामस्वरूप बाइनरी में एक ही स्ट्रिंग में एकीकृत हो जाते हैं।

तो मुझे संदेह होगा कि इसका कारण यह है कि संकलक लिंकर को "केवल पढ़ने के लिए" के अलावा केवल पढ़ने के डेटा के बारे में कुछ जानकारी देना चाहता है, ताकि अंतिम लिंक अधिक बुद्धिमान निर्णय ले सके deduplication सहित इसे कैसे संभालें।

$ cat foo.c 
const char * 
fun(int i) 
{ 
     const char *foo = "foofoo foo foo foo"; 
    const char *bar = "barbar bar bar bar"; 
    return i ? foo : bar; 
} 
$ cat bar.c 
#include <stdio.h> 
extern const char *fun(int); 

int 
main(int argc, char **argv) 
{ 
    const char *foo = "foofoo foo foo foo"; 

    printf("%s%s\n", foo, fun(1)); 
    return 0; 
} 
$ cc -c -O2 foo.c 
$ cc -c -O2 bar.c 
$ objdump -s foo.o 
[...] 
Contents of section .rodata.str1.1: 
0000 62617262 61722062 61722062 61722062 barbar bar bar b 
0010 61720066 6f6f666f 6f20666f 6f20666f ar.foofoo foo fo 
0020 6f20666f 6f00      o foo. 
[...] 
$ objdump -s bar.o 
[...] 
Contents of section .rodata.str1.1: 
0000 666f6f66 6f6f2066 6f6f2066 6f6f2066 foofoo foo foo f 
0010 6f6f0025 7325730a 00     oo.%s%s.. 
[...] 
$ cc -o foobar foo.o bar.o 
$ objdump -s foobar 
[...] 
Contents of section .rodata: 
400608 01000200 00000000 00000000 00000000 ................ 
400618 62617262 61722062 61722062 61722062 barbar bar bar b 
400628 61720066 6f6f666f 6f20666f 6f20666f ar.foofoo foo fo 
400638 6f20666f 6f002573 25730a00   o foo.%s%s.. 
[...] 
+0

आपके उत्तर के लिए धन्यवाद, मेरे पास अभी एक छोटा सा सवाल है। क्या आप कृपया मुझे बता सकते हैं कि मैं ईएलएफ फ़ाइल के अनुभागों का क्रम कैसे देख सकता हूं? – mehmetozer

+0

मुझे नहीं पता कि क्या objdump आपको क्रम में देता है या किसी भी तरह से उन्हें टाइप करता है। खुद के साथ वही बात। यदि आप वास्तव में सुनिश्चित होना चाहते हैं, तो ईएलएफ शीर्षकों को स्वयं पार्स करें, यह वास्तव में कठिन नहीं है। हेडर सभी मेरे सिस्टम पर '/ usr/include/elf.h' में हैं और हर जगह कुछ समान होना चाहिए। ईएलएफ को पढ़ने और विश्लेषण करने के तरीके पर नेट पर मार्गदर्शिकाएं हैं। आप क्यों जानना चाहेंगे कि यद्यपि? – Art

+0

बहुत बहुत धन्यवाद। मैं बस उनके आदेश सीखना चाहता था। क्या यह .text, .rodata, .data, .bss, .heap और .stack नहीं है? – mehmetozer

2

विभिन्न compilers, केवल पढ़ने के लिए डेटा के लिए विभिन्न वर्गों का उपयोग कर सकते प्रकार, घोषणाओं, आदि के आधार पर

.rodata, प्रथा के अनुसार, कुछ भी है कि एक पढ़ा में रखा जा करने की आवश्यकता होगी के लिए इस्तेमाल किया जा सकता लोडर द्वारा स्मृति का केवल एक हिस्सा।
तो वहां कॉन्स char * रखने के लिए ठीक रहेगा।

लेकिन आम तौर पर, संकलक केवल पढ़ने के लिए डेटा को वर्गीकृत करने के लिए .rodata द्वारा prefixed अनुभाग भी उत्पन्न करते हैं।
इसे लोडर द्वारा अनदेखा किया जा सकता है, और वास्तव में .rodata अनुभाग के रूप में व्यवहार किया जाता है (मुझे लगता है कि यह अक्सर मामला होना चाहिए), लेकिन यदि आवश्यक हो तो यह स्मृति में कुछ विशिष्ट व्यवस्था की अनुमति दे सकता है।

यही कारण है कि लिंकर स्क्रिप्ट अक्सर .rodata निर्दिष्ट और है .rodata *

संबंधित मुद्दे