मैं बहुत बड़ी फ़ाइलों को पढ़ने के प्रयास में data.table (1.8.8, R 3.0.1) में फ़्रेड का उपयोग कर रहा हूं।फ़्रेड सुरक्षा स्टैक ओवरफ़्लो त्रुटि
प्रश्नों में फ़ाइल में 313 पंक्तियां और संख्यात्मक डेटा पंक्तियों के ~ 6.6 मिलियन कोल हैं और फ़ाइल लगभग 12 जीबी है। यह 512 जीबी रैम के साथ एक केंद्र 6.4 है।
जब मैं फ़ाइल में पढ़ने के लिए प्रयास:
g=fread('final.results',header=T,sep=' ')
'header' changed by user from 'auto' to TRUE
Error: protect(): protection stack overflow
मैं --max-ppsize 500000 है, जो अधिकतम है, लेकिन एक ही त्रुटि के साथ आर शुरू करने की कोशिश की।
मैं भी
ulimit -s unlimited
आभासी स्मृति के माध्यम से असीमित करने के लिए ढेर आकार सेट पहले से असीमित करने के लिए स्थापित किया गया था की कोशिश की।
क्या मैं इस आकार की फ़ाइल के साथ अवास्तविक हूं? क्या मुझे कुछ स्पष्ट याद आया?
कृपया आर-फोर्ज (डेटा.table मुखपृष्ठ पर लिंक) पर v1.8.9 आज़माएं। वहां 'फ्रेड' करने के लिए 10 बग फिक्स हैं, समाचार देखें। बड़े फ़ाइल समर्थन उनमें से एक है, लेकिन विंडोज़ पर पहले से ही लिनक्स पर ठीक होना चाहिए। 6.6 मिलियन कॉलम (!) नया है और अच्छी तरह से एक नई बग हो सकता है। कृपया v1.8.9 के साथ पुष्टि करें और हम वहां से चले जाएंगे ... –
@ मैथ्यूडॉवल हाँ मैं 6 मिलियन पंक्तियों से खुश नहीं हूं। 1.8.9 इंस्टॉल करें, एक ही त्रुटि। मैंने एक बहुत छोटी फाइल बनाई, 10 पंक्तियां x 50 के कोल, एक ही त्रुटि। 10 पंक्तियों x 49,999 कोल यह काम करता है। – mpmorley
क्या आपका मतलब उस टिप्पणी में कॉलम था (आपने 6 मिलियन पंक्तियां लिखी थीं)? बहुत रोचक और अजीब यह 50,000 कॉलम पर वास्तव में विफल रहता है। इतनी जल्दी उस पर सम्मान करने के लिए अच्छा किया। मुझे इस तरह की कोई कॉलम सीमा याद नहीं है। एक नज़र डालेगा –