data.table
मैनुअल से:कुंजी के लिए डेटाटेबल में "चरित्र को अक्सर कारक पसंद किया जाता है" क्यों?
वास्तव में हम चाहते यह इतना है कि data.table एक गिनती तरह आर के आंतरिक वैश्विक स्ट्रिंग कैश का उपयोग कर चरित्र वैक्टर के लिए एल्गोरिथ्म शामिल हैं। यह विशेष रूप से कैरेक्टर वैक्टरों के लिए तेज़ है जिसमें कई डुप्लिकेट हैं, जैसे कुंजी कॉलम में समूहित डेटा। इसका मतलब है कि चरित्र को अक्सर कारक के लिए प्राथमिकता दी जाती है। कारक अभी भी पूरी तरह से समर्थित हैं, विशेष रूप से आदेशित कारकों में (जहां स्तर वर्णमाला क्रम में नहीं हैं)।
factor
सिर्फ पूर्णांक जो character
से counting sort
करना आसान होना चाहिए नहीं है?
मुझे लगता है कि यह डेटा.table FAQ से मदद कर सकता है 2.17 'चूंकि वैश्विक स्ट्रिंग कैश आर में जोड़ा गया था, इसलिए वर्ण आइटम एक कैश में पॉइंटर होते हैं स्ट्रिंग और अब कारक को कवर करने का प्रदर्शन सिद्धांत नहीं है। – agstudy