एक बार सीएसवी read.csv
के माध्यम से लोड हो जाने के बाद, सीएसवी में डेटा के साथ खेलने के लिए multicore
, segue
आदि का उपयोग करना काफी मुश्किल है। हालांकि, इसे पढ़ने में काफी समय लगता है।आर: क्या 20 मिलियन से अधिक पंक्ति सीएसवी में आर को पढ़ने के लिए समानांतर/गति-अप करना संभव है?
एहसास इसका इस्तेमाल लिए MySQL आदि आदि
एक एडब्ल्यूएस 8xl के उपयोग मान लें बेहतर है गणना उदाहरण R2.13
चल क्लस्टरचश्मा इस प्रकार है:
Cluster Compute Eight Extra Large specifications:
88 EC2 Compute Units (Eight-core 2 x Intel Xeon)
60.5 GB of memory
3370 GB of instance storage
64-bit platform
I/O Performance: Very High (10 Gigabit Ethernet)
किसी भी विचार/विचारों बहुत सराहना की।
यह प्रश्न आपके लिए भी दिलचस्प हो सकता है: http://stackoverflow.com/questions/9061736/faster-than-scan-with-rcpp –
या यह भी एक साथ http://stackoverflow.com/questions/1727772/जल्दी-पढ़ने-बहुत-बड़े-टेबल-जैसे-डेटाफ्रेम-इन-आर –