के साथ है, मुझे वास्तव में विशाल मैट्रिक्स (लगभग 300.000x100.000 मान जो 100 जीबी से अधिक है) पर के-साधन क्लस्टरिंग करना है। मैं जानना चाहता हूं कि मैं इसे या वीका करने के लिए आर सॉफ्टवेयर का उपयोग कर सकता हूं या नहीं। मेरा कंप्यूटर 8 जीबी रैम और सैकड़ों जीबी मुक्त स्थान के साथ एक मल्टीप्रोसेसर है।के-मतलब वास्तव में बड़े मैट्रिक्स
मेरे पास गणना के लिए पर्याप्त जगह है लेकिन ऐसे मैट्रिक्स को लोड करना आर के साथ एक समस्या प्रतीत होता है (मुझे नहीं लगता कि बड़े पैमाने पर पैकेज का उपयोग करने से मुझे और मेरी बड़ी रैम स्वचालित रूप से मेरी सभी रैम का उपयोग करने में मदद मिलेगी, तो मेरी स्वैप फ़ाइल नहीं काफी जगह)।
तो मेरा सवाल यह है कि: मुझे किस सॉफ्टवेयर का उपयोग करना चाहिए (अंत में कुछ अन्य पैकेज या कस्टम सेटिंग्स के साथ)।
मेरी मदद करने के लिए धन्यवाद।
नोट: मैं लिनक्स का उपयोग करता हूं।
कि एक मैट्रिक्स में इस डेटा भंडारण अधिकतम पूर्णांक मान (2147483647) में इंडेक्स को सीमित करता है, और आपके पास उससे अधिक तत्व हैं। यह एक स्मृति सीमा नहीं है, लेकिन एक सीमा है जो डेटा को इंडेक्स करने के लिए पूर्णांक का उपयोग करने से होती है। क्या आप इसके बजाय मैट्रिक्स का नमूना दे सकते हैं? – Noah
आप एक ही समय में सभी 300,000 वस्तुओं को क्लस्टर करना क्यों चाहते हैं? क्यों न छोटा नमूना लें, क्लस्टर करें और फिर शेष वस्तुओं को अपने निकटतम क्लस्टर में असाइन करें? –
आप कितने क्लस्टर ढूंढ रहे हैं? सत्यापन के लिए ज्ञात क्लस्टरिंग के साथ नमूने हैं? – denis