2015-04-02 3 views
5

किसी को भी किसी भी पैकेज या कार्यक्षमता है कि जोक्या आर में दूरस्थ कार्य के लिए कोई स्पैस समर्थन है?

दूरी मैट्रिक्स कि एक डेटा की पंक्तियों के बीच की दूरी की गणना करने के निर्धारित दूरी को मापने का उपयोग करके की जाती है बनाता आर से dist{stats} समारोह के रूप में ही काम करता बारे में सुना है मैट्रिक्स,

लेकिन इनपुट के रूप में एक स्प्रेज़ मैट्रिक्स लें?

मेरा डेटा.फ्रेम (नाम dataCluster) में मंदता है: 7000 एक्स 10000 और लगभग 99% स्पैस है। कि विरल नहीं है नियमित रूप में इस समारोह में एक जवाब के बिना काम करना बंद कर प्रतीत होता है नहीं ...

h1 <- hclust(dist(dataCluster) , method = "complete") 

इसी प्रकार के प्रश्न: Sparse Matrix as input to Hierarchical clustering in R

उत्तर

2

आप wordspace::dist.matrix चाहते हैं।

यह Matrix पैकेज से विरल मैट्रिक्स (जो दस्तावेज़ से स्पष्ट नहीं है) और यह भी पार दूरी, उत्पादन दोनों Matrix और dist वस्तुओं और कुछ कर सकते हैं स्वीकार करता है।

डिफ़ॉल्ट दूरी माप 'cosine' है, इसलिए यदि आप चाहते हैं तो method = 'euclidean' निर्दिष्ट करना सुनिश्चित करें।

+0

2 साल बीत चुके हैं क्योंकि मैंने इस सवाल से पूछा है। जवाब के लिए धन्यवाद! अब मैं स्पैस मैट्रिक्स के लिए 'कोसाइन' दूरी का उपयोग करूंगा जो शायद दस्तावेज़ शब्द मैट्रिक्स का प्रतिनिधित्व करता है जिसे मैं शायद उस दिन क्लस्टर करना चाहता था:) –

+0

हाहा मुझे पता है, लेकिन मैंने सोचा कि यह जवाब का हकदार है। साथ ही, जब आप सवाल पूछते थे तो पैकेज मौजूद नहीं था, इसलिए कम से कम हम दोनों और पैकेज लेखक को समस्या थी: डी –

+0

'quanteda :: textstat_dist() 'स्पैर मैट्रिस भी लेता है जैसे' dgCMatrix' 'मैट्रिक्स 'पैकेज और एक दूरस्थ वस्तु देता है। –

संबंधित मुद्दे