2011-04-25 11 views
16

क्या कोई मुझे बता सकता है कि उच्च आयामी डेटा को देखने के लिए कोई अच्छा (आसान) तरीका है या नहीं? मेरा डेटा वर्तमान में 21 आयाम है लेकिन मैं देखना चाहता हूं कि यह घना या स्पैस है या नहीं। क्या यह हासिल करने के लिए तकनीकें हैं?क्या उच्च आयामी डेटा को देखने के लिए कोई अच्छा और आसान तरीका है?

+2

मुझे एक उत्तर के बारे में पता नहीं है, लेकिन, मैं आपको बता सकता हूं कि इसे अनुकूलित करना बहुत ही गर्म शोध विषय है। –

+0

मैं एक विज़ुअलाइज़ेशन टूल जैसे टेबलू या स्पॉटफायर का उपयोग करने का सुझाव देता हूं। फिर भी, 21 आयाम बहुत अधिक हैं, इसलिए आपको इसे किसी सार्थक स्तर पर प्राप्त करने के लिए शायद कुछ प्रकार की आयाम कमी तकनीक करने की आवश्यकता होगी http://www.tableausoftware.com/public –

उत्तर

16

Parallel coordinates उच्च-आयामी डेटा को देखने के लिए एक लोकप्रिय विधि है।

विशेष रूप से आपके डेटा के लिए किस तरह का विज़ुअलाइज़ेशन सर्वोत्तम है, इसकी विशेषताओं पर निर्भर करेगा - विभिन्न आयामों से कैसे संबंधित हैं?

0

स्टार स्कीमा।

http://en.wikipedia.org/wiki/Star_schema

उच्च आयामी डेटा के लिए अच्छी तरह से काम करता है।

यदि आपकी तथ्य तालिका की कार्डिनालिटी आपके आयाम आकार के उत्पाद के करीब है, तो आपके पास घना डेटा है।

यदि आपकी तथ्य तालिका की कार्डिनालिटी आपके आयाम आकार के उत्पाद से छोटी है, तो आपके पास स्पैस डेटा है।

बीच में आपके पास एक निर्णय कॉल है।

8

जो buzzword मैं खोजता हूं वह multidimensional scaling है। यह उच्च आयामी अंतरिक्ष से निचले स्थान (2 या 3 आयामी) तक प्रक्षेपण को विकसित करने की एक तकनीक है जिससे कि पूर्ण स्थान में बंद होने वाले बिंदु प्रक्षेपण में बंद हो जाएंगे।

यह अक्सर क्लस्टरिंग एल्गोरिदम के आउटपुट को देखने के लिए उपयोग किया जाता है (यानी यदि आपके क्लस्टर एमडीएस प्रक्षेपण में कॉम्पैक्ट हैं तो एक अच्छी संभावना है कि वे पूरी जगह में भी हैं)।

संपादित करें: यह आवश्यक रूप से यह निर्धारित करने में मदद नहीं करेगा कि डेटा घना या स्पैस है, क्योंकि आप प्रक्षेपण में पैमाने खो देते हैं, लेकिन यह दिखाएगा कि यह एक समान या गड़बड़ है (शायद यही मतलब है कि आप क्या मतलब है)।

0

curios.IT डेटा एक्सप्लोरेशन सॉफ़्टवेयर उच्च आयामी डेटा के विज़ुअलाइजेशन के लिए डिज़ाइन किया गया है: डेटा को 3 डी ऑब्जेक्ट्स (प्रत्येक डेटा समूह के लिए एक) के संग्रह के रूप में दिखाया जाता है जो एक ही समय में 13 चर दिखा सकता है। डेटा चर और दृश्य सुविधाओं के बीच संबंध अन्य तकनीकों (जैसे समांतर निर्देशांक) की तुलना में याद रखना बहुत आसान है।

3

यह सुनिश्चित नहीं है कि आप डेटा से किस प्रकार के पैटर्न देखना चाहते हैं। टी-एसएनई और इसके तेज संस्करण बार्न्स-हट-एसएनई उच्च-आयामी डेटा के लिए संबंधित अवधारणाओं के समूहों को देखने में बहुत अच्छा काम करते हैं। यह आर

के माध्यम से उपलब्ध है, यह 300 आयामों के साथ उच्च-आयामी डेटा के खिलाफ इसका उपयोग करने पर एक छोटा सा ट्यूटोरियल है। http://www.codeproject.com/Tips/788739/Visualizing-High-Dimensional-Vector-using-T-SNE-wi

2

http://www.ggobi.org (पर्यटन, समानांतर निर्देशांक, scatterplot मैट्रिक्स) वास्तविक मूल्य चर के लिए इस्तेमाल किया जा सकता पर एक नजर डालें। हाल ही में http://cranvas.org के लिए भी। आर

2

में टूरर पैकेज मैं उच्च आयामी डेटा को देखने के तरीकों की तलाश में था और यह t-SNE technique पाया गया है जिसका प्रभावी ढंग से उपयोग किया गया है। दूसरों को भी मदद कर सकते हैं।

+0

बहुत स्पैम देख रहे हैं – Cory

+0

क्या है, @Cory ? मुझे यह प्रश्न मिला है जब मैं उच्च आयामी डेटा के अच्छे विज़ुअलाइज़ेशन की खोज करने की कोशिश कर रहा हूं, जिसके साथ मैं काम कर रहा हूं और टी-एसएनई पेज जो मैंने लिंक किया है वह एक अच्छा ओपन-सोर्स सॉफ़्टवेयर है, मैंने सोचा कि दूसरों को एक –

+0

की तलाश में लाभ होगा, पहले पोस्ट, एक लिंक, मैंने पृष्ठ पर देखा और यह क्रेडिटबल देखा, लेकिन मुझे एक ही बिल्ड अप के साथ अनगिनत स्पैम पोस्ट दिखाई दे रही हैं। मेरे हिस्से पर भ्रम के लिए खेद है, क्या आप कृपया अपनी पोस्ट संपादित कर सकते हैं ताकि यह मुझे वोट बदलने की अनुमति दे। – Cory

1

http://hypertools.readthedocs.io/en/latest/ का उपयोग करने का प्रयास करें।

हाइपरटूल पाइथन में उच्च-आयामी डेटा को विज़ुअलाइज़ करने और छेड़छाड़ करने के लिए एक लाइब्रेरी है।

संबंधित मुद्दे

 संबंधित मुद्दे