क्या कोई मुझे बता सकता है कि उच्च आयामी डेटा को देखने के लिए कोई अच्छा (आसान) तरीका है या नहीं? मेरा डेटा वर्तमान में 21 आयाम है लेकिन मैं देखना चाहता हूं कि यह घना या स्पैस है या नहीं। क्या यह हासिल करने के लिए तकनीकें हैं?क्या उच्च आयामी डेटा को देखने के लिए कोई अच्छा और आसान तरीका है?
उत्तर
Principal component analysis आयामों का सहसंबंध होने पर सहायक हो सकता है।
Parallel coordinates उच्च-आयामी डेटा को देखने के लिए एक लोकप्रिय विधि है।
विशेष रूप से आपके डेटा के लिए किस तरह का विज़ुअलाइज़ेशन सर्वोत्तम है, इसकी विशेषताओं पर निर्भर करेगा - विभिन्न आयामों से कैसे संबंधित हैं?
स्टार स्कीमा।
http://en.wikipedia.org/wiki/Star_schema
उच्च आयामी डेटा के लिए अच्छी तरह से काम करता है।
यदि आपकी तथ्य तालिका की कार्डिनालिटी आपके आयाम आकार के उत्पाद के करीब है, तो आपके पास घना डेटा है।
यदि आपकी तथ्य तालिका की कार्डिनालिटी आपके आयाम आकार के उत्पाद से छोटी है, तो आपके पास स्पैस डेटा है।
बीच में आपके पास एक निर्णय कॉल है।
जो buzzword मैं खोजता हूं वह multidimensional scaling है। यह उच्च आयामी अंतरिक्ष से निचले स्थान (2 या 3 आयामी) तक प्रक्षेपण को विकसित करने की एक तकनीक है जिससे कि पूर्ण स्थान में बंद होने वाले बिंदु प्रक्षेपण में बंद हो जाएंगे।
यह अक्सर क्लस्टरिंग एल्गोरिदम के आउटपुट को देखने के लिए उपयोग किया जाता है (यानी यदि आपके क्लस्टर एमडीएस प्रक्षेपण में कॉम्पैक्ट हैं तो एक अच्छी संभावना है कि वे पूरी जगह में भी हैं)।
संपादित करें: यह आवश्यक रूप से यह निर्धारित करने में मदद नहीं करेगा कि डेटा घना या स्पैस है, क्योंकि आप प्रक्षेपण में पैमाने खो देते हैं, लेकिन यह दिखाएगा कि यह एक समान या गड़बड़ है (शायद यही मतलब है कि आप क्या मतलब है)।
curios.IT डेटा एक्सप्लोरेशन सॉफ़्टवेयर उच्च आयामी डेटा के विज़ुअलाइजेशन के लिए डिज़ाइन किया गया है: डेटा को 3 डी ऑब्जेक्ट्स (प्रत्येक डेटा समूह के लिए एक) के संग्रह के रूप में दिखाया जाता है जो एक ही समय में 13 चर दिखा सकता है। डेटा चर और दृश्य सुविधाओं के बीच संबंध अन्य तकनीकों (जैसे समांतर निर्देशांक) की तुलना में याद रखना बहुत आसान है।
यह सुनिश्चित नहीं है कि आप डेटा से किस प्रकार के पैटर्न देखना चाहते हैं। टी-एसएनई और इसके तेज संस्करण बार्न्स-हट-एसएनई उच्च-आयामी डेटा के लिए संबंधित अवधारणाओं के समूहों को देखने में बहुत अच्छा काम करते हैं। यह आर
के माध्यम से उपलब्ध है, यह 300 आयामों के साथ उच्च-आयामी डेटा के खिलाफ इसका उपयोग करने पर एक छोटा सा ट्यूटोरियल है। http://www.codeproject.com/Tips/788739/Visualizing-High-Dimensional-Vector-using-T-SNE-wi
http://www.ggobi.org (पर्यटन, समानांतर निर्देशांक, scatterplot मैट्रिक्स) वास्तविक मूल्य चर के लिए इस्तेमाल किया जा सकता पर एक नजर डालें। हाल ही में http://cranvas.org के लिए भी। आर
में टूरर पैकेज मैं उच्च आयामी डेटा को देखने के तरीकों की तलाश में था और यह t-SNE technique पाया गया है जिसका प्रभावी ढंग से उपयोग किया गया है। दूसरों को भी मदद कर सकते हैं।
बहुत स्पैम देख रहे हैं – Cory
क्या है, @Cory ? मुझे यह प्रश्न मिला है जब मैं उच्च आयामी डेटा के अच्छे विज़ुअलाइज़ेशन की खोज करने की कोशिश कर रहा हूं, जिसके साथ मैं काम कर रहा हूं और टी-एसएनई पेज जो मैंने लिंक किया है वह एक अच्छा ओपन-सोर्स सॉफ़्टवेयर है, मैंने सोचा कि दूसरों को एक –
की तलाश में लाभ होगा, पहले पोस्ट, एक लिंक, मैंने पृष्ठ पर देखा और यह क्रेडिटबल देखा, लेकिन मुझे एक ही बिल्ड अप के साथ अनगिनत स्पैम पोस्ट दिखाई दे रही हैं। मेरे हिस्से पर भ्रम के लिए खेद है, क्या आप कृपया अपनी पोस्ट संपादित कर सकते हैं ताकि यह मुझे वोट बदलने की अनुमति दे। – Cory
http://hypertools.readthedocs.io/en/latest/ का उपयोग करने का प्रयास करें।
हाइपरटूल पाइथन में उच्च-आयामी डेटा को विज़ुअलाइज़ करने और छेड़छाड़ करने के लिए एक लाइब्रेरी है।
- 1. क्या LINQ प्रश्नों को देखने के लिए कोई तरीका है?
- 2. रेल - सभी क्षेत्रों को देखने के लिए आसान तरीका
- 3. बहु-आयामी एनएसएमयूटेबलएरेज़ को स्टोर और पुनर्प्राप्त करने का सबसे अच्छा तरीका क्या है?
- 4. क्या कोई उच्च स्तर है, सामान्य लिस्प के लिए जीयूआई पुस्तकालय स्थापित करने में आसान है?
- 5. रूबी में बहु-आयामी सरणी को डुप्लिकेट करने का कोई आसान तरीका है?
- 6. एक-आयामी टकराव का पता लगाने के लिए सबसे अच्छा तरीका क्या है?
- 7. क्या जावास्क्रिप्ट लुकअप टेबल बनाने का कोई आसान तरीका है?
- 8. क्या WPF रूटेड घटनाओं को देखने का कोई तरीका है?
- 9. क्या ओपनिड को लागू करने का कोई आसान तरीका है?
- 10. वेब अनुप्रयोग में पदानुक्रमित डेटा देखने के लिए सुरुचिपूर्ण तरीका
- 11. कुछ डेटटाइम सरणी में कोई मिलान होने पर यह देखने का सबसे आसान तरीका क्या है?
- 12. 4-आयामी ऐरे को देखने के लिए किन विधियों का उपयोग किया जाता है?
- 13. सी ++ कक्षाओं के स्वचालित पंपलिंग - क्या कोई आसान तरीका है?
- 14. क्या कोई भी एक अच्छा और आसान जेसीआर यूआई प्रबंधन उपकरण जानता है?
- 15. क्या यह बताने का कोई आसान तरीका है कि कक्षा/संरचना के पास कोई डेटा सदस्य नहीं है?
- 16. एक्सएमएल से उच्च गुणवत्ता वाली पीडीएफ बनाने के लिए सबसे अच्छा तरीका क्या है?
- 17. प्रोग्रामेटिक रूप से देखने के लिए सबसे अच्छा तरीका
- 18. phpinfo - इसे देखने का एक आसान तरीका है?
- 19. क्या पाइथन कंसोल के भीतर से मॉड्यूल के स्रोत को देखने का कोई तरीका है?
- 20. क्या MySQL डेटा को शीर्षक केस में परिवर्तित करने का कोई आसान तरीका है?
- 21. PHP: सरणी के अंतिम आइटम को प्राप्त करने का सबसे तेज़ और आसान तरीका क्या है?
- 22. क्या एचटीएमएल पेज के टेक्स्ट तत्वों को निकालने के लिए आर में कोई आसान तरीका है?
- 23. क्या भविष्य में डेटा पॉइंट्स को निकालने के लिए अजगर में आसान तरीका है?
- 24. क्या Emacs के भीतर से एक प्रस्तुत वेबसाइट देखने के लिए कोई तरीका है?
- 25. क्या एक grails वेबफ्लो देखने के लिए कोई उपकरण है?
- 26. क्या ActiveAdmin के साथ संबंधित डेटा बनाने/चुनने का कोई आसान तरीका है?
- 27. पीडीएफ से डेटा निकालने का सबसे आसान तरीका क्या है?
- 28. 2 आयामी डेटा
- 29. क्या कंसोल में आउटपुट देखने के लिए नोहअप को पुनर्स्थापित/पुनर्प्राप्त करने का कोई तरीका है?
- 30. उच्च प्रदर्शन सी ++ बहु आयामी सरणी
मुझे एक उत्तर के बारे में पता नहीं है, लेकिन, मैं आपको बता सकता हूं कि इसे अनुकूलित करना बहुत ही गर्म शोध विषय है। –
मैं एक विज़ुअलाइज़ेशन टूल जैसे टेबलू या स्पॉटफायर का उपयोग करने का सुझाव देता हूं। फिर भी, 21 आयाम बहुत अधिक हैं, इसलिए आपको इसे किसी सार्थक स्तर पर प्राप्त करने के लिए शायद कुछ प्रकार की आयाम कमी तकनीक करने की आवश्यकता होगी http://www.tableausoftware.com/public –