का उपयोग करके उच्चतम भिन्नता वाले आयाम को ढूंढना मुझे डेटा के एक निश्चित सेट के उच्चतम भिन्नता वाले आयामों की पहचान करने के लिए पीसीए का उपयोग करने की आवश्यकता है। मैं इसे करने के लिए scikit-learn's pca का उपयोग कर रहा हूं, लेकिन मैं पीसीए विधि के आउटपुट से पहचान नहीं पा रहा हूं, उच्चतम भिन्नता वाले मेरे डेटा के घटक क्या हैं। ध्यान रखें कि मैं उन आयामों को खत्म नहीं करना चाहता हूं, केवल उन्हें पहचानें।विज्ञान-सीखने पीसीए
मेरा डेटा डेटा के 150 पंक्तियों के साथ एक मैट्रिक्स के रूप में व्यवस्थित किया गया है, प्रत्येक में 4 आयाम हैं। मैं इस प्रकार कर रहा हूँ:
pca = sklearn.decomposition.PCA()
pca.fit(data_matrix)
जब मैं प्रिंट pca.explained_variance_ratio_, यह विचरण अनुपात उच्चतम से न्यूनतम करने का आदेश दिया की एक सरणी आउटपुट, लेकिन यह मुझे नहीं बताता है डेटा से जो आयाम वे अनुरूप करने के लिए (मैंने अपने मैट्रिक्स पर कॉलम के क्रम को बदलने की कोशिश की है, और परिणामी भिन्नता अनुपात सरणी समान थी)।
मुद्रण pca.components_ मुझे एक 4x4 मैट्रिक्स (मैं पीसीए के लिए तर्क के रूप में घटकों के मूल संख्या छोड़ दिया) कुछ मूल्यों के साथ मैं की ... scikit के दस्तावेज़ के अनुसार अर्थ समझ में नहीं कर सकते हैं देता है, उन्हें होना चाहिए अधिकतम भिन्नता वाले घटक (eigenvectors शायद?), लेकिन उन मानों का आयाम का कोई संकेत नहीं है।
डेटा को ट्रांसफॉर्म करने से कोई मदद नहीं मिलती है, क्योंकि आयाम एक तरह से बदल जाते हैं, मैं वास्तव में नहीं जानता कि वे मूल रूप से कौन से थे।
क्या कोई तरीका है कि मैं इस जानकारी को विज्ञान के पीसीए के साथ प्राप्त कर सकता हूं? धन्यवाद
components_'' '' की पहली पंक्ति में अधिकतम अंतर की दिशा है, प्रलेखन राज्यों के रूप में। मुझे पूरी तरह से यकीन नहीं है कि इसके बारे में अस्पष्ट क्या है। '' Index_'arianio_ratio_'' में प्रविष्टियां 'घटकों_'' की पंक्तियों से मेल खाती हैं। आपका मतलब क्या है" उन मानों का कोई संकेत नहीं है कि वे मान हैं "? –
खैर, मेरी समस्या यह है कि मेरे डेटा में 4 आयाम हैं और मैं उच्च आयाम वाले 2 आयामों के साथ केवल आयाम रखना चाहता हूं, मुझे कैसे पता चलेगा कि मेरे डेटा के कौन से आयाम रखे गए होंगे यदि मैं पीसीए को लागू करता हूं n_components = 2। उदाहरण के लिए, मान लें कि मेरे डेटा के दूसरे आयाम और चौथे आयाम में उच्चतम भिन्नता है, लेकिन मुझे यह नहीं पता है। मैं पीसीए को लागू करना चाहता हूं और परिणामों से इस जानकारी को प्राप्त करने का कोई तरीका है। फिर, मुझे डेटा बदलने की जरूरत नहीं है! –