छोड़ दिया गया है, मैं आयामों के एक मैट्रिक्स पर एक पीसीए चलाने की कोशिश कर रहा हूं एम एक्स एन जहां एम सुविधाओं की संख्या है और एन नमूने की संख्या है।सुविधाओं में कमी के लिए विज्ञान-सीखने पीसीए का उपयोग कैसे करें और जानें कि कौन सी विशेषताओं को
मान लीजिए कि मैं अधिकतम भिन्नता वाले nf
सुविधाओं को संरक्षित करना चाहता हूं। scikit-learn
के साथ मैं इस तरह से यह करने के लिए कर रहा हूँ:
from sklearn.decomposition import PCA
nf = 100
pca = PCA(n_components=nf)
# X is the matrix transposed (n samples on the rows, m features on the columns)
pca.fit(X)
X_new = pca.transform(X)
अब, मैं एक नया मैट्रिक्स X_new
एन एक्स एनएफ का एक आकार है कि मिलता है। क्या यह जानना संभव है कि कौन सी विशेषताओं को त्याग दिया गया है या बनाए रखा गया है?
धन्यवाद
फ़ीचर खारिज नहीं कर रहे हैं वे छोटे आयाम का अनुमान और विभिन्न सुविधाओं के बीच दिलचस्प कनेक्शन प्रकट करने के लिए लगता है कि कर रहे हैं। –
धन्यवाद टॉम, मैं सोच रहा था कि पीसीए का उपयोग फीचर चयन के लिए किया जा सकता है, लेकिन (अगर मैं गलत हूं तो सही) इसका उपयोग केवल मुख्य घटकों पर डेटा को पुन: सहेजने के लिए किया जाता है। जैसा कि आप इसे पढ़ते हैं, मुझे लगता है कि मैं सवाल बंद कर दूंगा। – gc5
आपका आउटपुट मैट्रिक्स आकार '(एन, एनएफ) 'होना चाहिए, न कि' (एनएफ, एन) '। – eickenberg