मैं एक sklearn.dataset लोड करने की कोशिश कर रहा हूं, और कुंजी के अनुसार कॉलम गायब कर रहा हूं (target_names, target & DESCR)। मैंने अंतिम कॉलम को शामिल करने के लिए विभिन्न विधियों का प्रयास किया है, लेकिन त्रुटियों के साथ।पांडस डेटाफ्रेम में SKLearn कैंसर डेटासेट लोड हो रहा है
import numpy as np
import pandas as pd
from sklearn.datasets import load_breast_cancer
cancer = load_breast_cancer()
print cancer.keys()
कुंजी [ 'target_names', 'डेटा', 'लक्ष्य', 'descr', 'feature_names']
data = pd.DataFrame(cancer.data, columns=[cancer.feature_names])
print data.describe()
कोड के साथ ऊपर
, यह केवल रिटर्न हैं 30 कॉलम, जब मुझे 31 कॉलम चाहिए। पांडस डेटाफ्रेम में साइकेकिट-सीखने वाले डेटासेट को लोड करने का सबसे अच्छा तरीका क्या है।
आप व्याख्या कर सकते हैं क्यों 31 कॉलम होना चाहिए? यदि आप 'cancer.data.shape' का उपयोग करते हैं या [डेटासेट विवरण] की जांच करें (http://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_breast_cancer.html), ऐसा लगता है कि केवल 30 हैं डेटासेट में कॉलम। आप किस कॉलम को याद कर चुके हैं? –
मुझे dataset.keys() से लक्ष्य/target_names कॉलम गुम है, क्योंकि इसे अभी तक डेटा फ्रेम में लोड नहीं किया गया है। – pythonhunter