टीओएमडीएलटी का समाधान विज्ञान-सीखने के सभी डेटासेट के लिए सामान्य नहीं है। उदाहरण के लिए यह बोस्टन हाउसिंग डेटासेट के लिए काम नहीं करता है। मैं एक अलग समाधान का प्रस्ताव करता हूं जो अधिक सार्वभौमिक है। Numpy का उपयोग करने की कोई ज़रूरत नहीं है।
data = load_iris()
df = pd.DataFrame(data['data'], columns=data['feature_names'])
df['target'] = data['target']
df.head()
बजाय से जाना जाए, ठीक सुविधाओं के मैट्रिक्स के साथ एक डेटा फ्रेम सिर्फ और फिर श्रृंखलाबद्ध की असल:
from sklearn import datasets
import pandas as pd
boston_data = datasets.load_boston()
df_boston = pd.DataFrame(boston_data.data,columns=boston_data.feature_names)
df_boston['target'] = pd.Series(boston_data.target)
df_boston.head()
स्रोत
2017-09-23 13:03:46
क्या आप इस कोड को समझाने के लिए थोड़ा टेक्स्ट जोड़ सकते हैं? यह हमारे मानकों से कुछ हद तक संक्षिप्त है। – gung
कुछ बंच में सुविधा_नाम एक एनड्रे के रूप में होते हैं जो कॉलम पैरामीटर को तोड़ देगा। –
डेटाफ्रेम के लिए "प्रजातियां" कुंजी और मान गुम है। – mastash3ff