मैंने देखा कि scikit-learn clf.tree_.feature कभी-कभी ऋणात्मक मूल्यों को वापस लाता है। उदाहरण के लिए -2। जहां तक मैं समझता हूं कि clf.tree_.feature को सुविधाओं के अनुक्रमिक क्रम को वापस करना है। यदि हमारे पास फीचर नाम ['feature_one', 'feature_two', 'feature_three']
की सरणी है, तो -2 feature_two
देखेंगे। मैं नकारात्मक सूचकांक के उपयोग से हैरान हूं। इंडेक्स 1 द्वारा feature_two
को संदर्भित करने के लिए और अधिक समझदारी होगी (-2 मानव पाचन के लिए सुविधाजनक संदर्भ है, मशीन प्रसंस्करण के लिए नहीं)। क्या मैं इसे सही ढंग से पढ़ रहा हूं?clf.tree_.feature - आउटपुट क्या है? (scikit-learn)
अद्यतन: यहाँ एक उदाहरण है:
def leaf_ordering():
X = np.genfromtxt('X.csv', delimiter=',')
Y = np.genfromtxt('Y.csv',delimiter=',')
dt = DecisionTreeClassifier(min_samples_leaf=10, random_state=99)
dt.fit(X, Y)
print(dt.tree_.feature)
यहाँ आउटपुट है:
[ 8 9 -2 -2 9 4 -2 9 8 -2 -2 0 0 9 9 8 -2 -2 9 -2 -2 6 -2 -2 -2
2 -2 9 8 6 9 -2 -2 -2 8 9 -2 9 6 -2 -2 -2 6 -2 -2 9 -2 6 -2 -2
2 -2 -2]
क्या आप एक उदाहरण दे सकते हैं? – tfv
@tfv, मैंने अभी एक उदाहरण पोस्ट किया है। – user1700890