मैं मूल्य 1C5.0 निर्णय वृक्ष - मूल्य के साथ C50 कोड कहा जाता है बाहर निकलने के 1
मैं उपलब्ध टाइटैनिक डेटा पर यह कर रहा हूं साथ निम्न त्रुटि
C50 कोड कहा जाता है से बाहर निकलें हो रही है Kaggle
से# Importing datasets
train <- read.csv("train.csv", sep=",")
# this is the structure
str(train)
आउटपुट: -
'data.frame': 891 obs. of 12 variables:
$ PassengerId: int 1 2 3 4 5 6 7 8 9 10 ...
$ Survived : int 0 1 1 1 0 0 0 0 1 1 ...
$ Pclass : int 3 1 3 1 3 3 1 3 3 2 ...
$ Name : Factor w/ 891 levels "Abbing, Mr. Anthony",..: 109 191 358 277 16 559 520 629 417 581 ...
$ Sex : Factor w/ 2 levels "female","male": 2 1 1 1 2 2 2 2 1 1 ...
$ Age : num 22 38 26 35 35 NA 54 2 27 14 ...
$ SibSp : int 1 1 0 1 0 0 0 3 0 1 ...
$ Parch : int 0 0 0 0 0 0 0 1 2 0 ...
$ Ticket : Factor w/ 681 levels "110152","110413",..: 524 597 670 50 473 276 86 396 345 133 ...
$ Fare : num 7.25 71.28 7.92 53.1 8.05 ...
$ Cabin : Factor w/ 148 levels "","A10","A14",..: 1 83 1 57 1 1 131 1 1 1 ...
$ Embarked : Factor w/ 4 levels "","C","Q","S": 4 2 4 4 4 3 4 4 4 2 ...
तब मैं C5.0 dtree
# Trying with C5.0 decision tree
library(C50)
#C5.0 models require a factor outcome otherwise error
train$Survived <- factor(train$Survived)
new_model <- C5.0(train[-2],train$Survived)
तो ऊपर लाइनों चल मुझे इस त्रुटि देता है
c50 code called exit with value 1
मैं यह पता लगाने में सक्षम नहीं कर रहा हूँ क्या गलत हो रहा उपयोग करने की कोशिश? मैं अलग-अलग डेटासेट पर समान कोड का उपयोग कर रहा था और यह ठीक काम कर रहा था। मैं अपने कोड को डीबग कैसे कर सकता हूं इसके बारे में कोई विचार?
शुक्रिया
धन्यवाद मार्को। इसने काम कर दिया!! केबिन और लापता कॉलम में गुम मूल्य इस मुद्दे का कारण बन रहे थे। मैंने देखा कि दूसरी बात यह है कि ट्रेन [-2] और ट्रेन [, - 2] एक ही आउटपुट है ... क्या दोनों के बीच कोई और अंतर है ?? – zephyr
आप सही हैं, ऐसा लगता है कि यह डेटा.फ्रेम के लिए काम करता है। मैं हमेशा ट्रेन [, - 2] का उपयोग करता हूं, क्योंकि मैट्रिस ट्रेन के लिए [-2] परिणाम को वेक्टर में बदल देगा और केवल एक तत्व को हटा देगा। ऐसा इसलिए है क्योंकि अवधारणात्मक matrices वैक्टर की तरह हैं और आप पंक्ति/कॉलम – Marco
ओह निर्दिष्ट किए बिना उनमें से प्रत्येक तत्व का उपयोग कर सकते हैं। अब अगला चरण समान कोड निकास त्रुटि दे रहा है। मैंने टेस्ट डेटा फ्रेम में test.csv पढ़ा। फिर: - new_model_predict <- परीक्षण डेटा पर पूर्वानुमान (new_model, परीक्षण)। इसके अलावा मैंने केबिन में लापता लेबल और टेस्ट डेटा के एम्बर्क किए गए कॉलम भी सौंपा। – zephyr