क्या कोई बता सकता है कि R पैकेज में Cover
कॉलम xgb.model.dt.tree
फ़ंक्शन में गणना की जाती है?xgboost कवर की गणना कैसे की जाती है?
प्रलेखन में यह कहता है कि कवर "विभाजन द्वारा प्रभावित अवलोकनों की संख्या को मापने के लिए एक मीट्रिक है"।
जब आप निम्न कार्य चलाते हैं, तो xgboost
इस फ़ंक्शन के लिए प्रलेखन में Cover
पेड़ 0 के नोड 0 के लिए 1628.2500 है।
data(agaricus.train, package='xgboost')
#Both dataset are list with two items, a sparse matrix and labels
#(labels = outcome column which will be learned).
#Each column of the sparse Matrix is a feature in one hot encoding format.
train <- agaricus.train
bst <- xgboost(data = train$data, label = train$label, max.depth = 2,
eta = 1, nthread = 2, nround = 2,objective = "binary:logistic")
#[email protected][[2]] represents the column names of the sparse matrix.
xgb.model.dt.tree([email protected][[2]], model = bst)
ट्रेन डेटासेट में 6513 टिप्पणियों रहे हैं, तो किसी को भी समझा सकता है क्यों पेड़ 0 के नोड 0 के लिए Cover
इस संख्या (1628.25) के एक चौथाई है?
इसके अलावा, Cover
पेड़ 1 के नोड 1 के लिए 788.852 है - इस संख्या की गणना कैसे की जाती है?
किसी भी मदद की बहुत सराहना की जाएगी। धन्यवाद।
शानदार स्पष्टीकरण। धन्यवाद – dataShrimp
इसके अलावा, मुझे नहीं लगता कि आप इस सवाल पर कुछ प्रकाश डाल सकते हैं? http://stackoverflow.com/questions/33654479/how-is-xgboost-quality-calculated – dataShrimp
@dtfoster मैं उस अन्य प्रश्न के साथ खेल रहा हूं - अभी तक इसे क्रैक नहीं किया है ... कुछ मामूली भारोत्तोलन चल रहा है उस हुड के नीचे जिसमें उसकी स्लाइड से कुछ मामूली मतभेद हैं –