2013-03-05 3 views
6

मैं अपने आप पर स्केलर लाइब्रेरी सीख रहा हूं और अभ्यास कर रहा हूं। जब मैंने कगले प्रतियोगिताओं में भाग लिया, तो मैंने देखा कि प्रदत्त नमूना कोड BaseEstimatorsklearn.base से प्रयुक्त नमूना कोड था। मुझे समझ में नहीं आता कि कैसे/क्यों BaseEstimator उपयोग किया जाता है।sklearn.base (पायथन) में बेसइस्टिमेटर

from sklearn import SomeClassifier 
X = [[0, 0], [1, 1],[2, 2],[3, 3]] 
Y = [0, 1, 2, 3] 
clf = SomeClassifier() 
clf = clf.fit(X, Y) 

मैं एक अच्छा उदाहरण या sklearn की आधिकारिक पृष्ठ पर किसी भी दस्तावेजों नहीं पा सके:

from sklearn.base import BaseEstimator 
class FeatureMapper: 
    def __init__(self, features): 
     self.features = features  #features contains feature_name, column_name, and extractor(which is CountVectorizer) 

    def fit(self, X, y=None): 
     for feature_name, column_name, extractor in self.features: 
      extractor.fit(X[column_name], y) #my question is: is X features? if yes, where is it assigned? or else how can X call column_name by X[column_name]. 

... 

यह वही है मैं आमतौर पर sklearn के ट्यूटोरियल पृष्ठ पर देख रहा है। हालांकि मुझे जिथब पर sklearn.base कोड मिला, लेकिन मुझे कुछ उदाहरण और स्पष्टीकरण चाहिए कि इसका उपयोग कैसे किया जाता है। https://github.com/benhamner/JobSalaryPrediction/blob/master/features.py सुधार::

अद्यतन

यहाँ नमूना कोड के लिए कड़ी है मैं सिर्फ महसूस किया BaseEstimator वर्ग SimpleTransform के लिए प्रयोग किया जाता है। मुझे लगता है कि मेरा पहला सवाल यह है कि इसकी आवश्यकता क्यों है? (क्योंकि यह गणना में कहीं भी उपयोग नहीं किया जाता है), दूसरा सवाल यह है कि फिट को परिभाषित करते समय, एक्स क्या है, और कैसे असाइन किया जाता है? क्योंकि आम तौर पर मैं देख रहा हूँ:

def mymethod(self, X, y=None): 
    X=self.features 
    # then do something to X[Column_name] 
+0

क्या आप उस नमूना कोड से लिंक कर सकते हैं? आपके द्वारा पोस्ट किए गए स्निपेट में 'बेसस्टीमीटर' आयात किया जाता है, लेकिन वास्तव में इसका उपयोग नहीं किया जाता है। –

उत्तर

8

BaseEstimator अन्य बातों के अलावा get_params और set_params तरीकों के लिए एक डिफ़ॉल्ट कार्यान्वयन प्रदान करता है, the source code देखते हैं। यह में संयुक्त होने पर स्वचालित पैरामीटर ट्यूनिंग और दूसरों के साथ अच्छा व्यवहार करने के लिए GridSearchCV के साथ मॉडल ग्रिड खोज-सक्षम बनाने के लिए उपयोगी है।

+0

मुझे लगता है कि उस लिंक में लाइन नंबर बह गया है ... –

संबंधित मुद्दे