2015-11-13 8 views
5

मैं XGBoost के पायथन कार्यान्वयन का उपयोग करता हूं। उद्देश्यों में से एक rank:pairwise है और यह जोड़ी के नुकसान को कम करता है (Documentation)। हालांकि, यह आउटपुट के दायरे के बारे में कुछ भी नहीं कहता है। मैं -10 और 10 के बीच की संख्या देखता हूं, लेकिन क्या यह सिद्धांत रूप में हो सकता है-inff के लिए?'रैंक: pairwise' का उपयोग कर XGboost का आउटपुट क्या है?

+0

था यू पाया उत्पादन क्या है का उल्लेख? –

+0

नहीं। मुझे अभी तक जवाब नहीं मिला। –

उत्तर

1

अच्छा सवाल। आप kaggle competition:

असल में, रैंक फ़ील्ड सीखने में, हम प्रत्येक दस्तावेज़ के लिए एक विशिष्ट क्वेरी के सापेक्ष स्कोर की भविष्यवाणी करने की कोशिश कर रहे हैं। यही है, यह एक प्रतिगमन समस्या या वर्गीकरण समस्या नहीं है। इसलिए, यदि किसी दस्तावेज़ से जुड़ा कोई दस्तावेज़ नकारात्मक पूर्वानुमान स्कोर प्राप्त करता है, तो इसका मतलब है और इसका मतलब यह है कि यह सकारात्मक स्कोर के साथ अन्य दस्तावेज़ों की तुलना करते समय क्वेरी के अपेक्षाकृत कम अपेक्षाकृत कम है।

+0

आशा है कि यह ठीक है –

0

यदि मैं आपके क्यूएनएस को सही ढंग से समझता हूं, तो आप रैंक का उपयोग करके फिट किए गए मॉडल पर अनुमानित फ़ंक्शन का आउटपुट: pairwise।

पूर्वानुमान भविष्यवाणी चर (याट) देता है।

यह reg लिए एक ही है: रैखिक/बाइनरी: आदि फर्क सिर्फ इतना है कि रसद reg है: रैखिक बनाता पेड़ गया मिनट (RMSE (y, yhat)) है, जबकि रैंक: जोड़ो में निर्माण पेड़ अधिकतम करने के लिए (मानचित्र (रैंक (y), रैंक (yhat)))। हालांकि, उत्पादन हमेशा yhat है।

आपके आश्रित चर के मूल्यों के आधार पर, आउटपुट कुछ भी हो सकता है। लेकिन मैं आम तौर पर आउटपुट वैरिएबल बनाम भिन्नता में आउटपुट की अपेक्षा करता हूं। आमतौर पर यह मामला है क्योंकि चरम डेटा मूल्यों को फिट करने के लिए जरूरी नहीं है, पेड़ को केवल भविष्यवाणियों का उत्पादन करने की आवश्यकता है जो समूह

0

में रैंकिंग के लिए पर्याप्त/छोटे स्थान पर हैं। यह रैंकिंग के लिए अनुमानित स्कोर देता है। हालांकि, स्कोर केवल अपने स्वयं के समूहों में रैंकिंग के लिए मान्य हैं। इसलिए हमें इनपुट डेटा के लिए समूह सेट करना होगा।

esay रैंकिंग के लिए, अपने प्रोजेक्ट xgboostExtension

संबंधित मुद्दे