मान लीजिए कि मैं संभावना को निर्धारित करना चाहता हूं कि मैं SO पर एक प्रश्न उठाऊंगा, केवल उस पर आधारित है कि टैग मौजूद हैं या अनुपस्थित हैं।क्या कोई पर्यवेक्षित शिक्षण एल्गोरिदम है जो इनपुट के रूप में टैग लेता है, और आउटपुट के रूप में संभावना उत्पन्न करता है?
आइए यह भी कल्पना करें कि मेरे पास पिछले प्रश्नों के बारे में बहुत सारी जानकारी है जो मैंने किया या नहीं किया।
क्या कोई मशीन सीखने वाला एल्गोरिदम है जो इस ऐतिहासिक डेटा को ले सकता है, उस पर ट्रेन कर सकता है, और फिर भविष्य के प्रश्नों के लिए मेरी अपवॉट संभावना की भविष्यवाणी करने में सक्षम हो सकता है? ध्यान दें कि यह संभाव्यता होना चाहिए, न केवल कुछ मनमाना स्कोर।
मान लीजिए कि किसी दिए गए प्रश्न से जुड़े 7 टैग होंगे, इन्हें हजारों के सुपरसैट से खींचा जा रहा है।
मेरी आशा यह है कि यह टैग के बीच काफी परिष्कृत कनेक्शन बनाने में सक्षम है, प्रत्येक टैग की तुलना में केवल "रेखीय" तरीके से अंत परिणाम में योगदान देने के बजाय (जैसे बेयसियन स्पैम फ़िल्टर में शब्द करते हैं)।
तो उदाहरण के लिए, यह हो सकता है कि "जावा" शब्द मेरी अपवोट संभावना को बढ़ाता है, सिवाय इसके कि जब यह "डेटाबेस" के साथ मौजूद होता है, हालांकि "डेटाबेस" "रूबी" के साथ मौजूद होने पर मेरी अपवोट संभावना को बढ़ा सकता है।
ओह, और यह कम्प्यूटेशनल रूप से उचित होना चाहिए (लाखों प्रश्नों पर एक या दो घंटे के भीतर प्रशिक्षण)।
मैं यहां किस दृष्टिकोण का शोध करूँ?
बैकप्रॉप आउटपुट के रूप में संभावनाएं उत्पन्न नहीं करता है, है ना? नोड के सक्रियण कार्यों अक्सर सिग्मोइड वक्र होते हैं, जो संभावनाओं के साथ बहुत कम है। – sanity