आपकी समस्या regression (link) की श्रेणी में आती है। मशीन लर्निंग शब्दों में, आपके पास features (link) (जिसे आप अपने प्रश्न में सूचीबद्ध करते हैं) का संग्रह है और आपके पास स्कोर वह मान है जिसे आप भविष्यवाणी करना चाहते हैं।
क्या टेड होप ने सुझाव दिया है मूल रूप से linear predictor function (link) है। यह आपके परिदृश्य के लिए एक मॉडल बहुत आसान हो सकता है।
अपनी समस्या के लिए logistic regression (link) का उपयोग करने पर विचार करें। यहां बताया गया है कि आप इसका उपयोग कैसे करेंगे।
1. बनाने के अपने मॉडल-लर्निंग डाटासेट
बेतरतीब ढंग से कुछ m
ब्लॉग पोस्ट 4000 के सेट से यह एक छोटा सा पर्याप्त सेट है कि आप आराम से अपनी ओर से इन m
ब्लॉग पोस्ट के माध्यम से देख सकते हैं होना चाहिए का चयन करें।
m
ब्लॉग पोस्टों में से प्रत्येक के लिए, 0
से 1
पर एक संख्या के साथ "अच्छा" कैसे स्कोर करें। यदि यह मदद करता है, तो आप 0, 0.25, 0.5, 0.75, 1
मानों के लिए 0, 1, 2, 3, 4
"सितारों" का उपयोग करने के बारे में सोच सकते हैं।
अब आपके पास m
ब्लॉग पोस्ट हैं जिनमें प्रत्येक के पास विशेषताओं और स्कोर का एक सेट है।
आप वैकल्पिक रूप से व्युत्पन्न सुविधाओं को शामिल करने के लिए अपने फीचर सेट का विस्तार कर सकते हैं - उदाहरण के लिए, आप "उपरोक्त गणना", "टिप्पणियां प्राप्त", "शेयर गणना" और "अनुयायी गणना" के लॉगरिदम को शामिल कर सकते हैं। और आप "अब" और "निर्मित समय" के बीच घंटों की संख्या के लॉगरिदम को शामिल कर सकते हैं।
2. अपने मॉडल
उपयोग ढाल वंश एक रसद प्रतिगमन मॉडल है कि अपने मॉडल-लर्निंग डाटासेट फिट बैठता है खोजने के लिए सीख सकते हैं। आपको अपने डेटासेट को प्रशिक्षण, सत्यापन, और परीक्षण सेट सेट करना चाहिए ताकि आप मॉडल-सीखने की प्रक्रिया में उन संबंधित चरणों को पूरा कर सकें।
मैं इस खंड पर और विस्तार नहीं करूंगा क्योंकि इंटरनेट विवरण से भरा है और यह एक डिब्बाबंद प्रक्रिया है।
विकिपीडिया लिंक:
3. लागू अपने मॉडल
अपने रसद प्रतिगमन मॉडल सीखा करने के बाद, अब आप के लिए स्कोर भविष्यवाणी करने के लिए लागू कर सकते हैं एक नया ब्लॉग पोस्ट कितना "अच्छा" है! बस सुविधाओं (और व्युत्पन्न सुविधाओं) के सेट की गणना करें, फिर स्कोर के लिए उन सुविधाओं को मैप करने के लिए अपने मॉडल का उपयोग करें।
फिर से, इंटरनेट इस खंड के विवरण से भरा है, जो एक डिब्बाबंद प्रक्रिया है।
यदि आपके कोई प्रश्न हैं, तो पूछना सुनिश्चित करें!
यदि आप मशीन सीखने के बारे में अधिक जानने में रुचि रखते हैं, तो आपको the free online Stanford Machine Learning course on Coursera.org लेने पर विचार करना चाहिए। (मैं स्टैनफोर्ड या Coursera से संबद्ध नहीं हूँ।)
बहुत व्यापक रूप से बंद करने के लिए वोटिंग। –