हमारे पास वेब पृष्ठों के लिए वर्गीकरण है। क्लासिफायर मॉडल कुछ 2 साल पहले ट्रेन डेटा के साथ बनाया गया था। हमने देखा है कि मॉडल का प्रदर्शन बिगड़ता रहता है, और हम समय के साथ बदल रहे वेब पेजों के गुणों के कारण मानते हैं (मुख्य रूप से इस्तेमाल किए गए शब्द और शब्दावली, लेकिन टोपोलॉजी, एचटीएमएल टैग इत्यादि)।पर्यवेक्षित शिक्षा के लिए ताज़ा प्रशिक्षण डेटा - कैसे करें?
आप इस समस्या से कैसे संपर्क करेंगे? क्या हम बस पूरे ट्रेन डेटा को फिर से बनाते हैं और एक नया मॉडल फिर से सीखते हैं? क्या कोई शॉर्टकट है? क्या कुछ सामान्य प्रथाएं या कागजात इसे कैसे करें? ध्यान दें कि हम पर्यवेक्षित शिक्षण दृष्टिकोण पर बहुत आकर्षित हैं जहां सिस्टम प्रशासक एक वर्गीकृत को प्रशिक्षित करता है, परीक्षण सेट पर अपने प्रदर्शन का मूल्यांकन करता है और फिर "उत्पादन" प्रणाली में वर्गीकरण स्थापित करता है।
आशा इस बहुत ही अस्पष्ट नहीं है ...
यदि आप मॉडल अब अच्छा नहीं है तो मैं एक नया निर्माण करने का सुझाव दूंगा। मॉडल बनाने के लिए इस्तेमाल किया गया एल्गोरिदम क्या था? – AdrienNK
hi @ihadanny, क्या आपने अपना मुद्दा हल किया है? – tktktk0711