मैं एआई के लिए नया हूं। मैं एक आवेदन कर रहा हूं जो मशीन सीखने के माध्यम से पाठ वर्गीकरण। एप्लिकेशन को HTML दस्तावेज़ के विभिन्न हिस्सों को वर्गीकृत करने की आवश्यकता है। उदाहरण के लिए, अधिकांश वेबपृष्ठों में हेड, मेनू, साइडबार, पाद लेख, मुख्य सामग्री इत्यादि होती है। मैं HTML दस्तावेज़ के इन हिस्सों को वर्गीकृत करने के लिए टेक्स्ट क्लासिफ़ायर का उपयोग करना चाहता हूं, और पृष्ठ पर विभिन्न प्रकार के फॉर्मों की पहचान करना चाहता हूं।आर्टिफिशियल इंटेलिजेंस, टेक्स्ट क्लासिफायर
- यदि कोई इस विषय पर विस्तृत मार्गदर्शन प्रदान कर सकता है तो यह बहुत उपयोगी होगा।
- इसी तरह के आवेदन के उदाहरण भी बहुत उपयोगी होंगे।
मैं कोड & कार्यान्वयन से संबंधित अधिक तकनीकी सुझावों की तलाश में हूं।
मैं टैग गुण, वर्ग या आईडी
<div class="menu-1">
<div id="entry">
<div id="content">
<div id="footer">
<div id="comment-12">
<div id="comment-title">
पहले आइटम के लिए तरह तरह HTML करने के लिए लेबल असाइन कर सकते हैं:
TrainClassifier (लेबल: "मेनू", मूल्य: "मेनू -1" , विशेषता: "वर्ग", स्थिति-में-स्ट्रिंग: "21%", टैग: "div");
इनपुट:
- "मेनू -1" (विशेषता मान)
- सूची आइटम
- "वर्ग" (विशेषता नाम)
- "21" (टैग स्ट्रिंग में स्थिति)
- "div" (टैग नाम)
आउटपुट
- "मेनू" (लेबल के रूप में वर्गीकृत)
क्या तंत्रिका नेटवर्क पुस्तकालय, ऊपर आदानों ले जा सकते हैं, और उन्हें लेबल के लिए में वर्गीकृत (अर्थात मेन्यू)।
सभी उपयोगकर्ता रीगेक्स, या एक्सपैथ नहीं बना सकते हैं, उन्हें अधिक आसान दृष्टिकोण की आवश्यकता है, इसलिए सॉफ़्टवेयर बुद्धिमान बनाने के लिए यह महत्वपूर्ण है, उपयोगकर्ता वेबब्रोसर नियंत्रण का उपयोग करके HTML दस्तावेज़ के हिस्से को हाइलाइट कर सकते हैं, और ट्रेन को प्रशिक्षित कर सकते हैं सॉफ़्टवेयर जब तक यह स्वयं पर काम नहीं कर सकता है।
लेकिन मुझे पता है कि ऐ का उपयोग कर सॉफ्टवेयर ट्रेन बनाने के लिए नहीं है,
ऐ मैं देख रहा हूँ, है जैसे कि यह विभिन्न आदानों स्वीकार करते हैं, और उस के आधार पर वर्गीकृत करने के लिए सक्षम होना चाहिए, के रूप में मेरे पास है पहले से ही एआई को नया कहा, इसके बारे में ज्यादा नहीं पता।
यह मेरे लिए उपयोगी होगा अगर मुझे पूछे गए प्रश्न का उत्तर मिलता है, जैसे लाइब्रेरी का उपयोग करना चाहिए, और कैसे कार्यान्वित किया जाए, एक्सपैथ या रेगेक्स या अन्य विधियों का सुझाव देने वाले उत्तरों का उत्तर नहीं दिया जाता है, यह अक्सर होता है कि आपको सभी सुझाव मिलते हैं लेकिन आपको जिसकी आवश्यकता है।
मुझे लगता है कि इस वर्गीकरण समस्या में डेटा की इकाई अच्छी तरह परिभाषित नहीं है। आपने कहा कि यह एक एचटीएमएल का हिस्सा है लेकिन आप कैसे तय करेंगे कि HTML में प्रत्येक पाठ किस भाग से संबंधित है? –
मुझे लगता है कि आपको पहले ऐसा करना है। अन्यथा, यहां तक कि एक वर्गीकरण विधि के साथ, आप उन्हें कैसे प्रशिक्षित करेंगे? –
मुझे नहीं मिल रहा है, आप क्या कहने की कोशिश कर रहे हैं, क्या आप विस्तृत कर सकते हैं .... –