मैं CRFSuite उपयोग करने के लिए कोशिश कर रहा हूँ, लेकिन मैं कैसे उदाहरण/ner.py उपयोग करने के लिए को समझ नहीं सकता औररनिंग CRFSuite उदाहरण
को सटीकता से pos.py, मैं कैसे फार्म की एक इनपुट कर सकता हूँ:
# Ner.py
fields = 'y w pos chk'
या
# Pos.py
fields = 'w num cap sym p1 p2 p3 p4 s1 s2 s3 s4 y'
"YW स्थिति" मैं उदाहरण के लिए, एक CoNNL मॉडल से प्राप्त कर सकते हैं, लेकिन pos.py में "जच" भाग और उन सभी क्षेत्रों मैं सच में नहीं मिलता है ।
इसके अलावा, क्या सीआरएफएसयूइट के साथ कच्चे पाठ (उन सभी टैग के बिना) को संसाधित करने का कोई तरीका है, क्योंकि मेरे पास एक प्रशिक्षित मॉडल है?
मैं भी, इस मुद्दे को हल करने में दिलचस्पी है; विशेष रूप से, उद्धृत कोएनएलएल डेटा (2000 के लिए एनएनई के लिए 2003, लेकिन पीओएस के लिए क्या उपयोग करना है) से शुरू करना, मैं पीओएस डेटा कैसे उत्पन्न करूं? उद्धृत के रूप में, इनपुट को 'डब्ल्यू नंब कैप सीएम पी 1 पी 2 पी 3 पी 4 एस 1 एस 2 एस 3 एस 4 वाई' होना चाहिए, जिसका अर्थ है कि शब्द स्वयं पहले और पीओएस टैग आखिरी है। लेकिन बीच में सभी चीजें क्या हैं और इसे कैसे प्राप्त करें और कैसे उत्पन्न करें? – fnl
शायद पीओएस भाग के बारे में सवाल अधिक सटीक होना चाहिए: इन स्क्रिप्ट का उपयोग करते हुए नियमित, पीओएस टैग की गई ओडब्लूपीएल फ़ाइल ('" शब्द टैग \ n "... ') से पीओएस टैगिंग इनपुट प्रारूप कैसे उत्पन्न होता है? – fnl