2011-03-12 15 views
7

कोई कोरियाई, इंडोनेशियाई, थाई और वियतनामी के लिए ओपन सोर्स पीओएस टैगर की सिफारिश कर सकता है?कोरियाई, थाई और इंडोनेशियाई पीओएस टैगर

कि मैं वर्तमान में मौजूद कॉर्पस डेटा को टैग करने के लिए उपयोग कर सकता हूं। (उदाहरण के लिए the stanford-postagger)

यदि आप एक देव हैं और साझा करने की देखभाल करते हैं और मुझे पीओएस टैगर का परीक्षण करने देते हैं, तो मुझे कोई फर्क नहीं पड़ता।

उत्पादन का कुछ संशोधनों के साथ, मैं स्थिति jvntextpro

साथ टैग किया है वियतनामी डेटा लेकिन मैं था अभी भी कोरियाई के बारे में अधिक इनपुट की तरह, इंडोनेशियाई और थाई पीओएस टैगिंग।

उत्तर

5

एसीएल विकि के बाद: Korean morphological analyzer and part-of-speech tagger

मैं कोरिया, थाईलैंड और कोरियाई भाषा में NLP अनुसंधान विभाग की वेबसाइट पर देखने के लिए शुरू होगा। On this page, आपको शोध विभागों के लिंक मिलेंगे।

शुभकामनाएं!

अद्यतन: OpenNLP थाई पीओएस है। यहां मॉडल हैं: PoS opennlp टैगर के लिए http://opennlp.sourceforge.net/models/thai/

+0

http://isoft.postech.ac.kr/Course/CS730b/2005/index.html मुझे इस पृष्ठ पर कोरियाई टैगर मिला है। अब थाई टैगर गुम है। हाहा .. पृष्ठ के लिए धन्यवाद, लेकिन हमें एनएलपी संसाधनों के बेहतर संयोजन की आवश्यकता है। – alvas

0

आप RDRPOSTagger को आजमा सकते हैं: पीओएस और मॉर्फोलॉजिकल टैगिंग के लिए एक मजबूत, उपयोग में आसान और भाषा-स्वतंत्र टूलकिट।

(प्रोग्रामिंग भाषा: अजगर & जावा)

RDRPOSTagger दोनों सीखने और टैगिंग प्रक्रिया में तेजी से प्रदर्शन प्राप्त करता है। इसके अलावा, आरडीआरपीओस्टागर अत्याधुनिक परिणामों की तुलना में एक बहुत प्रतिस्पर्धी सटीकता प्राप्त करता है। this paper में प्रदर्शन गति और टैगिंग सटीकता सहित प्रयोगात्मक परिणाम देखें।

RDRPOSTagger अब थाई और वियतनामी सहित 13 भाषाओं के लिए पूर्व-प्रशिक्षित पीओएस और मॉर्फोलॉजिकल टैगिंग मॉडल का समर्थन करता है।

संबंधित मुद्दे