5

मेरे पास वाक्यों के दो वर्ग हैं। प्रत्येक में उचित रूप से अलग पॉज़-टैग अनुक्रम होता है। मैं एक फीचर के रूप में पीओएस-टैग अनुक्रम के साथ एक बेवकूफ बेयस वर्गीकरण कैसे प्रशिक्षित कर सकता हूं? क्या स्टैनफोर्ड कोरएनएलपी/एनएलटीके (जावा या पायथन) एक फीचर के रूप में पॉज़-टैग के साथ क्लासिफायरफायर बनाने के लिए कोई तरीका प्रदान करता है? मुझे पता है कि पायथन NaiveBayesClassifier एनबी क्लासिफायरफायर बनाने की अनुमति देता है लेकिन यह फीचर के रूप में contains-a-word का उपयोग करता है लेकिन इसे फीचर के रूप में पॉज़-टैग-अनुक्रम का उपयोग करने के लिए बढ़ाया जा सकता है?एक फीचर के रूप में पॉज़-टैग अनुक्रम के साथ एक बेवकूफ बेयस क्लासिफायर को कैसे प्रशिक्षित करें?

+0

क्या आपको वास्तव में NaiveBayesClassifier का उपयोग करने की आवश्यकता है? क्या आपने सीआरएफ देखा है? वैसे, क्या आपने इस अध्याय को पढ़ा है: http://www.nltk.org/book/ch06.html? – 404pio

+0

लिंक के लिए धन्यवाद। मैं एक फीचर के रूप में concatenated pos-tag-sequence और 'includePosSequence' का उपयोग करके समाप्त हुआ ... – kundan

उत्तर

4

यदि आप जानते हैं कि एनएलटीके के बेवकूफ बेयस क्लासिफायरफायर और सुविधाओं के रूप में ग्रंथों (या आपके मामले में वाक्यों) का उपयोग करके ट्रेनों को वर्गीकृत करने के लिए आप इस दृष्टिकोण को आसानी से बढ़ा सकते हैं, तो आप आसानी से इस टैग को पॉज़-टैग द्वारा वर्गीकृत करने के लिए बढ़ा सकते हैं। ऐसा इसलिए है क्योंकि क्लासिफायर इस पर परवाह नहीं करता है कि आपकी फीचर-स्ट्रिंग शब्द या टैग हैं या नहीं। तो आप बस उदाहरण nltk के मानक स्थिति टैगर के लिए उपयोग कर अपने वाक्य के शब्दों स्थिति टैग द्वारा जगह ले सकता है:

sent = ['So', 'they', 'have', 'internet', 'on', 'computers' , 'now'] 
tags = [t for w, t in nltk.pos_tag(sent)] 
print tags 

[ 'में', 'पीआरपी', 'VBP', 'जे जे', 'में, 'एनएनएस', 'आरबी']

अब से आप "इसमें एक शब्द" दृष्टिकोण के साथ आगे बढ़ सकते हैं।

+0

प्रश्न" अनुक्रम "कहता है, हम वाक्य के पॉज़ टैग को '[IN] [PRP' ] [वीबीपी] [जेजे] [आईएन] [एनएनएस] [आरएस] 'और' conatinsPrpVbpSequence' जैसी सुविधा को परिभाषित करें और '[पीआरपी] [वीबीपी] 'के अवसर के लिए इसे' ट्रू 'पर सेट करें .... – kundan

संबंधित मुद्दे