2011-11-20 12 views
6

एनएलटीके के चंक पार्सर के नियमित अभिव्यक्तियां पीओएस टैग से मेल खा सकती हैं, लेकिन क्या वे विशिष्ट शब्दों से मेल खा सकते हैं?
तो, मान लीजिए कि मैं किसी भी संरचना के साथ किसी भी संरचना को "बाएं" क्रिया के बाद खंडित करना चाहता हूं (इस पैटर्न को कॉल करें)। उदाहरण के लिए, वाक्य "द डीटी कुत्ते \ NN बाएं \ VB" को
(एस (डीटी द) (एल (एनएन कुत्ता) (वीबी बाएं) के रूप में खंडित किया जाना चाहिए), लेकिन वाक्य "\ DT कुत्ता \ एनएन सोया \ VB "बिल्कुल नहीं किया जाएगा।एनएलटीके के खंड पर्सर के साथ मिलान करने वाले शब्द

मैं chunking regex वाक्यविन्यास पर कोई दस्तावेज नहीं ढूंढ पाया है, और मैंने देखा है कि सभी उदाहरण केवल पीओएस टैग से मेल खाते हैं।

उत्तर

1

मैं एक ऐसी ही समस्या थी और एहसास है कि regex पैटर्न केवल टैग की जांच करेंगे के बाद, मैं टुकड़ा मैं में दिलचस्पी थी पर टैग बदल दिया है।

उदाहरण के लिए, मैं उत्पाद नाम और संस्करण से मेल करने के लिए कोशिश कर रहा था और \ NNP + \ CD जैसे एक खंड नियम का उपयोग करके "इंटरनेट एक्सप्लोरर 8.0" के लिए काम किया लेकिन "इंटरनेट एक्सप्लोरर 8.0 एसपी 2" पर असफल रहा जहां यह एसपी 2 को एनएनपी के रूप में टैग किया गया।

शायद मैं एक पीओएस टैगर प्रशिक्षित कर सकता था लेकिन एसपी को टैग बदलने के बजाय निर्णय लिया और फिर \ NNP + \ CD \ SP * जैसे एक खंड नियम को किसी उदाहरण से मेल खाया जाएगा। chunkGram = r "" "Chunk:: {? * * + }" ""

+0

आप की तर्ज पर एक उदाहरण प्रदान कर सकते हैं – ProfVersaggi

संबंधित मुद्दे