2013-12-14 12 views
12

का उपयोग कर अर्थपूर्ण भूमिका लेबलिंग मेरे पास वाक्यों की एक सूची है और मैं प्रत्येक वाक्य का विश्लेषण करना चाहता हूं और उस वाक्य के भीतर अर्थपूर्ण भूमिकाओं की पहचान करना चाहता हूं। मैं उसको कैसे करू?एनएलटीके

मैं एनएलटीके मॉड्यूल के भीतर PropBankCorpusReader में आया जो पेन ट्रीबैंक को अर्थपूर्ण लेबलिंग जानकारी जोड़ता है। इंटरनेट पर भी मेरा शोध बताता है कि इस मॉड्यूल का उपयोग अर्थपूर्ण भूमिका लेबलिंग करने के लिए किया जाता है।

हालांकि मैं एक छोटा हाउटो खोजने में असमर्थ हूं जो मुझे समझने में मदद करता है कि हम प्रोबैंककॉर्पस रीडर को आर्बिटरी टेक्स्ट पर SRL करने के लिए कैसे लाभ उठा सकते हैं।

इसलिए क्या कोई व्यक्ति PropbankCorpusReader का उपयोग करके मध्यस्थ वाक्य पर SRL निष्पादित करने के उदाहरणों को इंगित कर सकता है?

उत्तर

8

SRL एक छोटी सी समस्या नहीं है, और वास्तव में कुछ ऐसा नहीं है जो nltk का उपयोग करके बॉक्स से बाहर किया जा सकता है।

आप 3 अलग-अलग चरणों में SRL का कार्य करना बंद कर सकता:

  1. विधेय की पहचान करना।
  2. यह निर्धारित करने के लिए कि कौन से अर्थपूर्ण तर्क स्वीकार करते हैं, भविष्यवाणी पर शब्द समझ में असंबद्धता का प्रदर्शन करना।
  3. वाक्य में अर्थपूर्ण तर्कों की पहचान करना।

इस समस्या के अधिकांश वर्तमान दृष्टिकोण पर्यवेक्षित मशीन सीखने का उपयोग करते हैं, जहां क्लासिफायर प्रोबैंक या फ़्रेमनेट वाक्यों के उप-समूह पर ट्रेन करेगा और उसके सटीकता को मापने के लिए शेष सबसेट पर परीक्षण करेगा। शोधकर्ता ट्विकिंग फीचर्स और एल्गोरिदम पर ध्यान केंद्रित करते हैं, साथ ही साथ उपरोक्त चरणों को अनुक्रमिक रूप से या एक साथ किया जाता है, और किस क्रम में टंकण करते हैं।

कुछ कागजात आप की जाँच करने के लिए चाहते हो सकता है कर रहे हैं:

मार्कोव तर्क दृष्टिकोण आशाजनक है, लेकिन मेरे अपने अनुभव में यह गंभीर scalability मुद्दों में चलाता है (मैं ही कभी Alchemy का उपयोग किया है, हालांकि Alchemy Lite दिलचस्प लग रहा है)। यह nltk Propbank डेटा का उपयोग करके किसी प्रकार के वर्गीकरण को लागू करने के लिए बहुत अधिक काम नहीं है, और कुछ off the shelf classifiers पहले से ही पाइथन में मौजूद हैं।

संपादित करें: एडिनबर्ग विश्वविद्यालय सेThis assignment Propbank डेटा पार्स करने के लिए कैसे के कुछ उदाहरण देता है, और part of a school project मैं एक पूरी Propbank सुविधा पार्सर को लागू करता है, हालांकि सुविधाओं शैली में मार्कोव तर्क नेटवर्क में इस्तेमाल के की ओर विशेष रूप से तैयार कर रहे हैं किया मेज़ा-रुइज़ और रिडेल (200 9) का।

3

इस ताजा नई पायथन लाइब्रेरी (एनएलटीके पर निर्भर करता है) https://pypi.python.org/pypi/nlpnet/ देखें ... यह पीओएस और SRL करता है।

4

मैं PractNLPTools जो सिमेंटिक भूमिका लेबलिंग सहित सभ्य उपकरण की एक संख्या है सुझाव देना चाहेंगे।

मैं अब एक कार्य प्रोजेक्ट के लिए पूछताछ कर रहा हूं और ऐसा लगता है कि यह काम पूरा हो जाएगा।

PractnlpTools: https://pypi.python.org/pypi/practnlptools/1.0

GitHub समर्थन साइट: https://github.com/biplab-iitb/practNLPTools