2011-11-28 5 views
8

मैं स्टैनफोर्ड कोर NLP उपयोग कर रहा हूँ और मैं इस पंक्ति का उपयोग के साथ कुछ पाठ बेडौल:अपने पाठ को संसाधित करने में कुछ मॉड्यूल लोड करने के लिए स्टैनफोर्ड-NLP

props.put("annotators", "tokenize, ssplit, pos, lemma, ner, parse, dcoref"); 

वहाँ एक मॉड्यूल है कि मैं हिस्सा करने के लिए लोड कर सकते हैं है ये पाठ?

या कुछ पाठ को रोकने के लिए स्टैनफोर्ड कोर का उपयोग करने के लिए एक वैकल्पिक तरीके से कोई सुझाव?

आप

+0

द्वारा "बेडौल" आप आधार एनपी मात्रा और क्रिया समूहों तरह बातें चुनने अर्थ कर रहे हैं? या क्या आप अलग-अलग ब्लॉग टिप्पणियों जैसे टेक्स्ट के संबंधित समूह जैसे सेगमेंट में बड़े टेक्स्ट को विभाजित करना चाहते हैं? –

+1

मेरे पास एक ही प्रश्न है; मेरे मामले में मेरा मतलब है उदाहरण के लिए संज्ञा वाक्यांशों को निकालना – humanzz

उत्तर

5

मुझे लगता है कि पार्सर उत्पादन एनपी हिस्सा प्राप्त करने के लिए इस्तेमाल किया जा सकता धन्यवाद। Stanford Parser website पर संदर्भ-मुक्त प्रतिनिधित्व पर एक नज़र डालें जो उदाहरण आउटपुट प्रदान करता है।

5

स्टैनफोर्ड NLP साथ ठस उपयोग करने के लिए आप निम्न पैकेज का उपयोग कर सकते हैं:

  • Yamcha: SVM-आधारित एनपी chunker, भी स्थिति टैगिंग, एनईआर, आदि C/C++ खुला स्रोत के लिए प्रयोग करने योग्य। Won CoNLL 2000 साझा कार्य। (अंतिम उपयोगकर्ता के लिए एक विशेष पीओएस टैगर से कम स्वचालित।)
  • मार्क ग्रीनवुड का नाम वाक्यांश चंकर: रामशॉ और मार्कस (1 99 5) का जावा पुनर्मूल्यांकन।
  • एफएनटीबीएल: सी ++ में परिवर्तन-आधारित शिक्षा का एक तेज़ और लचीला कार्यान्वयन। एक पीओएस टैगर, लेकिन एनपी चंकिंग और सामान्य चंकिंग मॉडल भी शामिल है।

स्रोत: http://www-nlp.stanford.edu/links/statnlp.html#NPchunk

+2

ये एनपी चंकिंग करने के लिए सिर्फ पैकेज हैं। उदाहरण के लिए: मार्क ग्रीनवुड का नाम वाक्यांश चंकर, एक गेट रैपर प्रदान करता है, लेकिन स्टैनफोर्ड एनएलपी पार्स पेड़ आदि का उपयोग करने के लिए कोई रैपर नहीं है। मुझे लगता है कि कोई भी रेगेक्स आधारित कमजोर कर सकता है - एक कस्टम चंक एनोटेटर हो सकता है जो पाइपलाइन में जोड़ता है। पीओएस पर टोकन रेगेक्स का उपयोग करके एक कस्टम एनोटेटर कहें, पाइपलाइन में "पार्स" के बाद डालें। इस तरह कि पार्स पेड़ में एक और नोड "एनएनपी" हो सकता है जिसके तहत चंकी टोकन वहां हैं। उम्मीद है कि किसी ने कोरएनएलपी के लिए कहीं ऐसा किया है। – aditrip

संबंधित मुद्दे