का उपयोग कर काल। अभी के लिए मैं NLTK का उपयोग कर रहा हूं, एक पीओएस (पार्ट-ऑफ-स्पीच) टैगिंग करें, और फिर पिछले काल प्राप्त करने के लिए 'वीबीडी' कहें। हालांकि यह पर्याप्त सटीक नहीं है, इसलिए मुझे लगता है कि मुझे आगे जाने और चंकिंग का उपयोग करने की आवश्यकता है, फिर विशिष्ट तनाव पैटर्न के लिए वीपी-भाग का विश्लेषण करें। क्या कोई ऐसा अस्तित्व है जो ऐसा करता है? कोई और पढ़ना उपयोगी हो सकता है? NLTK book ज्यादातर एनपी-चंक्स पर केंद्रित है, और मुझे वीपी-चंक्स पर काफी कुछ जानकारी मिल सकती है।का पता लगाने अंग्रेज़ी क्रिया मैंने पहले भी एक अंग्रेजी पाठ गिनती क्रिया वाक्यांशों उस में, वर्तमान और भविष्य काल को देखते हुए एक तरह से देख रहा हूँ NLTK
उत्तर
तुमको सटीक उत्तर जो chunker आप उपयोग करना चाहते पर निर्भर करता है, लेकिन सूची comprehensions आप एक लंबा रास्ता ले जाएगा। यह आपको एक अस्तित्वहीन चंकर का उपयोग करके क्रिया वाक्यांशों की संख्या प्राप्त करता है।
len([phrase for phrase in nltk.Chunker(sentence) if phrase[1] == 'VP'])
आप दसियों की संख्या का पता लगाने के लिए एक और अधिक बढ़िया दृष्टिकोण ले सकते हैं।
पॉइंटर के लिए धन्यवाद, यही वह है जिसका मैं उपयोग कर रहा हूं - मेरा अगला सवाल यह है कि क्या तनाव पैटर्न का पता लगाने के लिए कुछ मौजूद है या नहीं। प्रत्येक वीपी के लिए मैं जानना चाहता हूं कि इसमें क्या तनाव है। –
मैं वास्तव में इस दृष्टिकोण के साथ अपनी समस्या को हल करने में कामयाब रहा, इसलिए इसे स्वीकृत उत्तर के रूप में टैग करना। निम्नलिखित आलेख वास्तव में सहायक है: http://streamhacker.com/2009/02/23/chunk-extraction-with-nltk/ –
हाय माइकल, यह सुनकर बहुत अच्छा लगा कि चीजें आपके लिए अच्छी तरह से काम कर रही हैं! –
आप या तो Berkeley Parser या Stanford Parser के साथ ऐसा कर सकते हैं। लेकिन मुझे नहीं पता कि पाइथन इंटरफ़ेस या तो उपलब्ध है या नहीं।
बहुत बहुत धन्यवाद, यह एक विकल्प हो सकता है - हालांकि मैं पहले से ही एनएलटीके का उपयोग कर रहा हूं, यह स्विच करने के लिए काफी काम हो सकता है। हालांकि देखो। –
एनएलटीके में स्टैनफोर्ड पार्सर के लिए एक इंटरफ़ेस है। 'टैगर = nltk.tag.stanford.POSTagger ('मॉडल/जर्मन-fast.tagger', 'स्टैनफोर्ड-postagger.jar')' आप पहले UTF-8 में तार एन्कोड करने के लिए हो सकता है: इस प्रकार आप इसे उपयोग कर सकते हैं (कम से कम जर्मन मॉडल के लिए)। –
बर्कले को गलत तरीके से लिखा गया था। मैं उत्तर के लिए टाइपो फिक्स का सुझाव नहीं दे सकता। – Streeter
- 1. अंग्रेजी क्रिया inflector
- 2. क्रिया/lstinline पाठ लेटेक्स
- 3. की तरह एक XML को देखते हुए ElementTree
- 4. किसी वेबव्यू में एक प्रासंगिक क्रिया बार
- 5. एक तरह से पता लगाने डिवाइस
- 6. एक आरईएसटी कार्यान्वयन में यूआरआई में एक क्रिया क्रिया सहित प्रोटोकॉल का उल्लंघन क्यों करता है?
- 7. रेंडरएक्शन वर्तमान क्षेत्र में वर्तमान नियंत्रक में क्रिया विधि नहीं ढूंढ रहा
- 8. springmvc jsr303 validator एक क्रिया
- 9. UIWebView में एक नल का पता लगाने, लेकिन अभी भी समर्थन पाठ चयन और लिंक
- 10. मुझे अंग्रेजी वाक्यांशों की एक सूची कहां मिल सकती है?
- 11. आप एक क्रिया का भूतकाल कैसे प्राप्त करते हैं?
- 12. प्रत्येक क्रिया
- 13. हनीकॉम में प्रासंगिक क्रिया बार
- 14. इस क्रिया-प्रकार
- 15. अंक के एक सेट को देखते हुए, यह पता लगाएं कि तीन बिंदुओं में से कोई भी कॉललाइनर
- 16. document.cookie में परिवर्तन करते समय एक क्रिया को ट्रिगर करें?
- 17. बहुभुजों और बिंदुओं की एक श्रृंखला को देखते हुए, यह पता लगाएं कि कौन से बहुभुज
- 18. उपयोगकर्ता क्रिया सत्यापन (एमवीसी-एफएसएम)
- 19. मैं वेब-क्रॉलर में ट्यूटोरियल के लिए देख रहा हूँ
- 20. Global.asax Application_start प्रत्येक क्रिया
- 21. कैसे आप वर्ग का एक उदाहरण को देखते हुए WPF
- 22. बिना क्रिया के अपवाद Flup
- 23. ब्रिटिश अंग्रेजी से अमेरिकी अंग्रेज़ी (और इसके विपरीत) कनवर्टर
- 24. एक सूची एक चर का उपयोग करके सूची टुकड़ा करने की क्रिया, अजगर
- 25. ओवरलोडिंग नियंत्रक क्रिया
- 26. पर्ल: एक मनमानी स्ट्रिंग को देखते हुए, आप पहले एन बिट्स को कैसे निकालते हैं?
- 27. क्रिया = "*" क्या है?
- 28. स्टैनफोर्ड पार्सर में संज्ञा और क्रिया खोजने
- 29. एएसपी.नेट एमवीसी: एएसपी.नेट एमवीसी एप्लीकेशन में एक अन्य क्रिया
- 30. सुदृढीकरण सीखना चर क्रिया
आपके तर्क में कोई दोष है। यदि एक चंकर एनपी का पता लगा सकता है, तो यह वीपी का पता लगाने में सक्षम होना चाहिए। –
बेशक, लेकिन मुझे अधिकतर वीपी विश्लेषण में दिलचस्पी है - अलग-अलग काल के बीच अंतर कैसे करें। –