PPDB

2017-06-29 2 views
5

का उपयोग कर मैं एक अंग्रेजी वाक्य PPDB संक्षिप्त व्याख्या डेटाबेसPPDB

मैं website से डेटासेट डाउनलोड किया है का उपयोग करने का संक्षिप्त व्याख्या उत्पन्न करने के लिए की जरूरत है अंग्रेजी पाठ का सविस्तार पैदा होता है।

+5

आपको वास्तव में वर्णन करने की आवश्यकता है कि आपने क्या प्रयास किया है। – boxed

+2

पीपीडीबी एक कॉर्पस की तरह दिखता है जिसका उपयोग आप पैराफ्रेज एल्गोरिदम को प्रशिक्षित करने के लिए करेंगे, न कि एक उपकरण जिसे आप सीधे उपयोग करेंगे। पैराफ्रेशिंग एक बहुत मुश्किल एनएलपी समस्या है। ऐसा लगता है कि उन्होंने अपने पेपर में इसके विवरण के अलावा, उनके एल्गोरिदम का खुलासा नहीं किया है। – keredson

उत्तर

1

मैं कहूंगा कि आपका पहला कदम समस्या को और अधिक प्रबंधनीय घटकों में कम करने की आवश्यकता है। दूसरी बात यह है कि क्या आप एक-से-एक, व्याख्यात्मक, वाक्य रचनात्मक, वाक्यांश या संयोजन आधार पर पैराफ्रेश करना चाहते हैं। इस निर्णय को सूचित करने के लिए मैं एक वाक्य लेता हूं और जो कुछ मैं ढूंढ रहा हूं उसका विचार पाने के लिए इसे स्वयं पैराफ्रेश करता हूं। इसके बाद मैं डाउनलोड किए गए डेटा के लिए एक पार्सर लिखना शुरू कर दूंगा। फिर मैं स्टॉपवर्ड को हटा दूंगा और अपने उदाहरण वाक्यांश के लिए स्पासी या एनएलटीके में शामिल लोगों की तरह भाषण टैगर को शामिल कर दूंगा।

चूंकि वे आपको एक सतत शब्दकोश फ़िल्टर बनाने के लिए आवश्यक सभी जानकारी प्रदान करते हैं, जहां मैं शुरू करूंगा। मैं एक फ़िल्टर लिखूंगा जो डेटासेट के [एलएचएस] कॉलम में मेरी वाक्य में प्रत्येक शब्द के लिए भाषण के कुछ हिस्सों को मिला और उस स्रोत का चयन करें जो 1 फीचर के मूल्य को कम करने/अधिकतम करने के दौरान शब्द से मेल खाता है (जैसे वर्डलेनडिफ़ को कम करना) "बिजनेसनो" का मामला < - "अब व्यवसाय" = -1.5। लक्ष्य सुविधा का ट्रैक रखते हुए आपके पास मूलभूत पैराफ्रेशेड वाक्य होगी।

इस रणनीति का उपयोग कर अपने उत्पादन बदल सकती है:

में
"the business uses 4 gb standard." 
sent_score = 0 

:

"businessnow uses 4gb standard" 
sent_score = -3 

आप एक बुनियादी उदाहरण है के बाद आप में उन लोगों की तरह इन सुविधा का चयन एल्गोरिदम की खोज शुरू कर सकते हैं scikit-जानने के लिए, आदि और शब्द संरेखण शामिल करें। लेकिन मैं गंभीरता से समस्या के दायरे पर कटौती करूंगा और इसे धीरे-धीरे बढ़ा दूंगा। अंत में, आप समस्या से कैसे संपर्क करते हैं यह इस बात पर निर्भर करता है कि नामित उपयोग क्या है और यह कितना कार्यात्मक होना चाहिए।

उम्मीद है कि इससे मदद मिलती है।

+0

क्या कोई कार्यान्वयन उपलब्ध है इसलिए मैं परीक्षण कर सकता हूं। मुझे दृष्टिकोण पसंद है और मैं इसे भी अपने आप पर कोशिश करूँगा। लेकिन कार्यान्वयन का उपयोग कर कुछ बुनियादी समझ की जरूरत है। आप से सुनने के लिए उम्मीद। –

+0

कोई 1 उदाहरण नहीं है। तुम कहाँ फंस रहे हो? –

+0

टैगिंग और पीपीडीबी के हिस्से से थोड़ा उलझन में है। वे कैसे संबंधित हैं? यही कारण है कि मैंने आपके उत्तर के संबंध में एक संदर्भ मांगा। मुझे उम्मीद है कि संदर्भ के लिए मेरा प्रश्न आपको अपमानित नहीं करता है। –