क्या वाक्यों के सभी उप-वाक्यों को खोजने का कोई तरीका है जो अभी भी सार्थक हैं और कम से कम एक विषय, क्रिया, और एक अनुमान/वस्तु है?वाक्य से सार्थक उप-वाक्य ढूंढना
उदाहरण के लिए, अगर हमारे पास वाक्य है "मैं अगले महीने ऑस्टिन में एसएक्सएसडब्ल्यू पर एनएलपी पर सेमिनार करने जा रहा हूं"। हम इस वाक्य से निम्नलिखित अर्थपूर्ण उप-वाक्यों को निकाल सकते हैं: "मैं एक संगोष्ठी करने जा रहा हूं", "मैं एनएलपी पर सेमिनार करने जा रहा हूं", "मैं एसएक्सएसडब्ल्यू पर एनएलपी पर सेमिनार करने जा रहा हूं", " मैं एसएक्सएसडब्लू में एक संगोष्ठी करने जा रहा हूं "," मैं ऑस्टिन में सेमिनार करने जा रहा हूं "," मैं अगले महीने एनएलपी पर सेमिनार करने जा रहा हूं ", आदि
कृपया ध्यान दें कि कोई कटौती नहीं है यहां वाक्यों (उदाहरण के लिए "अगले महीने एसएक्सएसडब्ल्यू में एक एनएलपी सेमिनार होगा"। हालांकि यह सच है, हमें इस समस्या के हिस्से के रूप में इसकी आवश्यकता नहीं है।)। सभी जेनरेट किए गए वाक्य सख्ती से दिए गए वाक्य का हिस्सा हैं।
हम इस समस्या को हल करने के लिए कैसे दृष्टिकोण कर सकते हैं? मैं एनोटेटेड प्रशिक्षण डेटा बनाने की सोच रहा था जिसमें प्रशिक्षण डेटा सेट में प्रत्येक वाक्य के लिए कानूनी उप-वाक्यों का एक सेट है। और उसके बाद मॉडल उत्पन्न करने के लिए कुछ पर्यवेक्षित शिक्षण एल्गोरिदम लिखें।
मैं एनएलपी और मशीन लर्निंग के लिए काफी नया हूं, इसलिए यदि आप लोग इस समस्या को हल करने के कुछ तरीकों का सुझाव दे सकते हैं तो यह बहुत अच्छा होगा।
अपने उदाहरण में, आप भी तरह "मैं जा रहा हूँ" और तुच्छ subsentences चाहते हैं "मैं हूँ"? कैसे "मैं अगले महीने ऑस्टिन जा रहा हूं" के बारे में कैसे? –
@ एड्रियन मैककार्थी: "मैं अगले महीने ऑस्टिन जा रहा हूं" प्रश्न में वर्णित "अनुमानित वाक्यों" में पड़ जाएगा।ये यहां वांछित नहीं हैं, क्योंकि वे इनपुट वाक्य का अर्थपूर्ण उपचार दर्शाते हैं, जहां मैं इसे समझता हूं, विचार मूल पाठ से योग्यता पूर्वोत्तर वाक्यांशों के विभिन्न संयोजनों को शामिल/बहिष्कृत करना है। – mjv
@ एड्रियन मैकार्थी: आपने एक अच्छा बिंदु उठाया। उप-वाक्य "मैं ऑस्टिन जा रहा हूं" कुछ हद तक कम वाक्य और एक "सख्त" उप-वाक्य के बीच सीमा रेखा पर पड़ता है। लेकिन चूंकि आवश्यकता केवल वाक्य में सख्ती से पाए गए उप-वाक्यों को सूचीबद्ध करना है, इसलिए हम इस वाक्य को छोड़ देंगे। –