2009-10-21 9 views
16

प्राकृतिक भाषा प्रसंस्करण में, चंकने का उद्देश्य क्या है?प्राकृतिक भाषा प्रसंस्करण में, चंकने का उद्देश्य क्या है?

+0

आप भाषण और भाषा प्रसंस्करण (http://www.cs.colorado.edu/~martin/slp.html) के अध्याय 13 (सिंटेक्टिक पार्सिंग) धारा 5 (आंशिक पार्सिंग) को भी देख सकते हैं। – anno

उत्तर

38

चंकिंग को उथले पार्सिंग भी कहा जाता है और यह मूल रूप से भाषण के कुछ हिस्सों और लघु वाक्यांशों (जैसे संज्ञा वाक्यांश) की पहचान है। Part of speech tagging आपको बताता है कि क्या शब्द संज्ञाएं, क्रियाएं, विशेषण आदि हैं, लेकिन यह वाक्य में वाक्य या वाक्यांशों की संरचना के बारे में आपको कोई संकेत नहीं देता है। कभी-कभी शब्दों के भाषण के हिस्सों की तुलना में अधिक जानकारी प्राप्त करना उपयोगी होता है, लेकिन आपको पूर्ण पार्स पेड़ की आवश्यकता नहीं होती है जिसे आप पार्सिंग से प्राप्त करेंगे।

जब चंकिंग बेहतर हो सकता है तो इसका उदाहरण Named Entity Recognition है। एनईआर में, आपका लक्ष्य नामित संस्थाओं, जो वाक्यांशों संज्ञा हो जाते हैं मिल रहा है (हालांकि हमेशा नहीं कर रहे हैं), तो आप को पता है कि राष्ट्रपति बराक ओबामा निम्नलिखित वाक्य में है चाहेगा:

राष्ट्रपति बराक ओबामा ने बीमा कंपनियों और बैंकों की आलोचना की क्योंकि उन्होंने समर्थकों से स्वास्थ्य देखभाल प्रणाली में सुधार और वित्तीय नियमों को खत्म करने के लिए कांग्रेस को अपने कदमों का समर्थन करने के लिए दबाव डालने का आग्रह किया। (source)

लेकिन आपको जरूरी नहीं कि वह वाक्य का विषय है।

चंकिंग को आमतौर पर अन्य कार्यों जैसे प्री-प्रोसेसिंग चरण के रूप में भी इस्तेमाल किया जाता है जैसे उदाहरण-आधारित मशीन अनुवाद, प्राकृतिक भाषा समझ, भाषण उत्पादन, और अन्य।

6

प्राकृतिक भाषा प्रसंस्करण में "टेक्स्ट चंकिंग" के लिए, here देखें (आप शायद इस श्रृंखला में सभी व्याख्यान "एनएलपी 101" के रूप में चाहते हैं ...): यह संज्ञा समूहों को खोजने जैसे कार्यों की श्रृंखला को फैलाता है , क्रिया समूहों को ढूंढना, और पूर्ण विभाजन वाक्य -> ​​कई प्रकार के भाग। व्याख्यान जिसका यूआरएल मैंने उद्धृत किया है, अधिक जानकारी में जाता है!

+0

एक और महल में जवाब? शायद किसी उत्तर के बजाय टिप्पणी की जानी चाहिए। –

0

वाक्यबद्ध रूप से सहसंबंधित वाक्यांशों (समूह) में शब्दों को समूहीकृत करना। एनबी: आईओबी लेबलिंग का उपयोग खंड सीमाओं को इंगित करने के लिए किया जा सकता है।

संबंधित मुद्दे