2012-10-14 11 views
6

मुझे क्षैतिज मार्कोवाइज़ेशन (एनएलपी अवधारणा) को लागू करना है और मुझे थोड़ा परेशानी हो रही है कि पेड़ कैसा दिखाई देगा। मैं Klein and Manning paper पढ़ रहा हूं, लेकिन वे यह नहीं समझाते हैं कि ऑर्डर 2 या ऑर्डर 3 के क्षैतिज मार्कोज़ाइज़ेशन वाले पेड़ कैसा दिखेंगे। क्या कोई एल्गोरिदम पर कुछ प्रकाश डाल सकता है और पेड़ों को किस तरह दिखने के लिए तैयार किया जाता है? मैं एनएलपी के लिए अपेक्षाकृत नया हूँ।क्षैतिज Markovization

उत्तर

10

तो, मान लीजिए कि आप की तरह सपाट नियमों का एक समूह है चलो सिर्फ एक डीटी लेकिन विशेष रूप से एक वीपी के हिस्से के रूप में एक क्रिया के बाद एक Det)। ऐसा करने के लिए सामान्य रूप से आप इस तरह व्याख्या का उपयोग:

NP 
    NNP 
    NP->NNP 
     NNP 
     NP->NNP->NNP 
      NNP 
      NP->NNP->NNP->NNP 
       NNP 

या

VP 
    V 
    VP->V 
     Det 
     VP->V->Det 
      NP 

आप जरूरत पेड़ binarize है, लेकिन इन टिप्पणियों को हमेशा बहुत सार्थक नहीं कर रहे हैं। वे वर्ब वाक्यांश उदाहरण के लिए कुछ हद तक सार्थक हो सकते हैं, लेकिन आप सभी को वास्तव में दूसरे की परवाह है कि एक संज्ञा वाक्यांश उचित संज्ञाओं की एक लंबी लंबी स्ट्रिंग हो सकता है (उदाहरण के लिए "पीटर बी लुईस बिल्डिंग" या "होप मेमोरियल ब्रिज प्रोजेक्ट वर्षगांठ ")। तो क्षैतिज Markovization के साथ आप कुछ टिप्पणियों को फेंक देंगे, कुछ संदर्भ को फेंक देते हैं। Markovization का क्रम उस संदर्भ की मात्रा है जिसे आप बनाए रखने जा रहे हैं। तो सामान्य टिप्पणियों के साथ आप मूल रूप से अनंत आदेश पर हैं: सभी संदर्भ बनाए रखने और कुछ भी पतन करने का चयन करना।

आदेश 0 मतलब है कि आप संदर्भ के सभी ड्रॉप करने जा रहे हैं और आप कल्पना एनोटेशन के बिना एक पेड़ मिलता है, इस तरह:

NP 
    NNP 
    NNP 
     NNP 
     NNP 
      NNP 
      NNP 
       NNP 

आदेश 1 मतलब है कि आप संदर्भ का केवल एक ही अवधि अपने पास रखेंगे और आप इस तरह से एक पेड़ मिलती है:

NP 
    NNP 
    NP->...NNP **one term: NP->** 
     NNP 
     NP->...NNP **one term: NP->** 
      NNP 
      NP->...NNP **one term: NP->** 
       NNP 

आदेश 2 मतलब है कि आप संदर्भ से दो शब्दों अपने पास रखेंगे और आप इस तरह एक पेड़ मिलती है:

NP 
    NNP 
    NP->NNP **two terms: NP->NNP** 
     NNP 
     NP->NNP->...NNP **two terms: NP->NNP->** 
      NNP 
      NP->NNP->...NNP **two terms: NP->NNP->** 
       NNP 
+1

आपका एच = 0 गलत है। – user3639557

+0

एक अलग उत्तर प्रदान करने के लिए स्वतंत्र महसूस करें। – FoolishSeth

0

मेरा मानना ​​है कि विचार नियमों की संभावनाओं का आकलन करते समय क्षैतिज के लिए लंबवत चिह्नकरण और भाई नोड्स के लिए अभिभावक नोड्स को ध्यान में रखना है, और आदेश इंगित करता है कि उनमें से कितने शामिल हैं। पेरेंट एनोटेशन here के लिए एक अच्छी तस्वीर है।

इसके अलावा, http://www.timothytliu.com/files/NLPAssignment5.pdf से एक उद्धरण:

lexicalization दृष्टिकोण करने के लिए, अधिक जानकारी के हर एक पेड़ की मूल नोड्स पर जोड़ा जाता है। यह अलग-अलग अनुलग्नकों के बीच सही ढंग से भिन्न होता है और बाएं या शाखा दाएं शाखा को या नहीं। पेड़ बिनराइज्ड के रूप में भाई बहन का ट्रैक रखकर क्षैतिज मार्कोविज़ेशन पूरा किया जाता है। पेड़ में नोड के माता-पिता का ट्रैक रखते हुए वर्टिकल मार्कोविज़ेशन द्वारा पूरा किया जाता है। ये नई निर्भरताएं बनाते हैं, क्योंकि अब नियम गहराई और चौड़ाई का संयोजन हैं।

NP 
    NNP 
    NNP 
    NNP 
    NNP 

या

VP 
    V 
    Det 
    NP 

जब आप इन binarize आप संदर्भ रखना चाहते हैं (यानी यह नहीं है:

संबंधित मुद्दे