2013-09-05 9 views
9

मैं कंप्यूटिंग Wordnet में समानता उपाय के लिए वू और पामर विधि का उपयोग करना चाहते हैं,"कम से कम आम सबस्क्यूमर" और इसकी गणना कैसे करें?

wp = (2 X depth(lcs))/(depth(synset1) + depth(synset2)) 

जहां lcssynset1 की "कम से कम आम subsumer" और synset2

मेरा प्रश्न है:

  1. "कम से कम आम सबस्कूअर" क्या है?
  2. इसकी गणना कैसे करें?
+0

क्या आप की कोशिश की है उपयोग कर सकते हैं? और आपको लगता है कि इस कार्य को पूरा करने के लिए आवश्यक फाइलें क्या हैं? – justhalf

+0

मैं जानना चाहता हूं कि "कम से कम आम सबस्क्यूमर" क्या है? –

+1

तो आपका प्रश्न यह है: "कम से कम आम सबक्यूमर क्या है?"। उस स्थिति में आपको स्पष्ट रूप से यह अवश्य कहना चाहिए, और उसके बाद आप केवल यह पूछें कि इसकी गणना कैसे करें। – justhalf

उत्तर

15

इस paper के अनुसार, दो अवधारणाओं ए की कम से कम आम Subsumer और बी 'सबसे विशिष्ट अवधारणा है जो दोनों ए और बी के एक पूर्वज है ", जहां अवधारणा पेड़ is-a संबंध द्वारा परिभाषित किया गया है। एक अवधारणा को अन्य अवधारणा का पूर्वज माना जाता है जैसे कि आप मानव परिवार के पेड़ में पूर्वजों को परिभाषित करते हैं, जो कि अन्य अवधारणा, दादा दादी, और इसी तरह के माता-पिता हैं। उदाहरण के लिए:

  1. एक कार एक वाहन है, और एक वाहन एक वाहन
  2. है एक नाव एक वाहन है।
  3. वाहन एक वस्तु है।

और ग्राफ:

 
    Object 
     | 
    Vehicle 
     | 
    --------- 
    |  | 
Boat Automobile 
      | 
     Car 

इस मामले में, "ऑटोमोबाइल" जनक "कार" की (और यह भी पूर्वज) है, जबकि "वाहन" "कार" के एक पूर्वज है। "वाहन" भी "नाव" का पूर्वज है। इस मामले में, "नाव" और "कार" का एलसीएस "वाहन" है, क्योंकि यह सबसे विशिष्ट अवधारणा है जो "नाव" और "कार" दोनों का पूर्वज है। ध्यान दें कि "ऑब्जेक्ट" दोनों "नाव" और "कार" का एक आम सबस्क्यूमर है, लेकिन यह कम से कम नहीं है, क्योंकि अभी भी "ऑब्जेक्ट" का एक बच्चा है (इस मामले में यह "वाहन" है) जो भी आम है "कार" और "नाव" दोनों के subsumer। "ऑटोमोबाइल" कम से कम आम सबस्क्यूमर नहीं है क्योंकि यह "नाव" का पूर्वज नहीं है।

समानता माप की गणना करने के लिए, मैं आपको उपलब्ध पुस्तकालय का उपयोग करने का सुझाव देता हूं, अन्यथा आपको अवधारणा ग्राफ को स्वयं बनाना होगा, जो परेशानी है।

पर्ल में, आप WordNet::Similarity package

उपयोग कर सकते हैं अजगर में, आप पैकेज nltk उपयोग कर सकते हैं, विशेष रूप से, wup_similarity

जावा में, आप ws4j package

+0

आपकी प्रतिक्रिया के लिए धन्यवाद, अब मैं जानना चाहता हूं कि एलसीएस (नाव, कार) की गहराई क्या है?क्या यह 3 या 4 है? –

+2

मेरा सुझाव है कि आप वृक्ष (http://en.wikipedia.org/wiki/Tree_(data_structure) के बारे में और पढ़ें)। मूल रूप से गहराई पेड़ की जड़ से गणना की जाती है। मेरे ग्राफ का उपयोग करके, रूट 'ऑब्जेक्ट' है। तो, 'ऑब्जेक्ट' की गहराई 0 है। अब,' एलसीएस (नाव, कार) 'वाहन है, इसलिए गहराई 1. – justhalf

+0

यह" सबसे विशिष्ट अवधारणा "होनी चाहिए, इसलिए यह सबसे दूर है, जो अभी भी 'वाहन' – justhalf

संबंधित मुद्दे