2012-01-13 7 views
16

मैं, जानना चाहते हैं, कई भाषाओं में यदि दो शब्द हैं:कैसे पता चले कि दो शब्दों का एक ही आधार है?

  • या तो एक ही शब्द,
  • या एक ही शब्द के व्याकरण वेरिएंट।

उदाहरण के लिए:

  • had और has एक ही आधार है: दोनों ही मामलों में, यह क्रिया have,
  • city और cities एक ही आधार है है।
  • went और gone समान आधार है।

क्या माइक्रोसॉफ्ट वर्ड एपीआई का उपयोग करने के लिए कोई तरीका नहीं है, केवल चेक टेक्स्ट का जादू करने के लिए, बल्कि आधार पर एक शब्द को सामान्यीकृत करें या कम से कम, यह निर्धारित करें कि दो शब्दों का एक ही आधार है या नहीं?

यदि नहीं, तो (मुफ्त या भुगतान) पुस्तकालय (वेब ​​सेवाएं नहीं) क्या हैं जो मुझे ऐसा करने की अनुमति देती हैं (फिर से, कई भाषाओं में)?

+0

जब आप कहते हैं कि आप इस कई भाषाओं में किया चाहते हैं, आप का मतलब है कि शब्द आप तुलना कर रहे हैं एक भी की तुलना में अलग-अलग भाषाओं किया जा सकता हैं? उदाहरण के लिए, क्या अंग्रेजी शब्द 'शहर' जर्मन शब्द 'स्टैड' के लिए एक मैच के रूप में पाया जाना चाहिए? या आप उम्मीद करते हैं कि कम से कम दो शब्द जो आप तुलना कर रहे हैं कम से कम एक ही शब्दकोश में रहते हैं? –

+0

@ एम। बाबॉक: मैं केवल अंग्रेजी से अंग्रेजी, जर्मन से जर्मन की तुलना करता हूं, इसलिए मुझे एक समय में केवल एक शब्दकोश की आवश्यकता है। –

+3

यदि यह आपकी खोज में सहायता करता है - इसके लिए सामान्य शब्द "stemming" है (http://en.wikipedia.org/wiki/Stemming देखें)। – ruakh

उत्तर

2

Inflector.NET एक ओपन सोर्स लाइब्रेरी है जिसका उपयोग आप अंग्रेजी संज्ञा के परिवर्तन को सामान्यीकृत करने के लिए कर सकते हैं। यहां उपलब्ध: https://github.com/davidarkemp/Inflector/tree/master/Inflector

+0

(1) यह केवल अंग्रेज़ी के लिए उपलब्ध प्रतीत होता है।(2) यहां तक ​​कि अंग्रेजी के लिए, यह काम नहीं करेगा: भले ही यह मेरे प्रश्न में दिए गए तीन उदाहरणों में से एक (शहर/शहरों) के लिए काम करता है, फिर भी यह अन्य दो के लिए विफल रहता है, जो कि सभी किनारे के मामलों में गिनती नहीं है अंग्रेज़ी का व्याकरण। –

+0

@ मेनमा, कक्षा अतिरिक्त "एज केस" सहित अनुमति देता है। यह वर्ग केवल ** संज्ञाओं के लिए काम करता है ** (मैंने इसे प्रतिबिंबित करने के लिए अपना उत्तर अपडेट किया है)। आप सही हैं कि यह केवल अंग्रेज़ी है, लेकिन आप अधिक स्थानीयकरण कार्यान्वयन में डिज़ाइन पैटर्न का लाभ उठाने में सक्षम हो सकते हैं। सौभाग्य – smartcaveman

1

स्नोबॉल एक स्टेमिंग एपीआई है जो विभिन्न प्राकृतिक भाषाओं को संभाल सकता है और विभिन्न प्रोग्रामिंग भाषाओं के लिए स्नोबॉल कार्यान्वयन हैं।

http://snowball.tartarus.org/

संबंधित मुद्दे