मैं, जानना चाहते हैं, कई भाषाओं में यदि दो शब्द हैं:कैसे पता चले कि दो शब्दों का एक ही आधार है?
- या तो एक ही शब्द,
- या एक ही शब्द के व्याकरण वेरिएंट।
उदाहरण के लिए:
had
औरhas
एक ही आधार है: दोनों ही मामलों में, यह क्रियाhave
,city
औरcities
एक ही आधार है है।went
औरgone
समान आधार है।
क्या माइक्रोसॉफ्ट वर्ड एपीआई का उपयोग करने के लिए कोई तरीका नहीं है, केवल चेक टेक्स्ट का जादू करने के लिए, बल्कि आधार पर एक शब्द को सामान्यीकृत करें या कम से कम, यह निर्धारित करें कि दो शब्दों का एक ही आधार है या नहीं?
यदि नहीं, तो (मुफ्त या भुगतान) पुस्तकालय (वेब सेवाएं नहीं) क्या हैं जो मुझे ऐसा करने की अनुमति देती हैं (फिर से, कई भाषाओं में)?
जब आप कहते हैं कि आप इस कई भाषाओं में किया चाहते हैं, आप का मतलब है कि शब्द आप तुलना कर रहे हैं एक भी की तुलना में अलग-अलग भाषाओं किया जा सकता हैं? उदाहरण के लिए, क्या अंग्रेजी शब्द 'शहर' जर्मन शब्द 'स्टैड' के लिए एक मैच के रूप में पाया जाना चाहिए? या आप उम्मीद करते हैं कि कम से कम दो शब्द जो आप तुलना कर रहे हैं कम से कम एक ही शब्दकोश में रहते हैं? –
@ एम। बाबॉक: मैं केवल अंग्रेजी से अंग्रेजी, जर्मन से जर्मन की तुलना करता हूं, इसलिए मुझे एक समय में केवल एक शब्दकोश की आवश्यकता है। –
यदि यह आपकी खोज में सहायता करता है - इसके लिए सामान्य शब्द "stemming" है (http://en.wikipedia.org/wiki/Stemming देखें)। – ruakh