मैं स्वचालित रूप से कम लेख को वर्गीकृत करने की कोशिश कर काम कर रहा हूँ और मैं कैसे समान शब्द का मिलान कर यह पता लगाने की कोशिश कर रहा हूँ के लिए एक खोज मैच कर सकता है - जैसे, शेल्फ अलमारियों या चित्रकला और फिर से रंगनामैं कैसे मिलते जुलते शब्दों
मैं मैं पोर्टर स्टेमिंग एल्गोरिदम का उपयोग कर रहा हूं लेकिन यह केवल कुछ स्थितियों के लिए मदद करता है और केवल शब्द के अंत में (ऊपर दिए गए दोनों उदाहरण इसके साथ काम नहीं करते हैं)।
वहाँ है एक एल्गोरिथ्म या संबंधित शब्द सूचियों के कुछ इस तरह से मदद मिलेगी (अपने खुद के बनाने के बाहर?)
(मैं php में काम कर रहा हूँ ताकि भाषा में किसी भी समाधान अधिक उपयोगी होगा।)
इस तरह के संदर्भ में लेवेनशेटिन के साथ एक विशेष समस्या यह है कि आपको एक अच्छी दहलीज मिलनी है; यह केवल दो शब्दों के बीच परिवर्तनों की संख्या देता है। मूल पोस्ट में दो उदाहरणों के बीच काफी अंतर है: लेवेनशेटिन ("शेल्फ", "शेल्फ") = 3, लेवेनशेटिन ("पेंटिंग", "पेंट") = 5. –
संदर्भ के लिए - मुझे http : //stackoverflow.com/questions/634995/implementation-of-levenshtein-distance-for-mysql-fuzzy- खोज जिसमें कुछ mysql संग्रहीत प्रक्रिया संस्करण के लिए एक लिंक शामिल है। यद्यपि जनवरी ने बताया कि यह स्पष्ट नहीं है कि यह कितना करीब आएगा। लेकिन यह एक कोशिश के लायक है। – Yehosef
यह निकटतम उत्तर है - यह आदर्श नहीं है लेकिन अच्छी शुरुआत है। जन से शब्द सूची अधिक आदर्श है लेकिन इस बिंदु पर व्यावहारिक नहीं है। – Yehosef