द्वारा खोज परिणामों को समूह करने का सबसे प्रभावी तरीका मैं एक एसक्यूएल सर्वर 2008 डीबी और एएसपीएनटी एमवीसी वेब ई-कॉमर्स ऐप पर काम कर रहा हूं।स्ट्रिंग समानता
मेरे पास अलग-अलग उपयोगकर्ता डीबी को अपने उत्पादों को खिला रहे हैं, और मैं समान नाम वाले उत्पादों की कीमतों की तुलना करना चाहता हूं। मुझे पता है कि स्ट्रिंग मिलान डोमेन विशिष्ट है, लेकिन मुझे अभी भी सर्वोत्तम सामान्य समाधान की आवश्यकता है।
खोज परिणामों को समूहित करने का सबसे प्रभावी तरीका क्या है? क्या मुझे लेवेनशियन दूरी एल्गोरिदम का उपयोग करके रिकॉर्ड्स से प्रत्येक रिकॉर्ड की तुलना करनी चाहिए? क्या मुझे इसे डीबी में या कोड में करना चाहिए? क्या इस कार्य के लिए वास्तविक समय में एसएसआईएस फ़ज़ी ग्रुपिंग को लागू करने का कोई तरीका है? क्या एसक्यूएल सर्वर 2008 मुफ्त टेक्स्ट खोज का उपयोग कर ऐसा करने का कोई प्रभावी तरीका है?
संपादित करें 1: नेटवर्क-ग्राफ विश्लेषण के बारे में क्या। यदि मैं लेवेनशेटियन दूरी एल्गोरिदम का उपयोग करके एक मैट्रिक्स को परिभाषित कर दूंगा, तो मैं क्लस्टरिंग एल्गोरिदम का उपयोग कर सकता हूं (उदाहरण के लिए: क्लॉजेट न्यूमैन मूर) और अलग-अलग समूहों जिनमें उनके बीच ध्वन्यात्मक पथ नहीं है। मैंने निक जॉनसन (टिप्पणी देखें) बिल्ली-कुत्ते को उदाहरण के लिए संलग्न किया है (लाल रेखाएं क्लस्टर हैं) - और क्लॉजेट न्यूमैन मूर का उपयोग करके मैं कुत्तों से 2 अलग-अलग क्लस्टर और अलग बिल्लियों का निर्माण कर रहा हूं।
आपको क्या लगता है?
मैं इसे डीबी में करूँगा, यह धागा देखें: http://www.sqlteam.com/forums/topic.asp?TOPIC_ID=66781 और यह: http://stackoverflow.com/questions/560709/levenshtein Levenshtein दूरी alg पर -डिस्टेंस-इन-टी-एसक्यूएल। – Magnus
यह कठिन है - आप उत्पादों 'बिल्ली', 'कार', 'बार', 'बैग', 'बोग', 'कुत्ते' को कैसे समूहित करेंगे? प्रत्येक एक दूसरे से दूरी 1 है, लेकिन 'बिल्ली' और 'कुत्ते' कोई समानता साझा नहीं करते हैं। –
तो विकल्प क्या है? शायद किसी तरह का अर्थपूर्ण शब्दकोश? कोई अन्य विचार? – Gidon