में संग्रह के विरुद्ध एक स्ट्रिंग की तुलना करें जल्दी से निकटतम मिलान खोजने के लिए संग्रह के विरुद्ध एक स्ट्रिंग के संपादन दूरी की गणना करने की कोशिश कर रहा हूं। मेरी वर्तमान समस्या यह है कि संग्रह बहुत बड़ा है (लगभग 25000 आइटम), इसलिए मुझे सेट को केवल समान लंबाई के तारों तक सीमित करना था, लेकिन यह अभी भी इसे केवल कुछ हज़ार तारों तक सीमित कर देगा और यह अभी भी बहुत धीमा है। क्या कोई डेटास्ट्रक्चर है जो समान तारों के त्वरित लुकअप की अनुमति देता है या क्या कोई और तरीका है जिससे मैं इस समस्या को हल कर सकता हूं?जावा
Q
जावा
5
A
उत्तर
8
BK-tree जैसा लगता है कि आप क्या चाहते हैं। यहां चर्चा करने वाला एक लेख यहां दिया गया है: http://blog.notdot.net/2007/4/Damn-Cool-Algorithms-Part-1-BK-Trees। एक quick Google कुछ जावा कार्यान्वयन पैदा करता है।
2
यदि 'समान' के लिए आपके मानदंड कुल ऑर्डरिंग को परिभाषित करते हैं, तो आप एक तुलनाकर्ता को परिभाषित करने और निकटतम मिलान (उदाहरण के लिए छत और मंजिल विधियों का उपयोग करके) को ट्रीसेट का उपयोग करने में सक्षम होना चाहिए।
6
लेवेनशेटिन ऑटोमाटा एक बड़े शब्दकोष से शब्दों के एक सेट के तेज़ चयन के लिए अनुमति देता है जैसे कि वे दिए गए शब्द से दिए गए लेवेनशेटिन दूरी के भीतर हैं।
देखें: शूलज़ के, मिहोव एस (2002) Fast String Correction with Levenshtein-Automata।
संबंधित मुद्दे
- 1. जावा: जावा
- 2. जावा जावा
- 3. समाधान जब जावा जावा
- 4. जावा के बिना जावा
- 5. जावा - जावा में प्रतिबिंब
- 6. जावा, जावा ईई
- 7. जावा: क्या जावा एप्लिकेशन
- 8. जावा
- 9. जावा
- 10. जावा
- 11. जावा
- 12. जावा
- 13. जावा
- 14. जावा
- 15. जावा
- 16. जावा
- 17. जावा
- 18. जावा,
- 19. जावा
- 20. जावा
- 21. जावा
- 22. जावा
- 23. जावा
- 24. जावा
- 25. जावा
- 26. जावा
- 27. जावा
- 28. जावा
- 29. जावा
- 30. जावा
आप अभी यह कैसे कर रहे हैं? क्या आप कुछ कोड दिखा सकते हैं? –
"समान" परिभाषित करें। –
इसी तरह से मेरा मतलब उन शब्दों की तुलना करना है जो सामान्य वर्तनी की गलतियों जैसे "exanple" और "example" या "weird" और "wierd" हैं। – Lezan