मैं एक हल्के जावा लाइब्रेरी की तलाश में हूं जो कुछ हद तक हजारों डेटा पॉइंट्स के साथ उच्च आयामी (मेरे मामले में 32) डेटासेट में लगभग समान रूप से वितरित डेटा के लिए लोकैलिटी सेंसिटिव हैशिंग द्वारा निकटतम पड़ोसी खोजों का समर्थन करता है।जावा में एलएसएच पुस्तकालय
यह एक क्वेरी के लिए बाल्टी में सभी प्रविष्टियों को प्राप्त करने के लिए काफी अच्छा है। जिनकी मुझे वास्तव में आवश्यकता है, उन्हें मेरी समस्या में शामिल कुछ फ़िल्टर पैरामीटर के विचाराधीन तरीके से एक अलग तरीके से संसाधित किया जा सकता है।
मुझे पहले से ही likelike मिला है, लेकिन उम्मीद है कि कुछ छोटा और बिना किसी अन्य उपकरण की आवश्यकता है (जैसे अपाचे हडोप की तरह)।
आप कुछ भी मिला? मैं यूएनक्लिडियन दूरी के साथ केएनएन के लिए मेरी मीट्रिक के रूप में इसकी तलाश कर रहा था। –
वास्तव में नहीं। लेकिन मुझे लगता है कि मुझे अपने द्वारा एक कार्यान्वयन के साथ आना होगा। हालांकि सवाल अभी भी हैश फ़ंक्शन चुनने का तरीका है ... – s1lence
आप http://ttic.uchicago.edu/~gregory/download.html पर मैटलैब कार्यान्वयन में हैश फ़ंक्शन से प्रारंभ कर सकते हैं –