मैं ऐसे उत्तरों की तलाश कर रहा हूं जो स्केल करते हैं, लेकिन मेरे विशिष्ट उद्देश्य के लिए, मेरे पास 48 वां आयाम वेक्टर है। इसे 0 और 255 के बीच 48 पूर्णांक की सरणी के रूप में दर्शाया जा सकता है।किसी दिए गए वेक्टर में वेक्टर शब्दकोश के लिए फास्ट लुकअप। उच्च आयाम
मेरे पास इन वैक्टरों का एक बड़ा शब्दकोश है, उनमें से लगभग 25 हजार।
मुझे अपने वेक्टर लेने में सक्षम होना चाहिए जो मेरे डेटाबेस में हो सकता है या नहीं, और जल्दी से पता चलता है कि डेटाबेस से कौन सा वेक्टर निकटतम है। निकटतम से, मेरा मतलब पारंपरिक दूरी सूत्र के संदर्भ में है।
मेरा कोड पायथन में समाप्त होगा लेकिन यह एक सामान्य प्रश्न है।
ब्रूट फोर्स बहुत धीमी है। मुझे एक करीबी शब्दकोश स्पीड लुकअप चाहिए। किसी के पास कोई विचार है?
एलएसएच अब तक मेरे लिए सबसे अच्छा प्रतीत होता है। http://www.mit.edu/~andoni/LSH/ एक महान संसाधन रहा है। एल्गोरिदम पर 2006 का पेपर सबसे उपयोगी रहा है। –