में बराबर समतुल्य मैं पाइथन में फिट वैल्यू इटरेशन (एफवीआई) निष्पादित करने की कोशिश कर रहा हूं (जिसमें टुकड़े की रैखिक इंटरपोलेशन का उपयोग करके 5 आयामी फ़ंक्शन का अनुमान लगाया जा रहा है)।scipy.interpolate.griddata CUDA
scipy.interpolate.griddata इसके लिए पूरी तरह से काम करता है। हालांकि, मुझे इंटरपोलेशन रूटीन को कई हज़ार बार कॉल करने की आवश्यकता है (क्योंकि एफवीआई एक एमसी आधारित एल्गोरिदम है)।
तो मूल रूप से, उन बिंदुओं का सेट जहां कार्य ज्ञात है, स्थिर है (और बड़े - 32k कहें), लेकिन जिन बिंदुओं को मुझे अनुमानित करने की आवश्यकता है (जो मूल सेट के छोटे परेशान हैं) बहुत बड़ा है (32k x 5000 कहते हैं)।
क्या scipy.interpolate.griddata को कार्यान्वित किया गया है जो कि CUDA को पोर्ट किया गया है? वैकल्पिक रूप से, किसी भी तरह की गणना को गति देने का कोई तरीका है?
धन्यवाद।
हाय, हाँ करने जा रहे हैं रहा हूँ। मैंने scipy.spatial.Delauny में find_simplex के कार्यान्वयन को देखा और पाया कि बुनियादी विचार को पर्याप्त रूप से कई बिंदुओं के लिए आसानी से समांतर किया जा सकता है। तो मूल रूप से मैं 2 लूप चलाता हूं - प्रत्येक एमसी नमूना के लिए सरल को ढूंढने (और स्टोर) करने के लिए और एक संग्रहीत सिम्प्लेक्स को देखने और इंटरपोलेशन के लिए अपने बैरेंट्रिक निर्देशांक की गणना करने के लिए। यह वीडियो मेमोरी द्वारा सीमित है लेकिन यह बहुत तेज़ है। – user1726633