संक्षिप्त उत्तर है कि यहाँ है कि इस मुद्दे को कोई समाधान नहीं है।
जो कुछ भी सामान्य रूप से एक सीपीयू पर चलता है उसे सीयूडीए पर्यावरण के लिए तैयार किया जाना चाहिए बिना किसी गारंटी के कि यह करना भी संभव है। सामान्य सी कार्यों के लिए होस्ट फ़ंक्शन CUDA में बस एक और नाम हैं। यही है, सीपीयू-मेमोरी वॉन न्यूमैन आर्किटेक्चर पर चल रहे कार्यों जैसे सभी सी/सी ++ पीसी में इस बिंदु पर हैं। जीपीयू आपको कंप्यूटिंग पावर की जबरदस्त मात्रा देते हैं लेकिन लागत यह है कि यह लगभग लचीला या संगत नहीं है। सबसे महत्वपूर्ण बात यह है कि मुख्य स्मृति तक पहुंचने की क्षमता के बिना चलने वाले कार्यों और वे जिस स्मृति तक पहुंच सकते हैं वह सीमित है।
यदि आप जो भी प्राप्त करने का प्रयास कर रहे हैं वह एक यादृच्छिक संख्या जनरेटर है, तो आप भाग्यशाली हैं कि एनवीडिया विशेष रूप से एक अत्यधिक कुशल मेर्सन ट्विस्टर को लागू करने की परेशानी में चला गया है जो प्रति एसएमपी 256 धागे तक का समर्थन कर सकता है। यह मेरे डिवाइस here की पिछली पोस्ट में वर्णित डिवाइस फ़ंक्शन के अंदर कॉल करने योग्य है। अगर किसी को इस कार्यक्षमता का वर्णन करने वाला एक बेहतर लिंक मिल जाता है तो कृपया मेरा हटा दें और लिंक के साथ उचित पाठ को यहां बदलें।
एक बात मैं लगातार आश्चर्यचकित हूं कि कितने प्रोग्रामर मानते हैं कि मानक उच्च गुणवत्ता वाले छद्म-यादृच्छिक संख्या जेनरेटर कैसे मानते हैं। "अपना खुद का रोलिंग" वास्तव में एक अच्छा विचार नहीं है कि एक कला छद्म-यादृच्छिक संख्या कितनी है। स्वीकार्य अप्रत्याशित नंबर प्रदान एक जनरेटर सत्यापित किया जा रहा काम और शैक्षिक प्रतिभा का एक बहुत लेता है ...
एक cuda का उपयोग करने के बजाय होस्ट फ़ंक्शन को कॉल करने में प्रदर्शन डाउनग्रेड कितना खराब है? – Mattia
क्या इसका मतलब यह है कि मेजबान और डिवाइस केवल कार्यों की अपनी संबंधित प्रतियां निष्पादित करेगा? – avgvstvs