मैं अपने स्थानीय डेस्कटॉप RStudio सत्र को स्पार्कलीर के माध्यम से रिमोट स्पार्क सत्र में कनेक्ट करना चाहता हूं। जब आप RStudio में स्पार्कलीर ui टैब में एक नया कनेक्शन जोड़ने के लिए जाते हैं और क्लस्टर चुनते हैं तो कहता है कि आपको क्लस्टर पर चलना होगा, या क्लस्टर के लिए उच्च बैंडविड्थ कनेक्शन होना चाहिए।स्पार्कलर को रिमोट स्पार्क कनेक्शन से कनेक्ट करें
क्या कोई इस तरह के कनेक्शन को बनाने के तरीके पर प्रकाश डाल सकता है? मुझे यकीन है कि इस की प्रतिलिपि प्रस्तुत करने योग्य उदाहरण बनाने का तरीका नहीं हूँ, लेकिन सामान्य रूप में मुझे क्या करना चाहते हैं:
library(sparklyr)
sc <- spark_connect(master = "spark://ip-[MY_PRIVATE_IP]:7077", spark_home = "/home/ubuntu/spark-2.0.0", version="2.0.0")
एक दूरस्थ सर्वर से
। मैं समझता हूं कि विलंबता होगी, खासकर यदि रिमोट के बीच डेटा पास करने का प्रयास कर रहे हैं। मैं यह भी समझता हूं कि वास्तविक क्लस्टर पर rstudio-server होना बेहतर होगा- लेकिन यह हमेशा संभव नहीं होता है, और मैं अपने सर्वर और मेरे डेस्कटॉप RStudio सत्र के बीच बातचीत के लिए स्पार्कलीर विकल्प की तलाश में हूं। धन्यवाद।
क्या आप स्पार्क_कनेक्ट का उपयोग करने का प्रयास करते समय एक त्रुटि फेंक रहे हैं? – jmuhlenkamp