पर दो कॉलम की डेटडिफ मेरे पास डेटाफ्रेम में दो टाइमस्टैम्प कॉलम हैं जिन्हें मैं मिनट का अंतर, या वैकल्पिक रूप से, घंटे का अंतर प्राप्त करना चाहता हूं। वर्तमान में मैं राउंडिंग के साथ, दिन का अंतर प्राप्त करने के लिए,स्पार्क स्कैला: घंटे या मिनट
val df2 = df1.withColumn("time", datediff(df1("ts1"), df1("ts2")))
कर हालांकि, जब मैं दस्तावेज़ पेज https://issues.apache.org/jira/browse/SPARK-8185 मैं नहीं देखा था किसी भी अतिरिक्त पैरामीटर इकाई को बदलने के लिए को देखा द्वारा सक्षम हूं। क्या उनके लिए एक अलग कार्य है जिसका उपयोग करना चाहिए?
मेरे समाधान DataFrame में हर पंक्ति के लिए अंतर का परिकलन करेंगे। यदि इसमें कोई समस्या है तो कृपया अधिक विशिष्ट रहें। इसके अलावा, आपके समाधान के लिए, मेरा मानना है कि स्ट्रिंग एक्सप्रेशन से बचना बेहतर होगा (परीक्षण करना कठिन है और अधिक त्रुटि प्रवण है): 'val df2 = df1.select ((unix_timestamp (ts1) - unix_timestamp (ts2))/3600D)' । –