मैं पीईएसपार्क का उपयोग कर रहा हूं। मेरे पास डेटाफ्रेम ('canon_evt') में एक कॉलम ('डीटी') है जो यह एक टाइमस्टैम्प है। मैं डेटटाइम मान से सेकंड हटाने की कोशिश कर रहा हूं। यह मूल रूप से एक स्ट्रिंग के रूप में लकड़ी की छत से पढ़ा जाता है। मैं फिर इसेपायस्पार्क 1.5 सेकंड्स से निकटतम मिनट में टाइमस्टैम्प को कैसे हटाएं
canon_evt = canon_evt.withColumn('dt',to_date(canon_evt.dt))
canon_evt= canon_evt.withColumn('dt',canon_evt.dt.astype('Timestamp'))
के माध्यम से टिमस्टैम्प में बदलने की कोशिश करता हूं तो मैं सेकंड को हटाना चाहता हूं। मैंने 'trunc', 'date_format' या यहां तक कि नीचे की तरह टुकड़ों को एक साथ जोड़ने की कोशिश की। मुझे लगता है कि इसे किसी प्रकार का नक्शा और लैम्ब्डा संयोजन की आवश्यकता है, लेकिन मुझे यकीन नहीं है कि टाइमस्टैम्प एक उपयुक्त प्रारूप है, और क्या सेकंड से छुटकारा पाना संभव है या नहीं।
canon_evt = canon_evt.withColumn('dyt',year('dt') + '-' + month('dt') +
'-' + dayofmonth('dt') + ' ' + hour('dt') + ':' + minute('dt'))
[Row(dt=datetime.datetime(2015, 9, 16, 0, 0),dyt=None)]
क्या आप पोस्टक्वेट से पढ़ते समय यह कैसे देख सकते हैं? – WoodChopper
[पंक्ति (डीटी = '2015-09-16 05:39:46')], पंक्ति (डीटी = '2015-09-16 05:40:46')] – PR102012
'शून्य323', सुपर त्वरित के लिए धन्यवाद मदद! – PR102012