मैंने पहले से ही कई उदाहरणों की तलाश की है, लेकिन मुझे कोई भी फ़िल्टर किए गए सक्षम मान & उनकी तिथियां नहीं मिलीं।आईडी पर आधारित डेटा फ्रेम, और किसी अन्य कॉलम में मान
Date <-c('3/13/2017 6:21', '3/20/2017 6:28','3/13/2017 6:22','3/20/2017 6:28',' 3/13/2017 6:23','3/20/2017 6:28','3/13/2017 6:24',' 3/20/2017 6:28', ' 3/24/2017 6:28')
Enabled_value<-c(0,1,0,1,0,1,0,1,0)
Helper<-c('39RTU1','39RTU1','39RTU2','39RTU2','39RTU2','39RTU3','39RTU3','39RTU4','39RTU4', '39RTU4')
तरह देखने के लिए:
Helper Date(Enabled Value =0) Date (Enabled Value =1)
39RTU1 3/13/2017 6:20 3/20/2017 6:28
39RTU2 3/13/2017 6:21 3/20/2017 6:28
39RTU3 3/13/2017 6:22 3/20/2017 6:28
39RTU4 3/13/2017 6:24 3/20/2017 6:28
39RTU4 3/24/2017 6:28
आप देख सकते हैं, मैं एक अवलोकन के लिए टाइम स्टाम्प्स है - प्रत्येक पंक्ति (एक उदाहरण होना चाहिए यानी 0 से 1 के Enabled_value से चलती है, और अगर पिछले इकाई के लिए Enabled_value = 0 (नीचे 39RTU4 देखें), वहाँ एक नई लाइन होना चाहिए।
मैं पहले से ही व्यापक काम इस डेटा सेट (500k से पंक्तियों 2k तक) को कम करने की है।
मैं tidyr
और dplyr
का उपयोग करने की कोशिश कर रहा हूं, लेकिन मेरा spread
चल रही त्रुटियां जारी रखता है।
> sorted_data1<-spread(sorted_data,Enabled_Value,Helper)
Error: Duplicate identifiers for rows (1340, 1342)
मैं इस सवाल https://stackoverflow.com/questions/47043098/transpose-columns-group-by-time-and-customer-id – markdly