मैं बस ddply
से शुरू कर रहा हूं और इसे बहुत उपयोगी ढूंढ रहा हूं। मैं डेटा फ्रेम को सारांशित करना चाहता हूं और अंतिम आउटपुट में कुछ पंक्तियों से छुटकारा पाने के लिए भी सारांशित कॉलम का एक विशेष मूल्य है या नहीं। यह एसक्यूएल में HAVING
के साथ-साथ GROUP BY
जैसा है।फ़िल्टरिंग करने के साथ-साथ ddply में संक्षेप में करने का कोई तरीका?
input = data.frame(id= c(1, 1, 2, 2, 3, 3),
metric= c(30,50,70,90,40,1050),
badness=c(1, 5, 7, 3, 3, 99))
intermediateoutput = ddply(input, ~ id, summarize,
meanMetric=mean(metric),
maxBadness=max(badness))
intermediateoutput[intermediateoutput$maxBadness < 50,1:2]
यह देता है:: यहाँ एक उदाहरण है
id meanMetric
1 1 40
2 2 80
जो है जो मैं चाहता, लेकिन मैं इसे ddply
बयान किसी भी तरह के भीतर एक ही चरण में कर सकते हैं?
:
@Arun टिप्पणी के बाद, आप कोड इस तरह से सरल बना सकते हैं यदि आप पहले से ही 'प्लीयर' के लिए प्रतिबद्ध नहीं हैं तो आपको सीधे 'dplyr' पर जाने से लाभ हो सकता है जो कि नया और बेहतर संस्करण है। – Ben
बस सुनिश्चित करें कि आप दोनों को एक ही समय में लोड नहीं किया गया है –