किसी की मदद कर सकते हैं मुझे निम्नलिखित उदाहरण के साथ समग्र और ddply के बीच का अंतर मिलता है:अंतर
एक डेटा फ्रेम:
mydat <- data.frame(first = rpois(10,10), second = rpois(10,10),
third = rpois(10,10), group = c(rep("a",5),rep("b",5)))
उपयोग कुल का एक हिस्सा करने के लिए एक समारोह लागू करने के लिए एक पहलू से डेटा फ्रेम विभाजन:
aggregate(mydat[,1:3], by=list(mydat$group), mean)
Group.1 first second third
1 a 8.8 8.8 10.2
2 b 6.8 9.4 13.4
कोशिश एक और समारोह के लिए कुल उपयोग करने के लिए (एक त्रुटि संदेश देता है):
aggregate(mydat[,1:3], by=list(mydat$group), function(u) cor(u$first,u$second))
Error in u$second : $ operator is invalid for atomic vectors
अब, ddply (plyr पैकेज) के साथ एक ही कोशिश:
ddply(mydat, .(group), function(u) cor(u$first,u$second))
group V1
1 a -0.5083042
2 b -0.6329968
सभी सुझावों, लिंक, आलोचना अत्यधिक सराहना कर रहे हैं।
मैं तुम्हें अंतर का प्रदर्शन किया है लगता है। या यहां कोई सवाल है? –
ठीक है, जबकि मुझे लगता है कि एक अंतर है, मुझे समझ में नहीं आता कि ऐसा क्यों है। इन कार्यों के भीतर क्या अंतर दिखाता है? – skip
http://programming-r-pro-bro.blogspot.com/2012/12/r-faqs-for-fresh-starters.html का भाग 5 नमूना कोड के साथ एक शानदार स्पष्टीकरण है। असल में, ddply आपको प्रत्येक चर पर अलग-अलग फ़ंक्शंस का उपयोग करने की अनुमति देगा, जबकि आपके द्वारा पारित सभी कॉलम पर एक ही फ़ंक्शन का उपयोग करने के लिए कुल बलों। –