ठीक है, जल्दी उत्तराधिकार में दूसरा आर प्रश्न।ddply + कॉलम की बड़ी संख्या में समान सांख्यिकीय फ़ंक्शन दोहराए जाने के लिए संक्षेप में
मेरे डेटा:
Timestamp St_01 St_02 ...
1 2008-02-08 00:00:00 26.020 25.840 ...
2 2008-02-08 00:10:00 25.985 25.790 ...
3 2008-02-08 00:20:00 25.930 25.765 ...
4 2008-02-08 00:30:00 25.925 25.730 ...
5 2008-02-08 00:40:00 25.975 25.695 ...
...
मूल रूप से सामान्य रूप से मैं ddply
और summarize
का एक संयोजन (जैसे पूरे साल भर में प्रत्येक घंटे के लिए इसका मतलब है) का उपयोग टुकड़ियों की गणना करने के होगा।
उपर्युक्त मामले में, मैं एक श्रेणी बनाउंगा, उदाहरण के लिए घंटे (जैसे strptime(data$Timestamp,"%H") -> data$hour
और फिर उस श्रेणी स्तंभों में से प्रत्येक के पार श्रेणी के द्वारा औसत के ddply
में उपयोग करते हैं, ddply(data,"hour", summarize, St_01=mean(St_01), St_02=mean(St_02)...)
की तरह।
लेकिन यहाँ है, जहां यह चिपचिपा हो जाता है। मैं से निपटने के लिए 40 से अधिक स्तंभ है और मैं नहीं कर रहा हूँ summarize
फ़ंक्शन के पैरामीटर के रूप में उन्हें एक-एक करके टाइप करने के लिए तैयार हैं। मैं इस कोड को उत्पन्न करने के लिए खोल में एक लूप लिखता था, लेकिन यह नहीं है कि प्रोग्रामर समस्याएं कैसे हल करते हैं?
तो प्रार्थना करें, क्या कोई बेहतर है एक ही परिणाम प्राप्त करने का तरीका लेकिन कम कीस्ट्रोक के साथ?
उपयोग 'numcolwise()' – Andrie
या नयी आकृति प्रदान 'St' चर लंबे तो अपने पसंदीदा एकत्रीकरण कार्यों का उपयोग' by', 'aggregate',' 'ddply' ग से गठबंधन करने के लिए (घंटे , सूचकांक) ', जहां 'इंडेक्स' पुनर्विक्रय में बनाई गई चर है। –
वाई के लिए आसान अंक :-) –