मेरे पास कुछ आर कोड है जो मुझे पोर्ट पर पाइथन की आवश्यकता है। हालांकि, आर का जादू डेटा। फ्रेम और ddply मुझे पायथन में ऐसा करने के लिए एक अच्छा तरीका खोजने से रोक रहे हैं।श्रेणियों के भीतर गणना करें: पायथन में आर के डीडीप्ली के समतुल्य?
नमूना डेटा (आर):
x <- data.frame(d=c(1,1,1,2,2,2),c=c(rep(c('a','b','c'),2)),v=1:6)
नमूना गणना:
y <- ddply(x, 'd', transform, v2=(v-min(v))/(max(v)-min(v)))
नमूना उत्पादन:
d c v v2
1 1 a 1 0.0
2 1 b 2 0.5
3 1 c 3 1.0
4 2 a 4 0.0
5 2 b 5 0.5
6 2 c 6 1.0
तो यहाँ वहाँ बाहर pythonistas के लिए मेरे सवाल है: आप कैसे होगा ऐसा ही करने? आपके पास कुछ महत्वपूर्ण आयामों के साथ डेटा संरचना है।
प्रत्येक (सी), और प्रत्येक (डी) गणना (वी-मिनट (v))/(अधिकतम (v) -min (v)) के लिए) और इसे संबंधित (डी, सी) जोड़ी के साथ संबद्ध करें।
जो भी डेटा संरचनाएं आप चाहते हैं, उनका उपयोग करने के लिए स्वतंत्र महसूस करें, जब तक वे उचित रूप से बड़े डेटासेट (जो स्मृति में फिट होते हैं) पर त्वरित हों।
पूरी तरह से उदाहरण के लिए धन्यवाद। – evanrsparks