2011-02-15 15 views
9

मैं mongodb/pymongo के लिए बहुत नया हूँ। मैंने सफलतापूर्वक अपना डेटा मोंगो में आयात किया है और समूह की फ़ंक्शन का उपयोग समान पंक्ति को समूहबद्ध करने के लिए करना चाहता हूं। उदाहरण के लिए, अपने डेटा सेट करता है, तो इस तरह दिखता है:समान पंक्तियों को समूहित करने के लिए पिमोंगो में "समूह" का उपयोग कैसे करें?

data = [{uid: 1 , event: 'a' , time: 1} , 
     {uid: 1 , event: 'b' , time: 2} , 
     {uid: 2 , event: 'c' , time: 2} , 
     {uid: 3 , event: 'd' , time: 4} 
     ] 

मैं कैसे समूह समारोह समूह के लिए ऊपर दी गई पंक्तियों uid क्षेत्र के अनुसार प्रयोग करते हैं जैसे कि उत्पादन इस प्रकार है?

{ {uid: 1} : [{uid: 1 , event: 'a' , time: 1} , {uid: 1 , event: 'b' , time: 2} ], 
    {uid: 2} : [{uid: 2 , event: 'c' , time: 2} ], 
    {uid: 3} : [{uid: 3 , event: 'd' , time: 4} ] } 

मैंने http://www.mongodb.org/display/DOCS/Aggregation पर उदाहरणों के माध्यम से पढ़ा। हालांकि, मुझे लगता है कि वे उदाहरण हमेशा एक संख्या या वस्तु में एकत्र होते हैं।

धन्यवाद,

उत्तर

16

आप reduce फ़ंक्शन का उपयोग वास्तव में कम करने के लिए कुछ भी जरूरत नहीं है। उदाहरण के लिए:

>>> coll.insert(dict(uid=1,event='a',time=1)) 
ObjectId('4d5b91d558839f06a8000000') 
>>> coll.insert(dict(uid=1,event='b',time=2)) 
ObjectId('4d5b91e558839f06a8000001') 
>>> coll.insert(dict(uid=2,event='c',time=2)) 
ObjectId('4d5b91f358839f06a8000002') 
>>> coll.insert(dict(uid=3,event='d',time=4)) 
ObjectId('4d5b91fd58839f06a8000003') 
>>> result = coll.group(['uid'], None, 
         {'list': []}, # initial 
         'function(obj, prev) {prev.list.push(obj)}') # reducer 
>>> len(result) # will show three groups 
3 
>>> int(result[0]['uid']) 
1 
>>> result[0]['list'] 
[{u'event': u'a', u'_id': ObjectId('4d5b...0000'), u'uid': 1, u'time': 1}, 
{u'event': u'b', u'_id': ObjectId('4d5b...0001'), u'uid': 1, u'time': 2}] 
>>> int(result[1]['uid']) 
2 
>>> result[1]['list'] 
[{u'event': u'c', u'_id': ObjectId('4d5b...0002'), u'uid': 2, u'time': 2}] 
>>> int(result[2]['uid']) 
3 
>>> result[2]['list'] 
[{u'event': u'd', u'_id': ObjectId('4d5b...0003'), u'uid': 3, u'time': 4}] 

मैंने उपरोक्त सूची में ऑब्जेक्ट आईडी को पठनीयता में सुधार करने के लिए छोटा कर दिया है।

संबंधित मुद्दे

 संबंधित मुद्दे