2013-01-16 11 views
5

उदाहरण यहाँRMagic, IPython और सारांश सूचना

http://www.randalolson.com/2013/01/14/filling-in-pythons-gaps-in-statistics-packages-with-rmagic/

मैंने कोशिश की एक अलग डेटा यहां पाया, एक IPython नोटबुक में सेट पर ही बाद।

https://github.com/burakbayramli/kod/blob/master/delltest/dell.tgz

from pandas import * 
orders = read_csv("dell.csv",sep=",") 
%load_ext rmagic 
%R -i orders print(summary(orders)) 

मैं

 Length Class Mode 
[1,] 25  -none- list 
[2,] 25  -none- list 
[3,] 25  -none- list 
.. 

मिल हालांकि आर में एक ही

data <- read.csv ("dell.csv",header=TRUE,sep=",") 
print (summary(data)) 

मुझे सही सारांश जानकारी देता है।

 rank  per_customer_count total_total_amount orderid  
Min. : 1.000 Min. : 1.000  Min. : 0.14 Min. : 1 
1st Qu.: 2.000 1st Qu.: 6.000  1st Qu.: 866.11 1st Qu.: 2964 
Median : 4.000 Median : 8.000  Median : 1764.08 Median : 5980 
Mean : 4.997 Mean : 9.426  Mean : 2004.95 Mean : 5987 
3rd Qu.: 7.000 3rd Qu.:12.000  3rd Qu.: 2856.06 3rd Qu.: 9004 
... 

कोई विचार?

+0

एक अनुमान के रूप में, यह एक अनुसंधान मैट्रिक्स के लिए पांडा DataFrame परिवर्तित कर रहा है, बल्कि:

इस दौरान, आप ऊपर पकाने के लिए क्या आप नीचे दिए गए कोड का स्निपेट से प्रगति करने की जरूरत है सक्षम होना चाहिए आर डेटाफ्रेम। हमें इसे सुधारना चाहिए। –

+0

@ थॉमस-के: ऐसा लगता है कि यह सूचियों (सूचियों की सूची) में परिवर्तित हो रहा था। हमें ipython के लिए dev साइट पर एक मुद्दा खोलना चाहिए (rpy2 की साइट से कहीं अधिक समझ में आता है) और रूपांतरण नियमों में सुधार करने के लिए काम करते हैं rmagic का उपयोग कर रहा है। – lgautier

+0

मैंने आईपीथॉन के लिए जीएच पेज पर समस्या बनाई - https://github.com/ipython/ipython/issues/2797 – user423805

उत्तर

2

मेरे पास एक त्वरित नजरिया थी और ऐसी कई स्थितियां दिखाई देती हैं जिनमें आईपीथॉन जादू रूपांतरण सही नहीं हो रहा है। मुझे rmagic और और जादू के बारे में उनके संपर्क में रहना होगा। एक से

import pandas 
orders = pandas.read_csv("dell.csv", sep=",") 
%load_ext rmagic 

import rpy2.robjects 
d = dict() 
for i, (k,v) in enumerate(orders.iteritems()): 
    print("%s (type: %s - %i/%i)" %(k, v.dtype.kind, i, orders.shape[1])) 
    if v.dtype.kind == 'O': 
     v = rpy2.robjects.vectors.StrVector(v) 
    d[k] = rpy2.robjects.conversion.py2ri(v) 
df = rpy2.robjects.DataFrame(d) 

def print_rsummary(x): 
    print(rpy2.robjects.baseenv['summary'](x)) 

print_rsummary(df) 
+0

ध्यान दें कि यह कार्यक्षमता अब rpy2 2.3.3+ में है (http://rpy.sourceforge.net/rpy2/doc-2.3/html/changes.html?highlight=pandas देखें)! –