2016-01-07 6 views
5

क्या जूलिया में आर के टेबल फ़ंक्शन की तरह कुछ है? मैंने xtab पढ़ा है, लेकिन इसका उपयोग नहीं करना है।जूलिया में डेटा तालिका फ़ंक्शन (डेटाफ्रेम के लिए)

मान लें कि हमारे पास आर data.framerdata है जो col6Factor प्रकार का है।

आर नमूना कोड:

rdata <- read.csv("mycsv.csv") #1 table(rdata$col6) #2

आदेश डेटा को पढ़ने और जूलिया में कारकों बनाने के लिए मैं इस तरह यह कार्य करें:

using DataFrames jldata = readtable("mycsv.csv", makefactors=true) #1 :col6 will be now pooled.

..., लेकिन कैसे निर्माण करने के लिए जूलिया की तरह आर की मेज (कैसे # 2 प्राप्त करने के लिए)?

+0

इस चल रही चर्चा को यहां देखें: [StatsBase] (https://github.com/JuliaStats/StatsBase.jl/issues/32) – SalchiPapa

उत्तर

4

आप एक ही चर की प्रविष्टियों को गिनने के लिए StatsBase.jl से countmap फ़ंक्शन का उपयोग कर सकते हैं। इस बिंदु पर आकस्मिक तालिकाओं के लिए सामान्य क्रॉस सारणीकरण और सांख्यिकीय परीक्षणों की कमी है। जैसा कि इस्माइल बताता है, इस मुद्दे पर StatsBase.jl के लिए जारीकर्ता ट्रैकर में चर्चा की गई है।

jldata:gender स्तंभ के होते हैं:

4

मैं निष्कर्ष है कि एक समान प्रभाव by का उपयोग कर प्राप्त किया जा सकता करने के लिए आया था।

julia> by(jldata, :gender, nrow) 3x2 DataFrames.DataFrame | Row | gender | x1 | |-----|----------|-------| | 1 | NA | 175 | | 2 | "female" | 40254 | | 3 | "male" | 58574 |

बेशक यह एक table नहीं है लेकिन कम से कम मैं डेटा स्रोत के रूप में ही डेटा प्रकार मिलता है। आश्चर्यजनक रूप से bycountmap से तेज़ लगता है।

+0

जो वास्तव में साफ है। मैं डेटाफ्रेम के लिए 'countmap' पर इसे प्राथमिकता देता हूं। – niczky12

+0

यह जोड़ने लायक हो सकता है कि इस विधि का उपयोग एकाधिक क्रॉस-टैबलेट करने के लिए किया जा सकता है, जो इस समय 'countmap' नहीं कर सकता है। – niczky12

संबंधित मुद्दे