मैं घरेलू सर्वेक्षण से डेटा सारांशित करने की कोशिश कर रहा हूं और क्योंकि मेरा अधिकांश डेटा स्पष्ट (कारक) डेटा है। मैं इसे कुछ प्रश्नों के जवाबों की आवृत्तियों के भूखंडों के साथ संक्षेप में देखना चाहता था (उदाहरण के लिए, कुछ प्रश्नों का उत्तर देने वाले परिवारों के प्रतिशत की बार साजिश, आत्मविश्वास अंतराल दिखाने वाले त्रुटि सलाखों के साथ)। मुझे यह उत्कृष्ट ट्यूटोरियल मिला जो मैंने सोचा था कि मेरी प्रार्थनाओं का जवाब था (http://www.cookbook-r.com/Manipulating_data/Summarizing_data/) लेकिन यह पता चला है कि यह केवल निरंतर डेटा के साथ मदद करने जा रहा है।आर अनुपात आत्मविश्वास अंतराल कारक
मुझे जो चाहिए वह कुछ ऐसा है जो मुझे इन अनुपातों की गणना और मानक त्रुटियों/आत्मविश्वास अंतराल के अनुपात की गणना करने की अनुमति देगा।
# X5employf X5employff N(count) proportion SE of prop. ci of prop
# 1 1 20 0.64516129 ? ?
# 1 2 1 0.03225806 ? ?
# 1 3 9 0.29032258 ? ?
# 1 NA 1 0.290322581 ? ?
# 2 4 1 0.1 ? ?
structure(list(X5employf = structure(c(1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L), .Label = c("1", "2", "3"), class = "factor"), X5employff = structure(c(1L, 2L, 3L, NA, 4L, 5L, 6L, 7L, 8L, 4L, 5L, 6L, 7L), .Label = c("1", "2", "3", "4", "5", "6", "7", "8"), class = "factor"), count = c(20L, 1L, 9L, 1L, 1L, 5L, 2L, 1L, 1L, 4L, 5L, 4L, 1L)), .Names = c("X5employf", "X5employff", "count"), row.names = c(NA, -13L), class = "data.frame")
मैं तो ggplot (या समान) में barplots प्लॉट करने के लिए चाहते हो जाएगा का उपयोग कर:
अनिवार्य रूप से मैं सारांश तालिकाओं कि सवाल मेरी सर्वेक्षण डेटा में पूछा से प्रत्येक के लिए इस तरह दिखना उत्पादन करने में सक्षम होना चाहता हूँ आत्मविश्वास अंतराल दिखाते हुए त्रुटि बार के साथ ये सारांश डेटा।
मैंने ऊपर दिए गए कॉलम की गणना करने के लिए ऊपर दिए गए ट्यूटोरियल में दिए गए कोड में संशोधन करने का विचार किया था, हालांकि आर के सापेक्ष नवागंतुक के रूप में, थोड़ा संघर्ष कर रहा हूं! मैं ggply पैकेज के साथ प्रयोग कर रहे हैं, लेकिन अभी सिंटैक्स पर महान नहीं तो मैं निम्न कोड के साथ जहाँ तक इस रूप में प्राप्त करने के लिए कामयाब रहे:
> X5employ_props <- ddply(X5employ_counts, .(X5employf), transform, prop=count/sum(count))
लेकिन मैं इस के साथ अंत:
X5employf X5employff count prop
1 1 1 20 1.0000000
2 1 2 1 1.0000000
3 1 3 9 1.0000000
4 2 4 1 0.2000000
5 3 4 4 0.8000000
6 2 5 5 0.5000000
7 3 5 5 0.5000000
8 2 6 2 0.3333333
9 3 6 4 0.6666667
10 2 7 1 0.5000000
11 3 7 1 0.5000000
12 2 8 1 1.0000000
13 1 <NA> 1 1.0000000
मेरी सभी अनुपात जा रहा है 1, शायद क्योंकि वे पंक्तियों और नहीं कॉलम भर में गणना की जा रही हैं
मैं अगर किसी को भी मदद या संकुल का पता कर सकता है सोचा/कोड जो मेरे लिए नौकरी करेगा!
आप http://docs.ggplot2.org/current/geom_errorbar.html के बारे में पता कर रहे हैं? आप 'स्टेट = "पहचान" तर्क के साथ एक बारप्लॉट प्लॉट कर सकते हैं, अधिक जानकारी के लिए http://docs.ggplot2.org/current/geom_bar.html देखें। बेहतर प्रतिक्रिया प्राप्त करने के लिए, मेरा सुझाव है कि आप हमें कुछ प्रतिलिपि बनाने वाले डेटा प्रदान करें। –
हाय रोमन, हाँ मैंने geom_errorbar पर ggplot2 दस्तावेज पढ़ा है, और पहले से ही मेरे बार प्लॉट का उत्पादन किया है। हालांकि, geom_errorbar के लिए आपको त्रुटि सलाखों की साजिश के लिए सीमा निर्दिष्ट करने की आवश्यकता है - यही कारण है कि मैं पहले अपने डेटा को सारांशित करने का प्रयास कर रहा हूं। आदर्श रूप में, मैं इसे स्वचालित करने का एक तरीका ढूंढ रहा हूं क्योंकि मेरे पास 49 चर हैं। –
पहले तीन वैक्टर पूर्णांक '1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1 9 20 21 22 23 24 25 26 27 28 2 9 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55' कारक 1 '1 3 1 1 1 3 1 1 1 3 1 1 1 2 2 3 3 3 1 2 2 2 2 2 1 1 1 3 3 3 3 3 3 2 1 1 3 1 3 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2' कारक 2 '1 4 1 2 4 3 1 1 6 1 1 1 5 5 6 7 5 1 6 6 7 5 4 1 3 1 6 5 5 5 6 4 5 3 3 5 1 4 5 1 1 1 1 1 3 3 3 1 3 1 1 1 3 8' –