2013-06-10 4 views
6

यह डेटा के दृश्य प्रतिनिधित्व के लिए सर्वोत्तम अभ्यास और R/ggplot2 में भूखंडों को आकर्षित करने के बारे में एक प्रश्न है।श्रेणियों में लगातार पृथक्करण का प्रतिनिधित्व करने के लिए एक साजिश तैयार करना (आर, ggplot2)

मैं एक तरह से रेखांकन कहानी का प्रतिनिधित्व करने को खोजने के लिए कोशिश कर रहा हूँ यहाँ बताया।

"हम 2000 परीक्षण मामलों, जिनमें से 500 त्रुटियों जांच के बाद हमने पाया कि परीक्षण के 400 बड़े थे था और 1600 छोटे थे; केवल 25 में से बड़े परीक्षणों में त्रुटियां थीं, इसलिए हमने उन्हें 1600 छोटे परीक्षणों को छोड़कर अलग कर दिया, जिनमें से 475 में त्रुटियां थीं। हमने पाया कि 400 छोटे परीक्षण परीक्षण घड़ी थे और 1200 काउंटर-क्लॉक वार थे; केवल छोटे क्लॉकवाइड परीक्षणों में से 20 में त्रुटियां थीं, इसलिए हमने उन्हें 1200 छोटे काउंटर-क्लॉकवाइड परीक्षण छोड़कर अलग कर दिया, जिनमें से 455 में त्रुटियां थीं। "

दूसरे शब्दों में, मैं अपने परीक्षण मामलों को अलग करने श्रेणियों का उपयोग कर रहा है, और मैं प्रतिनिधित्व करने के लिए चाहते हैं कि मेरे प्रगति के साथ प्रत्येक श्रेणी परिवर्तन में त्रुटियों के अंश।

यहाँ डेटा के साथ कुछ आर है:

tests <- data.frame(n.all=c(2000,400,1600,400,1200),n.err=c(500,25,475,20,455),sep.1=as.factor(c("all","Big","Small","Small","Small")),sep.2=as.factor(c("all","all","all","Clockwise","Counter-Clockwise"))) 
डेटा के इस छोटी राशि, एक साधारण संख्यात्मक तालिका सबसे अच्छा विकल्प हो सकता है के साथ

; आइए मान लें कि कहानी जारी है, अधिक से अधिक अलग श्रेणियों का उपयोग किया जा रहा है, ताकि संख्याओं को सूचीबद्ध करने का सबसे अच्छा विकल्प न हो।

इस डेटा का प्रतिनिधित्व करने का एक अच्छा तरीका क्या होगा? मैं कुछ संभावनाओं के बारे में सोच सकते हैं:

Four possible plots: pie, bar, bar with path, horizontal bar with path

  1. पाई चार्ट, पाई का दिखा स्लाइस दूर ले जाया जा रहा है, और त्रुटियों के टूटने/क्या
  2. बार चार्ट बना हुआ में कोई त्रुटि नहीं है, इसी तरह
  3. दूर अलग श्रेणियों में से "प्रवाह" दिखा रिबन के साथ बार चार्ट, Minard's chart of Napoleon's march
  4. इसी तरह, लेकिन साथ बार अंशों दिखा चार्ट क्षैतिज बल्कि खड़ी की तुलना में

सभी चार विधियां परीक्षण मामलों की पूर्ण मात्रा को कम करती हैं, और अलग-अलग श्रेणी में त्रुटियों का अंश और साथ ही साथ क्या रहता है। मुझे लगता है कि मुझे # 4 सबसे अच्छा लगता है, लेकिन मुझे खुले दिमाग मिल गया है।

इस तरह के डेटा का प्रतिनिधित्व कैसे किया जाना चाहिए, और ऐसा करने के लिए R/ggplot2 का उपयोग किया जा सकता है?

+0

पैकेज 'vcd' पर देखें। लेकिन मैंने कहा कि मुझे लगता है कि यह SO के लिए एक अच्छा सवाल नहीं है। –

+1

मुझे लगता है कि यह एक दिलचस्प सवाल है, लेकिन मैं मानता हूं कि यह स्टैक ओवरफ्लो के लिए थोड़ा सा खुला हो सकता है। CrossValidated कभी-कभी डेटा विज़ुअलाइजेशन प्रश्नों का भी स्वागत करता है जो प्रोग्रामिंग से अधिक वैचारिक हैं। मैं शायद पूछने से पहले बातचीत या कुछ पूछने के लिए कहूंगा, बस सुनिश्चित करने के लिए। – joran

+0

हाँ, एक बार जब आप जानते हैं कि आप क्या विज़ुअलाइज़ेशन चाहते हैं, तो आपको प्यारे हाथ से खींचे गए चित्रों के लिए कोड – alexwhan

उत्तर

0

ग्राफ़ ड्राइंग करते समय 3 चीजें जो पंक्ति में होनी चाहिए याद रखें; जो संदेश आप बता रहे हैं, वह संदेश जो संदेश आपको बता रहा है और वह संदेश जो संदेश आपको बता रहा है। मेरी राय में आपका विकल्प 4 लगातार संदेश प्राप्त करने के लिए सबसे अच्छा है।

मैं भी सरासर उन्मूलन से 4 नंबर पर पहुंचने:;) जब से तुम एक क्षैतिज प्रवाह के साथ खड़ी प्रतिनिधित्व के संयोजन कर रहे हैं, पाई चार्ट की तुलना

कॉलम उपयुक्त नहीं हैं भी (यहां तक ​​कि एक पाई चार्ट के भीतर करना आसान नहीं हैं विभिन्न हिस्सों की तुलना करना पहले से ही मुश्किल है) इसलिए वे एक विकल्प नहीं हैं। आपको विकल्प 4 के साथ वास्तव में छोड़कर :)

आप एक सांकी आरेख भी आज़मा सकते हैं।Sankey Diagrams in R? सहायक हो सकता है

संबंधित मुद्दे