यह डेटा के दृश्य प्रतिनिधित्व के लिए सर्वोत्तम अभ्यास और R/ggplot2 में भूखंडों को आकर्षित करने के बारे में एक प्रश्न है।श्रेणियों में लगातार पृथक्करण का प्रतिनिधित्व करने के लिए एक साजिश तैयार करना (आर, ggplot2)
मैं एक तरह से रेखांकन कहानी का प्रतिनिधित्व करने को खोजने के लिए कोशिश कर रहा हूँ यहाँ बताया।
"हम 2000 परीक्षण मामलों, जिनमें से 500 त्रुटियों जांच के बाद हमने पाया कि परीक्षण के 400 बड़े थे था और 1600 छोटे थे; केवल 25 में से बड़े परीक्षणों में त्रुटियां थीं, इसलिए हमने उन्हें 1600 छोटे परीक्षणों को छोड़कर अलग कर दिया, जिनमें से 475 में त्रुटियां थीं। हमने पाया कि 400 छोटे परीक्षण परीक्षण घड़ी थे और 1200 काउंटर-क्लॉक वार थे; केवल छोटे क्लॉकवाइड परीक्षणों में से 20 में त्रुटियां थीं, इसलिए हमने उन्हें 1200 छोटे काउंटर-क्लॉकवाइड परीक्षण छोड़कर अलग कर दिया, जिनमें से 455 में त्रुटियां थीं। "
दूसरे शब्दों में, मैं अपने परीक्षण मामलों को अलग करने श्रेणियों का उपयोग कर रहा है, और मैं प्रतिनिधित्व करने के लिए चाहते हैं कि मेरे प्रगति के साथ प्रत्येक श्रेणी परिवर्तन में त्रुटियों के अंश।
यहाँ डेटा के साथ कुछ आर है:
tests <- data.frame(n.all=c(2000,400,1600,400,1200),n.err=c(500,25,475,20,455),sep.1=as.factor(c("all","Big","Small","Small","Small")),sep.2=as.factor(c("all","all","all","Clockwise","Counter-Clockwise")))
डेटा के इस छोटी राशि, एक साधारण संख्यात्मक तालिका सबसे अच्छा विकल्प हो सकता है के साथ
; आइए मान लें कि कहानी जारी है, अधिक से अधिक अलग श्रेणियों का उपयोग किया जा रहा है, ताकि संख्याओं को सूचीबद्ध करने का सबसे अच्छा विकल्प न हो।
इस डेटा का प्रतिनिधित्व करने का एक अच्छा तरीका क्या होगा? मैं कुछ संभावनाओं के बारे में सोच सकते हैं:
- पाई चार्ट, पाई का दिखा स्लाइस दूर ले जाया जा रहा है, और त्रुटियों के टूटने/क्या
- बार चार्ट बना हुआ में कोई त्रुटि नहीं है, इसी तरह
- दूर अलग श्रेणियों में से "प्रवाह" दिखा रिबन के साथ बार चार्ट, Minard's chart of Napoleon's march
- इसी तरह, लेकिन साथ बार अंशों दिखा चार्ट क्षैतिज बल्कि खड़ी की तुलना में
सभी चार विधियां परीक्षण मामलों की पूर्ण मात्रा को कम करती हैं, और अलग-अलग श्रेणी में त्रुटियों का अंश और साथ ही साथ क्या रहता है। मुझे लगता है कि मुझे # 4 सबसे अच्छा लगता है, लेकिन मुझे खुले दिमाग मिल गया है।
इस तरह के डेटा का प्रतिनिधित्व कैसे किया जाना चाहिए, और ऐसा करने के लिए R/ggplot2 का उपयोग किया जा सकता है?
पैकेज 'vcd' पर देखें। लेकिन मैंने कहा कि मुझे लगता है कि यह SO के लिए एक अच्छा सवाल नहीं है। –
मुझे लगता है कि यह एक दिलचस्प सवाल है, लेकिन मैं मानता हूं कि यह स्टैक ओवरफ्लो के लिए थोड़ा सा खुला हो सकता है। CrossValidated कभी-कभी डेटा विज़ुअलाइजेशन प्रश्नों का भी स्वागत करता है जो प्रोग्रामिंग से अधिक वैचारिक हैं। मैं शायद पूछने से पहले बातचीत या कुछ पूछने के लिए कहूंगा, बस सुनिश्चित करने के लिए। – joran
हाँ, एक बार जब आप जानते हैं कि आप क्या विज़ुअलाइज़ेशन चाहते हैं, तो आपको प्यारे हाथ से खींचे गए चित्रों के लिए कोड – alexwhan