2017-08-11 10 views
12

मैं कुछ डेटा को पाई चार्ट के रूप में देखने की कोशिश कर रहा हूं। मेरा डेटा (Season, Int) टुपल्स की सूची के रूप में संरचित है, जहां पूर्णांक किसी विशेष मौसम के लिए उपलब्ध वस्तुओं की संख्या का प्रतिनिधित्व करता है।मैं एक पाई चार्ट कैसे बना सकता हूं जहां तत्व एकाधिक स्लाइस से संबंधित हो सकते हैं?

कठिनाई यह है कि एक आइटम कई सत्रों में हो सकता है: एक आइटम गिरने और सर्दी दोनों के लिए मान्य हो सकता है।

क्या यह जानकारी पाई चार्ट के रूप में प्रदर्शित करना संभव है? यह स्पष्ट नहीं है कि प्रतिशत की गणना करते समय denominator क्या होना चाहिए, क्योंकि गणना की कुल राशि कुल आइटम गणना से अधिक हो सकती है।

इसे स्पष्ट करने के लिए एक उदाहरण के रूप में, मान लें कि मेरे पास 10 आइटम हैं। एक वैध डाटासेट हो सकता है:

  • (पतन, 4)
  • (सर्दी, 5)
  • (समर, 3)
  • (स्प्रिंग, 10)

कुल संख्या यहां प्रस्तुत वस्तुओं का 22 वर्ष है, लेकिन वास्तव में केवल 10 आइटम हैं।

4/10 के रूप में गिरावट के प्रतिशत की गणना वास्तव में समझ में नहीं आता है, लेकिन न तो 4/22 करता है।

क्या यह डेटा पाई चार्ट (या अन्य प्रतिशत-उन्मुख चार्ट) के साथ संगत नहीं है?

+0

आप क्यों मानते हैं कि '4/22' प्रतिशत समझ में नहीं आता है? यह पतन के मौसम के लिए वस्तुओं की "घटनाओं" का प्रतिशत है ... संपादित करें: चाहे यह समझ में आता है या नहीं, सभी एक मौसम के लिए "वस्तुओं की उपलब्धता" के आधार पर निर्भर करते हैं, और क्या प्रदर्शित किया जा रहा है। कहें, यदि उद्देश्य प्रति सत्र नाटक नाटकों के प्रस्तुतियों की संख्या की तुलना करना है, तो 4/22 समझ में आएगा ... –

+0

क्या यह आपके पास मौजूद सभी डेटा है या आपके पास यह जानने का तरीका है कि आइटम कितनी श्रेणियां दिखाई देते हैं? – 7hibault

+0

@ 7hibault हाँ मूल डेटा प्रकार '[(सीजन, आइटम)]' – Bill

उत्तर

1

यह इस बात पर निर्भर करता है कि साजिश का प्रतिनिधित्व करने का प्रयास किस व्यापारिक प्रश्न पर है। सर्वोत्तम प्रथाओं का उपयोग हम डेटा विज़ुअलाइज़ेशन में करते हैं। इन सर्वोत्तम प्रथाओं को सांख्यिकी और मानव धारणा द्वारा निर्देशित किया जाता है। हम साजिश को तुरंत कहानी बताना चाहते हैं।

अपनी पोस्ट पढ़ना ऐसा लगता है कि आप जिस व्यवसाय प्रश्न का उत्तर देने का प्रयास कर रहे हैं वह है: कंपनी के की कुल (कुल) संख्याओं के सापेक्ष प्रत्येक सत्र में उपलब्ध वस्तुओं का प्रतिशत क्या है। आपकी पोस्ट में संख्याओं का उपयोग करके 100% आइटम वसंत ऋतु में उपलब्ध हैं, और केवल 50% आइटम सर्दियों में उपलब्ध हैं।

यह देखने के लिए एक महान व्यवसायिक प्रश्न है (यदि यह वास्तव में व्यवसाय प्रश्न है जिसे आप हल करने का प्रयास कर रहे हैं) लेकिन आप इसके लिए एक पाई चार्ट का उपयोग नहीं कर सकते हैं। पाई चार्ट 100% का प्रतिनिधित्व करना चाहिए। बार चार्ट तुलना के लिए अच्छे हैं और मुझे सलाह है कि आप उनका उपयोग करेंगे। आप वाई-अक्ष इकाइयों को प्रतिशत बना सकते हैं, और एक्स-अक्ष के साथ 4 बार हैं।

बार चार्ट को (सांख्यिकीय रूप से) 100% तक जोड़ने की आवश्यकता नहीं है, लेकिन यदि आप चिंतित हैं कि लोग इसके बारे में सोच रहे हैं, तो आप y-axis को आइटमों की संख्या की गणना करके एक ही प्रभाव प्राप्त कर सकते हैं प्रत्येक सत्र में। साजिश अभी भी प्रत्येक सीजन में उपलब्ध वस्तुओं की सापेक्ष संख्या दिखाएगी। इस मामले में बार चार्ट का उपयोग करने का यह एक और अच्छा कारण है।

अंत में, ध्यान दें कि पाई चार्ट अच्छे लगते हैं लेकिन उन्हें मानवीय धारणा के दृष्टिकोण से भी अनुशंसा नहीं की जाती है। स्लाइस के सापेक्ष आकार की तुलना करना हमारे लिए मुश्किल है।

+0

आपका स्वागत है @ बिल। इसके बारे में सोचने के लिए यह एक अच्छा सवाल था। – Rahav

संबंधित मुद्दे