मेरे पास डेटा है जो ज्यादातर एक छोटी सी सीमा (1-10) में केंद्रित है लेकिन इसमें बड़ी संख्या में अंक (10%) हैं (10-1000) हैं। मैं इस डेटा के लिए हिस्टोग्राम प्लॉट करना चाहता हूं जो (1-10) पर ध्यान केंद्रित करेगा लेकिन यह (10-1000) डेटा भी दिखाएगा। वें हिस्टोग्राम के लिए लॉग-स्केल की तरह कुछ।मैं आर का उपयोग कर एक लंबी पूंछ डेटा के हिस्टोग्राम कैसे प्लॉट कर सकता हूं?
हाँ, मुझे पता है इसका मतलब यह है कि सभी डिब्बे
एक साधारण hist(x)
देता जबकि hist(x,breaks=c(0,1,1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9,2,3,4,5,7.5,10,15,20,50,100,200,500,1000,10000)))
देता
जो में से कोई भी है जो मैं चाहता बराबर आकार के हैं।
अद्यतन यहाँ जवाब निम्नलिखित मैं अब कुछ है जो लगभग ठीक है कि मैं क्या चाहता हूँ (मैं बार-हिस्टोग्राम के बजाय एक सतत साजिश साथ चला गया) का उत्पादन:
breaks <- c(0,1,1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9,2,4,8)
ggplot(t,aes(x)) + geom_histogram(colour="darkblue", size=1, fill="blue") + scale_x_log10('true size/predicted size', breaks = breaks, labels = breaks)![alt text][3]
केवल समस्या यह है कि मैं पैमाने और वास्तविक सलाखों के बीच मिलान करना चाहता हूं। ऐसा करने के लिए दो विकल्प हैं: कोई बस प्लॉट किए गए सलाखों (कैसे?) के वास्तविक मार्जिन का उपयोग करता है, फिर 1.1754,1.2 9 85 आदि जैसे "बदसूरत" एक्स-अक्ष लेबल प्राप्त करें। दूसरा, जिसे मैं पसंद करता हूं, वास्तविक को नियंत्रित करना है डिब्बे मार्जिन का इस्तेमाल किया जाता है ताकि वे ब्रेक से मेल खा सकें।
@Marek मेरे सवाल एक्स-अक्ष (या समान) लॉग करने के लिए, मान (y-axis) –
@ डेविड मेरा बुरा नहीं है। रोलबैक;) – Marek
संभावित डुप्लिकेट: http://stackoverflow.com/questions/1245273/histogram-with-logarithmic-scale –