में बड़े डेटासेट प्लॉटिंग मेरे पास एक बड़ा डेटासेट है जिसे मैं आईपीथन नोटबुक में प्लॉट करना चाहता हूं।आईपीथॉन नोटबुक (बोके)
मैंने read_csv
का उपयोग करते हुए ~ 0.5GB .csv फ़ाइल को पांडस DataFrame
में पढ़ा है, इसमें लगभग दो मिनट लगते हैं। फिर मैं इस डेटा को साजिश करने की कोशिश करता हूं।
data = pd.read_csv('large.csv')
output_notebook()
p1 = figure()
p1.circle(data.index, data['myDataset'])
show(p1)
मेरा ब्राउज़र स्पिन करता है और मुझे कोई प्लॉट नहीं दिखाता है। circle()
source
तर्क के रूप में एक ColumnSource
वस्तु का उपयोग कर अधिक प्रबंधनीय कुछ करने के लिए अपने डेटा downsampling
output_file()
बजायoutput_notebook()
- ग्राफ़िंग: मैं निम्नलिखित की कोशिश की है।
बोके ने अपनी वेबसाइट पर "बहुत बड़े या स्ट्रीमिंग डेटासेट पर उच्च प्रदर्शन अंतःक्रियाशीलता" प्रदान करने का दावा किया है। मैं अपने कंप्यूटर को बिना रुकावट के पीसने के इन बड़े डेटासेट को कैसे कल्पना करूं?
हैलो @ बिग्रेडडॉट क्या आप कृपया मेरा यह प्रश्न देख सकते हैं, मैं वास्तव में समाधान प्राप्त करने के लिए संघर्ष कर रहा हूं। http://stackoverflow.com/questions/36207525/how-to-generate-multiple-plots-by-clicking-a-single-plot-for-more-infomation-usi – Sandy
यह प्रश्न Matplotlib के बारे में प्रतीत होता है, इसके बारे में नहीं bokeh। मुझे डर है कि मैं Matplotlib के बारे में बहुत कुछ नहीं जानता। – bigreddot
आपके त्वरित उत्तर के लिए धन्यवाद, बोके में क्या मैं अपनी आवश्यकता प्राप्त कर सकता हूं? – Sandy