मुझे संख्याओं के बड़े सेट में औसत कैसे मिल सकता है?

मेरे पास संख्याओं का एक बड़ा सेट है, शायद एकाधिक गीगाबाइट रेंज में। पहला मुद्दा यह है कि मैं इन सभी को स्मृति में संग्रहीत नहीं कर सकता। दूसरा यह है कि इनमें से किसी भी प्रयास के परिणामस्वरूप ओवरफ्लो होगा। मैं रोलिंग औसत का अधिक उपयोग करने की सोच रहा था, लेकिन इसे सटीक होना चाहिए। कोई विचार?मुझे संख्याओं के बड़े सेट में औसत कैसे मिल सकता है?

ये सभी फ़्लोटिंग पॉइंट नंबर हैं।

यह डेटाबेस से नहीं पढ़ा जाता है, यह कई स्रोतों से एकत्रित एक CSV फ़ाइल है। इसे सटीक होना चाहिए क्योंकि इसे दूसरे के हिस्सों (उदाहरण के लिए; 0.2 9 3482888929) के रूप में संग्रहीत किया जाता है और रोलिंग औसत .2 और .3

के बीच अंतर हो सकता है यह # का प्रतिनिधित्व करता है कि उपयोगकर्ताओं ने कितना समय लिया कुछ रूपों के कार्यों का जवाब देने के लिए। उदाहरण के लिए जब एक संदेशबॉक्स दिखाते हैं, तो उन्हें ठीक या रद्द करने के लिए कितना समय लगता है। डेटा मुझे सेकंड के रूप में संग्रहीत किया गया था। एक सेकंड के भाग; उदाहरण के लिए 1.2347 सेकंड। इसे मिलीसेकंड में परिवर्तित करना और मैं int, लंबे, इत्यादि को बहती हूं .. बल्कि जल्दी से। यहां तक कि अगर मैं इसे परिवर्तित नहीं करता हूं, तब भी मैं इसे जल्दी से बहता हूं। मुझे लगता है कि नीचे दिया गया एक उत्तर सही है, शायद मुझे 100% सटीक होना जरूरी नहीं है, बस एक सीपीसिफिक स्टडीडेव के अंदर एक निश्चित सीमा के भीतर देखें और मैं काफी करीब रहूंगा।

मुझे संख्याओं के बड़े सेट में औसत कैसे मिल सकता है?

उत्तर

संबंधित मुद्दे