2009-10-01 9 views
6

मूल्यों की 1 डी सरणी को देखते हुए, यह पता लगाने का सबसे आसान तरीका क्या है कि यह सर्वोत्तम फिट बिमोडल वितरण क्या है, जहां प्रत्येक 'मोड' सामान्य वितरण होता है? या दूसरे शब्दों में, आप दो सामान्य वितरणों का संयोजन कैसे पा सकते हैं जो बेस्ट मूल्यों के 1 डी सरणी को पुन: उत्पन्न करते हैं?मूल्यों के एक सेट के लिए एक बिमोडल वितरण को फ़िट करना

विशेष रूप से, मुझे इसे पायथन में लागू करने में दिलचस्पी है, लेकिन उत्तरों को भाषा विशिष्ट नहीं होना चाहिए।

धन्यवाद!

उत्तर

4

जो आप करने की कोशिश कर रहे हैं उसे गॉसियन मिश्रण मॉडल कहा जाता है। इसे हल करने के लिए मानक दृष्टिकोण उम्मीद अधिकतमता का उपयोग कर रहा है, scipy svn में मशीन सीखने पर एक अनुभाग शामिल है और जिसे scikits कहा जाता है। मैं इसे एक उचित बिट का उपयोग करता हूं।

0

मैं भयानक scipy पैकेज का उपयोग करने का सुझाव देता हूं। यह अनुकूलन के लिए कुछ विधियां प्रदान करता है।

एक पूर्व वसा वाले कम से कम वर्ग फिट या उन पंक्तियों के साथ कुछ लागू करने के साथ एक बड़ी वसा चेतावनी है।

  1. शोर दूसरा/दोनों चोटियों से भी बड़ा:

    यहाँ कुछ समस्याओं को आप में चलेगा।

  2. आंशिक चोटी - आपके डेटा को सीमाओं में से एक में काटा जाता है।
  3. नमूनाकरण - चोटियों की चौड़ाई आपके नमूने वाले डेटा से छोटी है।
  4. यह सामान्य नहीं है - आप कुछ परिणाम मिल जाएगा ...
  5. ओवरलैप - अगर चोटियों ओवरलैप आप पाएंगे कि अक्सर एक शिखर सही ढंग से फिट है लेकिन दूसरे शून्य apporach होगा ...
0

मैं सिर्फ यह समझने की कोशिश कर रहा हूं कि क्यों एक को 1 डी सरणी के लिए बिमोडाल वितरण करने की आवश्यकता है? ऐसा करने के क्या फायदे हैं?

+1

उदाहरण: मान लीजिए कि मूल्य 500 महिलाओं और 500 पुरुषों के मापा छाती परिधि हैं। –

संबंधित मुद्दे