2009-11-05 16 views
11

क्या सकारात्मक संख्याओं का एक सेट यादृच्छिक रूप से उत्पन्न करने का कोई तरीका है जैसे कि उनके पास वांछित माध्य और मानक विचलन है?केवल सकारात्मक संख्याओं के साथ एक गाऊशियन वितरण उत्पन्न करना

मेरे पास एक गाऊशियन वितरण के साथ संख्याएं उत्पन्न करने के लिए एक एल्गोरिदम है, लेकिन मुझे नहीं पता कि नकारात्मक संख्याओं से निपटने के तरीके को कैसे और औसत विचलन को संरक्षित किया जाता है।
ऐसा लगता है कि एक poisson वितरण एक अच्छा अनुमान हो सकता है, लेकिन यह केवल एक मतलब लेता है।

संपादित करें: प्रतिक्रियाओं में कुछ भ्रम रहा है इसलिए मैं स्पष्टीकरण देने की कोशिश करूंगा।

मेरे पास संख्याओं का एक सेट है जो मुझे एक औसत और मानक विचलन देता है। मैं बराबर माध्य और मानक विचलन के साथ संख्याओं का समान रूप से आकार निर्धारित करना चाहता हूं। आम तौर पर, मैं ऐसा करने के लिए एक गाऊशियन वितरण का उपयोग करता हूं, हालांकि इस मामले में मेरे पास अतिरिक्त बाधा है कि सभी मान शून्य से अधिक होना चाहिए।

मैं जो एल्गोरिदम खोज रहा हूं उसे गाऊशियन-आधारित होने की आवश्यकता नहीं है (टिप्पणियों द्वारा अब तक निर्णय लेना, शायद यह नहीं होना चाहिए) और इसे परिपूर्ण होने की आवश्यकता नहीं है। इससे कोई फर्क नहीं पड़ता कि परिणामस्वरूप संख्या सेट का थोड़ा अलग मतलब/मानक विचलन है - मुझे बस ऐसा कुछ चाहिए जो आमतौर पर बॉलपार्क में होगा।

+0

यदि आप आपके पास एल्गोरिदम पोस्ट कर सकते हैं तो यह शायद मददगार होगा। – schnaader

+3

परिभाषा के अनुसार एक गाऊसी वितरण में नकारात्मक संख्या भी शामिल नहीं है, यानी कोई फर्क नहीं पड़ता कि आपका मतलब कितना बड़ा (सकारात्मक) है, बायां पूंछ हमेशा नकारात्मक अनंतता तक फैल जाएगी? – netzwerg

+0

@netzwerg: आप सही हैं। यही कारण है कि मैं एक और तरीका खोजने की कोशिश कर रहा हूं। – Whatsit

उत्तर

6

डेविड नॉर्मन ने सुझाव दिया है, या शायद exponential, binomial, या कुछ अन्य वितरण के रूप में आप लॉग-सामान्य वितरण की तलाश कर रहे हैं। यदि आपके पास एक वितरण उत्पन्न करने के लिए एल्गोरिदम है, तो संभवतया किसी अन्य वितरण के अनुरूप संख्या उत्पन्न करने के लिए यह अच्छा नहीं है। लेकिन केवल आप ही जानते हैं कि आपकी संख्या वास्तव में कैसे वितरित की जाती है।

सामान्य वितरण के साथ, यादृच्छिक चर की सीमा ऋणात्मक अनंत से सकारात्मक अनंत तक है, इसलिए यदि आप केवल सकारात्मक संख्या की तलाश में हैं, तो यह गॉसियन नहीं है।

विभिन्न वितरणों में अद्वितीय गुण भी हैं, उदाहरण के लिए, पोइसन वितरण के साथ, मानक विचलन हमेशा माध्य के बराबर होता है। (यही कारण है कि आपका लाइब्रेरी फ़ंक्शन मानक विचलन पैरामीटर से नहीं पूछता है, केवल माध्य)।

सबसे बुरे मामले में, आप 0 और 1 के बीच यादृच्छिक वास्तविक संख्या उत्पन्न कर सकते हैं और अपने आप पर संभाव्यता घनत्व फ़ंक्शन की गणना कर सकते हैं। (वितरण के आधार पर, यह करने से कहीं अधिक आसान कहा जा सकता है)।

+0

++ ऐसा करने का सबसे आसान तरीका 1) लॉग लेना प्रत्येक मूल डेटा बिंदु के, 2) इसका मतलब और सिग्मा प्राप्त करें, 3) उस शब्द और सिग्मा के साथ गाऊसी सामान्य यादृच्छिक संख्याएं उत्पन्न करें, और 4) प्रत्येक संख्या का विस्तार करें। परिणाम आपके द्वारा शुरू किए गए कार्यों के समान होना चाहिए। (गाऊशियन यादृच्छिक संख्या उत्पन्न करने के लिए, श्रेणी +/- 0.5 में 12 वर्दी यादृच्छिक संख्याओं को जोड़ना एक आसान तरीका है।) –

6

आप log-normal वितरण का उपयोग कर सकते हैं।

8

सबसे पहले, आप गॉसियन वितरण से केवल सकारात्मक मूल्य उत्पन्न नहीं कर सकते हैं।

दूसरा, क्या मैं सही ढंग से समझ रहा हूं कि आप दिए गए औसत और मानक विचलन के साथ यादृच्छिक वितरण उत्पन्न करने की कोशिश कर रहे हैं? क्या कोई वितरण करेगा? यदि हां, तो मतलब = m और मानक विचलन = s दें। मुझे लगता है कि m - s > 0

let n = random integer modulo 2; 
if n equals 0 return m - s 
else return m + s 

मूल्यों इस प्रक्रिया द्वारा दिया मतलब m और मानक विचलन s होगा।

+0

मुझे संदेह है कि आपका प्रस्ताव उसकी आवश्यकताओं को पूरा करेगा, लेकिन मुझे प्रश्न के दिलचस्प जवाब के लिए इसे +1 देना होगा। ऐसा कहा जा रहा है कि, आपके उत्तर में कोई दोष है: यदि एम <एस, आपका वितरण सकारात्मक नहीं होगा। – Mathias

+1

@ माथीस: मैंने बयान दिया "मैं मान रहा हूं कि 'एम - एस> 0'।" – jason

+0

यह एक दिलचस्प जवाब है। दुर्भाग्य से, मेरे मामले में यह हमेशा सच नहीं है कि एम> एस। मैं जेनरेट किए गए मानों में थोड़ा और बदलाव भी पसंद करूंगा, हालांकि मैंने इस सवाल में उल्लेख नहीं किया था। हालांकि, एक उपन्यास समाधान के लिए +1। – Whatsit

1

यदि मैं आपको सही ढंग से समझता हूं तो आप सकारात्मक समर्थन के साथ वितरण से यादृच्छिक संख्याएं उत्पन्न करना चाहते हैं। कई संभावित विकल्प हैं।सबसे सरल

ची-वर्ग है: http://en.wikipedia.org/wiki/Chi-square_distribution

सभी assymetric वितरण (जो सिर्फ दो Gaussians चुकता का योग है) (घातीय, वेइबुल, pareto, उलटा गाऊसी, लॉग-सामान्य, गामा)

सभी तिरछा familly से वितरण (तिरछा-सामान्य, तिरछा-छात्र, ...)

उपरोक्त सभी कार्यों ऐसा है कि किसी भी यादृच्छिक संख्या उनमें से किसी से तैयार allways सकारात्मक होगा।

4

मैं विरोध नहीं कर सका - मैं वास्तव में जेसन के कोण की तरह लेकिन खुश नहीं था कि उसकी इस सवाल का जवाब केवल मामलों में जहां मीटर> रों, तो मैं बाहर अपने विचार निम्नलिखित एक सामान्य समाधान काम को शामिल किया गया।
दिया मी, और सकारात्मक शर्तों से सबसे सरल वितरण,

संभावना पी के साथ

है लौटने के साथ 0
संभावना (1-पी), वापसी एम/(1-पी)
जहां (1 -p) = m^2/(एम^2 + रों^2)

सबूत: दो परिणामों के साथ एक वितरण एक्स lowX संभावना पी और संभाव्यता (1-पी के साथ highX), के साथ के लिए
मीटर = ई [एक्स] = पीएक्स लोएक्स + (1-पी) एक्स हाईएक्स
एस^2 = भिन्नता (एक्स) = ई [एक्स^2] - ई [X]^2 = पी एक्स lowX^2 + (1-पी) x highX^2 - 0 मीटर^2

सेट lowX और highX और पी में हल।

+0

यह सुंदर है। – jason

+0

धन्यवाद - आपके उत्तर की भावना को देखते हुए, मैंने सोचा कि आप सराहना करेंगे :) – Mathias

4

एक resampling विधि का प्रयोग क्यों नहीं? यदि आपके नमूने में n नंबर हैं, तो n नमूना से प्रतिस्थापन के साथ यादृच्छिक ड्रॉ लें। परिणामस्वरूप सेट ने आपके मूल नमूने के समान अर्थ और भिन्नता की अपेक्षा की होगी, लेकिन यह आमतौर पर थोड़ा अलग होगा।

यह कहा, यह जानकर तुम क्यों अधिक यादृच्छिक संख्या की जरूरत के बिना, यह कहना क्या सही जवाब है असंभव है। एक चमत्कार अगर आप आप किसी भी वितरण जो सकारात्मक समर्थन हासिल है और मतलब और विचरण द्वारा निर्दिष्ट किया जा सकता इस्तेमाल कर सकते हैं गलत समस्या को हल करने की कोशिश कर रहे हैं ...

+1

Resampling एक दिलचस्प सुझाव है। अपने शुरुआती वक्तव्य में, वॉटिट ने यह नहीं कहा कि उसके पास नमूना था, उसने केवल उल्लेख किया कि उसका मतलब + भिन्नता है। नमूना से मतदान न केवल माध्य और भिन्नता को दोहराएगा, यह परिभाषा के अनुसार वितरण के आकार से मेल खाएगा ... यह अच्छा विचार होगा कि व्हाट्सिट सिमुलेशन को चलाने के लिए चाहता है। – Mathias

2

। उदाहरण के लिए,

  • एक-पैरामीटर वितरण सामान्य रूप से काम नहीं करेगा। उदाहरण के लिए ची-स्क्वायर तब तक काम नहीं करेगा जब तक कि आपका अंतर हमेशा इसका मतलब न हो। इसी प्रकार घातीय कार्य तब तक काम नहीं करेगा जब तक कि आपका भिन्नता आपके औसत वर्ग के बराबर न हो।
  • कुछ मामलों में कुछ दो पैरामीटर वितरण काम नहीं करेंगे। द्विपदीय वितरण तब तक काम नहीं करेगा जब तक कि भिन्नता आपके माध्य से कम न हो। इसी प्रकार गैर-केंद्रीय ची-स्क्वायर तब तक काम नहीं करेगा जब तक कि आपका अंतर 2 गुणा से अधिक न हो और आपके मतलब से 4 गुना कम हो!
  • हालांकि लॉग-सामान्य और गामा सभी मामलों में काम करेगा।
-5

क्या हो तुम जोकर के बारे में बात कर रहे हैं? मानक सामान्य का मतलब शून्य है, लेकिन यह गॉसियन वितरण का एक विशेष मामला है, जिसमें पैरामीटर का मतलब और मानक विचलन है। जैसा कि औसत बढ़ता है, एसडी स्थिर रहता है, शून्य से नीचे की संख्या उत्पन्न करने की संभावना शून्य हो जाती है। आप बिल्कुल नकारात्मक संख्या वाले गाऊशियन वितरण कर सकते हैं।

+0

हां फिक्स्ड एसडी और बढ़ते मतलब के लिए हाँ, संभावना 0 तक पहुंचती है हालांकि यह कभी नहीं 0 है। डिज़ाइन, लॉगनोर्मल और गामा वितरण कभी नकारात्मक संख्या उत्पन्न नहीं करेंगे। –

+0

उपयोगकर्ता चाहता है कि औसत \ sd कोई नकारात्मक संख्या के साथ संरक्षित न हो, आप वक्र को स्थानांतरित नहीं कर सकते हैं। लॉग-सामान्य एक वैकल्पिक वितरण है जिसे माना जा सकता है – user425678

संबंधित मुद्दे