मैं कुछ कठोर सांख्यिकीय समस्या के साथ कुछ प्रतिभा एसक्यूएल सहायता की तलाश में हूं।एसक्यूएल सांख्यिकीय नमूना
जो मैं करना चाहता हूं वह उपयोगकर्ता प्रोफाइल के असंतुलित समूह से सांख्यिकीय रूप से संतुलित नमूना खींच रहा है। एक समय में एक प्रोफ़ाइल विशेषता (उदा। लिंग) के लिए ऐसा करना कुछ हद तक सरल होगा। लेकिन इसे कई आयामों में एक बार में करने के लिए कुछ परिष्कार की आवश्यकता होती है।
तर्क के लिए, मान लें कि मेरे पास यह तालिका है।
Profile.userID
Profile.Gender
Profile.Age
Profile.Income
मैं मिश्रण से बाहर प्रोफाइल की एक पूल खींचने के लिए इतना है कि उपयोगकर्ताओं के नए नमूने मोटे तौर पर निम्नलिखित विशेषताएं के सभी मेल खाता चाहते हैं:
50% male, 50% female
30% young, 40% middle age, 40% old
40% low income, 40% middle income, 20% high income
किसी को भी करने के बारे में कैसे किसी भी विचार है इसे खीचें?
क्या आपको नमूना सेट को आपके विनिर्देशों को पूरा करने तक एक बार यादृच्छिक रूप से रिकॉर्ड खींचने से रोकता है? –
मैं इसे लगातार संतुलन से कैसे दूर रखूंगा? कहो मुझे सिर्फ एक और महिला रिकॉर्ड की आवश्यकता है, लेकिन उसको खींचकर मेरी उम्र और आय संतुलन से बाहर हो जाती है ...? – tbacos
30% युवा, 40% मध्यम आयु, 40% पुराना! = 100% क्या आपकी सीमा में युवा और मध्यम आयु वर्ग के बीच एक ओवरलैप है? –