का उपयोग कर मैं एक DataFrame जो की तरह लग रही है DataFrame नमूने के लिए:,पांडा का उपयोग करते हुए एक विशिष्ट स्तंभ का वजन
index name city
0 Yam Hadera
1 Meow Hadera
2 Don Hadera
3 Jazz Hadera
4 Bond Tel Aviv
5 James Tel Aviv
मैं पांडा बेतरतीब ढंग से मूल्यों का चयन करना चाहते city
कॉलम में उपस्थिति (का उपयोग कर की तरह की संख्या का उपयोग कर: df.city.value_counts()
), तो मेरे जादू समारोह के परिणामों, मान लीजिए:
df.magic_sample(3, weight_column='city')
लग सकता है जैसे:
0 Yam Hadera
1 Meow Hadera
2 Bond Tel Aviv
धन्यवाद! :)
धन्यवाद! आखिरकार, बड़े डेटा सेट के लिए, यह कुल मिलाकर 'N' मानों से कम (आपके उदाहरण में, एन = 3) का चयन करता है। क्या ऐसा करने का कोई तरीका है ताकि मुझे कुल मिलाकर एन मान मिले? – Infinity
@ इन्फिनिटी क्या होगा यदि आपके पास 10 पंक्तियों के साथ 10 समूह और एन = 3 थे? –
@TedPetrou टिप्पणी के रूप में, यह नमूना पद्धति हमेशा काम नहीं कर सकती है क्योंकि आप केवल समूह से पंक्तियों की पूर्णांक संख्या का नमूना दे सकते हैं, लेकिन * वजन * पंक्तियों की कुल संख्या * आंशिक हो सकती है। – Psidom