मैं इस ट्यूटोरियल तलाश में हूं: भाग 9, भविष्यवाणी करना https://www.dataquest.io/mission/74/getting-started-with-kaggleपाइथन में केएफल्ड वास्तव में क्या करता है?
मुझे मिल गया है। वहाँ में एक dataframe टाइटैनिक कहा जाता है, जो तब का उपयोग कर परतों में विभाजित किया गया है में कुछ डेटा है:
# Generate cross validation folds for the titanic dataset. It return the row indices corresponding to train and test.
# We set random_state to ensure we get the same splits every time we run this.
kf = KFold(titanic.shape[0], n_folds=3, random_state=1)
मैं क्या यह वास्तव में कर रहे हैं और वस्तु kf किस तरह का है यकीन नहीं है। मैंने प्रलेखन पढ़ने की कोशिश की लेकिन इससे ज्यादा मदद नहीं मिली। इसके अलावा, तीन गुना (n_folds = 3) हैं, बाद में यह केवल इस ट्रेन में ट्रेन और परीक्षण (और मुझे कैसे पता चलेगा कि उन्हें ट्रेन और परीक्षण कहा जाता है) तक पहुंच रहा है?
for train, test in kf:
मुझे यह मिल गया। जो भी n_folds है, आप अभी भी एक परीक्षण और एक प्रशिक्षण सेट के साथ खत्म हो गया है। यदि n_folds 2 है, तो आप प्रशिक्षण के लिए आधे डेटा का उपयोग करें और परीक्षण के लिए दूसरे आधे का उपयोग करें, और फिर उन्हें स्वैप करें। क्या मुझे ये ठीक तरह से समझ आ रहा है? – user
हां। आपको प्रशिक्षण के रूप में परीक्षण और शेष गुना के रूप में i'th (1 <= i <= n_fold) गुना मिल जाएगा। – qmaruf