मैंने मॉडल बनाने और इसे सहेजने के लिए कोड लिखा है। यह बढ़िया काम करता है। मेरी समझ डेटा है, डिफ़ॉल्ट रूप से, 10 गुना में विभाजित है। मैं मॉडल बनाते समय डेटा को दो सेट (प्रशिक्षण और परीक्षण) में विभाजित करना चाहता हूं। वीका यूआई पर, मैं इसे "प्रतिशत विभाजन" रेडियो बटन का उपयोग करके कर सकता हूं। मैं जानना चाहता हूं कि कोड के माध्यम से इसे कैसे किया जाए। मैं इसे दो हिस्सों में विभाजित करना चाहता हूं 80% प्रशिक्षण और 20% परीक्षण है। मेरा कोड यहाँ है।जावा वीका: विभाजित प्रतिशत कैसे निर्दिष्ट करें?
FilteredClassifier model = new FilteredClassifier();
model.setFilter(new StringToWordVector());
model.setClassifier(new NaiveBayesMultinomial());
try {
model.buildClassifier(trainingSet);
} catch (Exception e1) { // TODO Auto-generated catch block
e1.printStackTrace();
}
ObjectOutputStream oos = new ObjectOutputStream(
new FileOutputStream(
"/Users/me/models/MyModel.model"));
oos.writeObject(model);
oos.flush();
oos.close();
प्रशिक्षणसेट यहां पहले से ही आबादी वाले ऑब्जेक्ट ऑब्जेक्ट है। क्या कोई इस में मेरी मदद कर सकता है?
अग्रिम धन्यवाद!
परीक्षण और अपेक्षित के रूप में काम किया। धन्यवाद! – rishi
उत्तर सही है। लेकिन उस स्थिति में, ट्रेन और परीक्षण सेट में विभाजन यादृच्छिक नहीं है। मैं डेटासेट को ट्रेन और परीक्षण परीक्षण में यादृच्छिक रूप से कैसे विभाजित कर सकता हूं? मेरा मतलब है ... यादृच्छिक रूप से डेटासेट से डेटा लेते हैं और ट्रेन और परीक्षण सेट बनाते हैं। – Ronin