मैं पुस्तकें वस्तुओं का एक सेट, classs बुक निम्नलिखित के रूप में परिभाषित किया गया है है:जावा पाठ वर्गीकरण समस्या
Class Book{
String title;
ArrayList<tags> taglist;
}
कहाँ शीर्षक पुस्तक का शीर्षक है, उदाहरण के लिए: dummies के लिए जावास्क्रिप्ट। , जावास्क्रिप्ट, jQuery, "वेब देव" ..
जैसा कि मैंने कहा एक अलग चीजों के बारे में बात कर रहे पुस्तकों के एक सेट है::
और taglist हमारे उदाहरण के लिए टैग की एक सूची है आईटी,
आईटी किताबें:
जीव विज्ञान, इतिहास, ... प्रत्येक पुस्तक में शीर्षक और यह वर्णन टैग का एक सेट ..मैं automaticaly विषय के आधार पर अलग सेट, उदाहरण में उन पुस्तकों को वर्गीकृत करने के लिए है है
- नौसिखियों के लिए जावा
- नौसिखियों के लिए जावास्क्रिप्ट
- जानें 30 दिनों में फ्लैश
- सी ++ प्रोग्रामिंग
इतिहास की पुस्तकों:
- विश्व युद्ध
- 1960 में अमेरिका
- मार्टिन लूथर किंग के जीवन
बायोलॉजी किताबें:
- ....
तुम लोग एक वर्गीकरण एल्गोरिथ्म/विधि समस्याओं उस तरह के लिए आवेदन करने को जानते हो?
एक समाधान पाठ की श्रेणी को परिभाषित करने के लिए एक बाहरी एपीआई का उपयोग करने के लिए है, लेकिन समस्या यह है कि यहाँ किताबें अलग अलग भाषाओं में हैं: फ्रेंच, स्पेनिश, अंग्रेजी ..
हाँ, पर वहाँ किताबों के बीच कुछ सामान्य टैग हैं :( – Youssef
संबंधित प्रश्न: http://stackoverflow.com/questions/2781752/naive-bayesian-for-topic-detection-using-bag-of-words-approach/2783356#2783356 – dmcer
अच्छा धन्यवाद (वाई) – Youssef