में श्रेणी वर्गीकरण के लिए अपने स्वयं के कॉर्पस का उपयोग करना मैं एक एनटीएलके/पायथन शुरुआती हूं और वर्गीकृत प्लैनटेक्स्टकोर्पस रीडर का उपयोग करके अपना स्वयं का कॉर्पस लोड करने में कामयाब रहा हूं, लेकिन मैं वास्तव में पाठ के वर्गीकरण के लिए डेटा को कैसे प्रशिक्षित और उपयोग कर सकता हूं?पायथन एनएलटीके
>>> from nltk.corpus.reader import CategorizedPlaintextCorpusReader
>>> reader = CategorizedPlaintextCorpusReader('/ebs/category', r'.*\.txt', cat_pattern=r'(.*)\.txt')
>>> len(reader.categories())
234
देख http://stackoverflow.com/प्रश्न/29275614/का उपयोग कर-मेरी-खुद-संग्रह-बजाय के- फिल्म समीक्षा-संग्रह के लिए वर्गीकरण में nltk – alvas