जो टैग आप देखते हैं वे भाग का परिणाम नहीं हैं लेकिन पीओएस टैगिंग जो चंकिंग से पहले होती है। यह पेन Treebank tagset है, https://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html
>>> from nltk import word_tokenize, pos_tag, ne_chunk
>>> sent = "This is a Foo Bar sentence."
# POS tag.
>>> nltk.pos_tag(word_tokenize(sent))
[('This', 'DT'), ('is', 'VBZ'), ('a', 'DT'), ('Foo', 'NNP'), ('Bar', 'NNP'), ('sentence', 'NN'), ('.', '.')]
>>> tagged_sent = nltk.pos_tag(word_tokenize(sent))
# Chunk.
>>> ne_chunk(tagged_sent)
Tree('S', [('This', 'DT'), ('is', 'VBZ'), ('a', 'DT'), Tree('ORGANIZATION', [('Foo', 'NNP'), ('Bar', 'NNP')]), ('sentence', 'NN'), ('.', '.')])
हिस्सा chunked आउटपुट भीतर उपतरू के लिए देखो प्राप्त करने के लिए देखते हैं। उपरोक्त आउटपुट से, Tree('ORGANIZATION', [('Foo', 'NNP'), ('Bar', 'NNP')])
खंड को इंगित करता है।
यह ट्यूटोरियल साइट एनएलटीके, http://www.eecis.udel.edu/~trnka/CISC889-11S/lectures/dongqing-chunking.pdf में खंडन प्रक्रिया को समझाने में बहुत उपयोगी है।
आधिकारिक दस्तावेज के लिए, http://www.nltk.org/howto/chunk.html