मैं नामों और संगठनों के नामों जैसे एसएमएस के ग्रंथों के बहुत छोटे हिस्सों से उचित संज्ञाएं निकालने की कोशिश कर रहा हूं, एनएलटीके Finding Proper Nouns using NLTK WordNet के साथ उपलब्ध मूल पार्सर्स सक्षम हैं संज्ञाओं पाने के लिए लेकिन समस्या यह है कि जब हम व्यक्तिवाचक संज्ञाओं नहीं बड़े अक्षर से शुरू होने वाले मिलता है, इस तरह सुमित जैसे नामों के ग्रंथों के लिए व्यक्तिवाचक संज्ञाओं के रूप में मान्यता नहीं मिलता हैउचित संज्ञाएं (नाम और संगठन) प्राप्त करने के लिए पार्स टेक्स्ट - पायथन nltk
>>> sentence = "i spoke with sumit and rajesh and Samit about the gridlock situation last night @ around 8 pm last nite"
>>> tagged_sent = pos_tag(sentence.split())
>>> print tagged_sent
[('i', 'PRP'), ('spoke', 'VBP'), ('with', 'IN'), **('sumit', 'NN')**, ('and', 'CC'), ('rajesh', 'JJ'), ('and', 'CC'), **('Samit', 'NNP'),** ('about', 'IN'), ('the', 'DT'), ('gridlock', 'NN'), ('situation', 'NN'), ('last', 'JJ'), ('night', 'NN'), ('@', 'IN'), ('around', 'IN'), ('8', 'CD'), ('pm', 'NN'), ('last', 'JJ'), ('nite', 'NN')]
नामित इकाई पहचानकर्ता को लागू करने से पहले आप सच करने का प्रयास कर सकते हैं। –