2011-11-25 29 views
6

क्या किसी को भी कोई अनुभव है कि पायथन का उपयोग करके टेक्स्ट की भाषा कैसे निर्धारित करें? क्या इसके लिए अजगर में कोई उपलब्ध मॉड्यूल है?भाषा का पता लगाएं

मैंने पहले से ही Google ऐप (http://ajax.googleapis.com/ajax/services/language/detect) का प्रयास किया है, और यह ठीक से काम करता है लेकिन मैं इसे टेक्स्ट फ़ाइलों के लोड के लिए लंबे समय तक उपयोग नहीं कर सकता ।

उत्तर

3

मैंने कभी यह कोशिश नहीं की है, लेकिन ऐसा लगता है कि आप इसे NLTK (प्राकृतिक भाषा टूकिट) के साथ कर सकते हैं। उदाहरण के लिए यह blog post देखें।

निम्नलिखित प्रश्न का उत्तर भी प्रासंगिक हो सकता है: NLTK and language detection

0

वहाँ Language Detection API जो आप एक वेब सेवा के रूप में अजगर से उपयोग कर सकते हैं। यह जीईटी या पोस्ट के माध्यम से पाठ स्वीकार करता है और स्कोर के साथ जेएसओएन आउटपुट प्रदान करता है।

संबंधित मुद्दे