2017-04-14 10 views
6

मैं निम्न आदेशअजगर ntlk donwload पार्सर eror

import nltk 
nltk.download('all') 

को चलाने के लिए कोशिश कर रहा हूँ लेकिन मैं इस त्रुटि

Traceback (most recent call last): 
    File "./update.py", line 3, in <module> 
    nltk.download('all') 
    File "/usr/lib/python3.6/site-packages/nltk/downloader.py", line 664, in download 
    for msg in self.incr_download(info_or_id, download_dir, force): 
    File "/usr/lib/python3.6/site-packages/nltk/downloader.py", line 534, in incr_download 
    try: info = self._info_or_id(info_or_id) 
    File "/usr/lib/python3.6/site-packages/nltk/downloader.py", line 508, in _info_or_id 
    return self.info(info_or_id) 
    File "/usr/lib/python3.6/site-packages/nltk/downloader.py", line 875, in info 
    self._update_index() 
    File "/usr/lib/python3.6/site-packages/nltk/downloader.py", line 825, in _update_index 
    ElementTree.parse(compat.urlopen(self._url)).getroot()) 
    File "/usr/lib/python3.6/xml/etree/ElementTree.py", line 1196, in parse 
    tree.parse(source, parser) 
    File "/usr/lib/python3.6/xml/etree/ElementTree.py", line 597, in parse 
    self._root = parser._parse_whole(source) 
xml.etree.ElementTree.ParseError: not well-formed (invalid token): line 23, column 143 

मैं अजगर को नया हूँ हो रही है देता है, तो मैं सच में यकीन नहीं है क्या क्या मुझे करना चाहिए। मैंने उपरोक्त रिपोर्ट किए गए स्रोत मॉड्यूल में देखा और देखा कि यह xml फ़ाइल डाउनलोड करने का प्रयास कर रहा है। तो मैंने नीचे दिया गया आदेश चलाया और मुझे कोई त्रुटि नहीं दी।

compat.urlopen('https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml') 

तो मुझे लगता है कि डाउनलोड में कोई समस्या नहीं है, लेकिन पार्सर में। क्या कोई सुझाव दे सकता है कि मैं यहां से कैसे आगे बढ़ूं?

+0

ही यहाँ समस्या – Bart

+0

मैं भी मिला इस समस्या –

+0

हो रहा शुरू कर दिया कुछ ही घंटों पहले मेरे साथ – silentser

उत्तर

1

समस्या एक्सएमएल के साथ है जो एनएलटीके वापस आ गया है।

xml.etree.ElementTree.ParseError: not well-formed (invalid token): line 23, column 143 

23 पर: 143 हम इस समस्या को देखते हैं, एक लापता '=':

... unzip="1" unzipped_size"1917" url="https... 

NTLK निश्चित रूप से जल्द ही ठीक कर देंगे, जब तक तो मुझे यकीन है कि क्या सबसे अच्छा जवाब है नहीं कर रहा हूँ।

6

index.xml में एक टाइपो था। यह पहले से ही पैच किया गया है। बस चेक किया गया और nltk.download('all') ठीक काम करता है!

देखें: nltk/nltk_data#70

+0

हाँ यह अब ठीक काम करता है .. धन्यवाद – user3602300

संबंधित मुद्दे