2012-07-19 8 views
7

पर nltk के लिए english.pickle को कैसे स्थापित करें मैं एक एसयूएसई लिनक्स बॉक्स पर nltk चलाने की कोशिश कर रहा हूं जिसे इंटरनेट से कनेक्ट नहीं किया जा सकता है।एनल लाइन लिनक्स मशीन

मैं सफलतापूर्वक nltk स्थापित किया है और यह चलता है, लेकिन जब मैं

>>> tagged = nltk.pos_tag(tokens) 

प्रस्तुत मैं इस त्रुटि मिलती है:

LookupError:
**********************************************************************
Resource 'tokenizers/punkt/english.pickle' not found. Please use the NLTK Downloader to obtain the resource:

मैं के बाद से मैं करने के लिए बॉक्स कनेक्ट नहीं कर सकता डाउनलोडर उपयोग नहीं कर सकते इंटरनेट।

क्या कोई भी आवश्यक पैकेज इंस्टॉल कर सकता है?

उत्तर

2

डाउनलोडर फ़ाइलों को किसी विशेष फ़ोल्डर में संग्रहीत करता है। मुझे लगता है कि एक ऑनलाइन मशीन पर डाउनलोड करना संभव है और फ़ाइलों को अपनी ऑफ़लाइन मशीन पर समकक्ष स्थान पर कॉपी करना संभव है। मेरी मशीन पर, यह /usr/local/lib/nltk_data पर डाउनलोड करता है।

+0

आपके सुझाव के लिए धन्यवाद - अगर मैं विंडोज़ मशीन पर ऐसा करना चाहता हूं तो डाउनलोड की गई फाइलें लिनक्स बॉक्स पर काम करती हैं? –

+0

क्षमा करें, मैंने अभी आपकी टिप्पणी देखी है। मुझे नहीं पता, लेकिन मुझे लगता है कि डेटा क्रॉस-प्लेटफॉर्म होना चाहिए (संभवतः लाइन अंतराल के लिए)। – darkphoenix

3

डेटा nltk_data निर्देशिका पर डाउनलोड किया गया है। कि कहां है एक से दूसरे सिस्टम से अलग है, लेकिन आप निम्न कार्य करके पता कर सकते हैं:

import nltk 
print nltk.data.find('.') 

english.pickle<nltk_data>/taggers/ का एक सबफ़ोल्डर में होना चाहिए। इसे रखने का सबसे आसान तरीका एक मशीन पर डाउनलोडर का उपयोग करना है जिसमें इंटरनेट का उपयोग है, फिर इसे कॉपी करें और इसे उसी सबफ़ोल्डर में रखें। english.pickle का केवल एक संस्करण है, और आप इसे विंडोज बॉक्स पर डाउनलोड कर सकते हैं, कोई समस्या नहीं।

1

संदर्भ उद्देश्यों (2017) के रूप में के लिए, punkt tokenizers इस लिंक पर GitHub में पाए जाते हैं:

https://github.com/nltk/nltk_data/blob/gh-pages/packages/tokenizers/punkt.zip

आप एक गैर airgapped मशीन से डाउनलोड करें, और इस पर आगे बढ़ने के लिए सक्षम होना चाहिए एक फ्लैश ड्राइव।

संबंधित मुद्दे