मैंने अभी अपना पहला एनएलटीके प्रोजेक्ट शुरू किया और उचित सेटअप के बारे में उलझन में हूं। मुझे पंकट टोकनाइज़र और अधिकतम पॉज़ टैगर जैसे कई संसाधनों की आवश्यकता है। मैंने स्वयं उन्हें GUI nltk.download()
का उपयोग करके डाउनलोड किया। मेरे सहयोगियों के लिए मैं निश्चित रूप से चाहता हूं कि यह चीजें स्वचालित रूप से डाउनलोड हो जाएं। मुझे डॉकू में इसके लिए कोई बेवकूफ कोड नहीं मिला है।मैं कैसे जांच करूं कि एक एनएलटीके संसाधन पहले से ही मेरे कोड को चलाने वाली मशीन पर स्थापित है या नहीं?
क्या मुझे बस nltk.data.load('tokenizers/punkt/english.pickle')
और कोड में शामिल करना चाहिए? क्या यह स्क्रिप्ट चलाने पर हर बार संसाधन डाउनलोड करने जा रहा है? क्या मैं उपयोगकर्ता को (यानी मेरे सह-डेवलपर्स) को फीडबैक प्रदान करने के लिए डाउनलोड कर रहा हूं और यह इतना समय क्यों ले रहा है? नौकरी करने के लिए वहाँ गियर होना चाहिए, है ना? :)
// संपादित करें मेरे सवाल explify करने के लिए:
मैं कैसे परीक्षण करते हैं (पंक्ट Tokenizer) की तरह एक nltk संसाधन पहले से ही मेरे कोड चल मशीन पर स्थापित है या नहीं, और अगर यह नहीं है इसे स्थापित?
मुझे यह निर्धारित करने में समस्या हो रही है कि आप क्या पूछ रहे हैं। आपके वर्तमान दृष्टिकोण का प्रदर्शन करने वाला एक संक्षिप्त, टेस्टेबल कोड उदाहरण बहुत उपयोगी होगा। –
मुझे प्रश्न को रेफ्रेम करने दें: मैं कैसे जांच करूं कि एक nltk संसाधन (जैसे Punkt Tokenizer) पहले से ही मेरे कोड को चलाने वाली मशीन पर स्थापित है या नहीं, और यदि यह नहीं है तो इसे इंस्टॉल करें? – Zakum
अपनी टिप्पणी से मेल खाने के लिए अपने प्रश्न को संपादित करें। टिप्पणियों में संक्षिप्त प्रश्न डालने से इसे '.zip' एक्सटेंशन के बिना – Spaceghost