मैं यह जांचने का एक आसान तरीका ढूंढ रहा हूं कि कोई निश्चित स्ट्रिंग एक सही वर्तनी वाला अंग्रेजी शब्द है या नहीं। उदाहरण के लिए, 'देखा' सच हो जाएगा जबकि 'hurrr' झूठा वापस आ जाएगा। मुझे वर्तनी सुझाव या किसी भी वर्तनी-सुधार सुविधाओं की आवश्यकता नहीं है। बस एक साधारण फ़ंक्शन जो स्ट्रिंग लेता है और एक बूलियन मान देता है। यह ऐसा करने कापायथन: जांचें कि कोई शब्द सही वर्तनी है या नहीं
उत्तर
दो संभव तरीके:
- सभी वैध शब्द है जो अपनी खुद की फ़ाइल है। एक सेट में फ़ाइल लोड और देखने के लिए कि क्या यह उस में मौजूद है (सेट में शब्द)
- (बेहतर तरीका) PyEnchant, एक वर्तनी जांच पुस्तकालय का उपयोग करें अजगर के लिए
याहू जादू प्रदान करता है प्रत्येक शब्द की तुलना YQL के माध्यम से API की जांच।
इसका बहुत सरल और आप 5000 प्रश्नों के लिए/आईपी पते/गैर वाणिज्यिक उपयोग के लिए दिन (फ्री)
मैं एक ही कार्यक्षमता के लिए देख रहा था और जो Windows में काम करता है एक मौजूदा पुस्तकालय को खोजने के लिए संघर्ष किया, 64 बिट । PyEnchant, हालांकि एक महान पुस्तकालय, वर्तमान में सक्रिय नहीं है और 64 बिट में काम नहीं करता है। मैंने पाया कि अन्य पुस्तकालय विंडोज में काम नहीं किया था।
मुझे अंततः एक समाधान मिला जो मुझे आशा है कि दूसरों को मूल्यवान मिलेगा।
समाधान ...
- उपयोग nltk
- से
- एक सेट में कनवर्ट nltk.corpus.brown शब्द सूची शब्द सूची निकालें (कुशल खोज के लिए)
- उपयोग
in
कीवर्ड निर्धारित करें कि आपका स्ट्रिंग सेट
में है
from nltk.corpus import brown
word_list = brown.words()
word_set = set(word_list)
# Check if word is in set
"looked" in word_set # Returns True
"hurrr" in word_set # Returns False
टाइमर चेक का उपयोग करें और आप देखेंगे कि सेट को खोजने के लिए लगभग कोई समय नहीं लगता है। 1,000 शब्दों पर एक परीक्षण ने 0.004 सेकंड लिया।
मैं व्यक्तिगत रूप से इस्तेमाल किया: http://textblob.readthedocs.io/en/dev/ यह एक सक्रिय परियोजना है और वेबसाइट के अनुसार:
वर्तनी सुधार पीटर Norvig के पर आधारित है "कैसे एक वर्तनी पढ़नेवाला लिखें" [1] पैटर्न पुस्तकालय में लागू किया। यह लगभग 70% सटीक
- 1. jquery कैसे जांचें कि यूआरएल में शब्द है या नहीं?
- 2. पायथन: जांचें कि कोई ऑब्जेक्ट अनुक्रम है
- 3. यह कैसे जांचें कि दिया गया शब्द बहुवचन या एकवचन रूप में है या नहीं?
- 4. जावास्क्रिप्ट - जांचें कि क्या div में कोई शब्द है?
- 5. कैसे जांचें कि वर्तमान समय पायथन में है या नहीं?
- 6. जांचें कि कोई प्रोग्राम एक पायथन लिपि
- 7. एएस 3: जांचें कि कोई शब्दकोश खाली है या नहीं
- 8. जांचें कि कोई पंक्ति मौजूद है या नहीं postgresql
- 9. यह कैसे जांचें कि कोई सूचक मान्य है या नहीं?
- 10. जांचें कि कोई चर mysqli ऑब्जेक्ट प्रकार है या नहीं?
- 11. जांचें कि कोई PHP सत्र खाली है या नहीं?
- 12. जांचें कि कोई शीट खुली है या नहीं
- 13. जांचें कि ईवेंट में कोई श्रोताओं है या नहीं?
- 14. जांचें कि रेल में कोई लेआउट मौजूद है या नहीं?
- 15. कैसे जांचें कि कोई std :: स्ट्रिंग सेट है या नहीं?
- 16. कैसे जांचें कि कोई ऑब्जेक्ट कल बराबर है या नहीं?
- 17. jQuery जांचें कि कोई इनपुट प्रकार चेकबॉक्स है या नहीं?
- 18. जांचें कि किसी फॉर्म में कोई कुंजी है या नहीं?
- 19. जांचें कि कोई पैरामीटर पाइथन मॉड्यूल है या नहीं?
- 20. कैसे जांचें कि कोई थ्रेड सो रहा है या नहीं?
- 21. कैसे जांचें कि कोई संपत्ति मौजूद है या नहीं?
- 22. जांचें कि स्ट्रिंग सामग्री में कोई HTML है या नहीं?
- 23. जांचें कि कोई कॉलम शून्य नहीं है
- 24. जांचें कि फ़ाइल मौजूद है या नहीं,
- 25. जांचें कि सॉकेट कनेक्ट है या नहीं
- 26. कैसे जांचें कि कोई अद्यतन mysqli क्वेरी सही तरीके से निष्पादित की गई है या नहीं?
- 27. नींद और जांचें जब तक कि स्थिति सही नहीं है
- 28. जांचें कि कोई सूची है
- 29. कैसे जांचें कि सरणी खाली नहीं है या नहीं?
- 30. जांचें कि क्या mmap'ed पता सही है
धन्यवाद, यह वही है जो मैंने उत्तर देने के दौरान किया था;) – Nikolai
किसी सूची के बजाय सेट का उपयोग करें, और बेहतर प्रदर्शन के लिए 'my_set' में शब्द पूछें। –
@ करल: वास्तव में एक बहुत ही वैध बिंदु, सूचियों की तुलना में सेट महत्वपूर्ण रूप से तेज़ होते हैं जब यह निर्धारित करने की बात आती है कि कोई ऑब्जेक्ट सेट में मौजूद है या नहीं। अपडेट किया गया। – user225312