में एकाधिक शब्दों को प्रतिस्थापित करने के लिए कुशल विधि जावास्क्रिप्ट का उपयोग करके मुझे ~ 10000 शब्द दस्तावेज़ से ~ 10000 कीवर्ड कुशलतापूर्वक हटाने की आवश्यकता है, जिनमें से ~ 1000 कीवर्ड होंगे। आप किस दृष्टिकोण का सुझाव देंगे?टेक्स्ट
भारी नियमित अभिव्यक्ति व्यावहारिक हो सकती है? या क्या मुझे सिर्फ कीवर्ड वर्णों (उबाऊ) की तलाश में दस्तावेज़ वर्णों के माध्यम से पुन: प्रयास करना चाहिए?
संपादित करें:
अच्छा बिंदु - केवल पूरे शब्द, भागों नहीं। और कुछ कीवर्ड में रिक्त स्थान होते हैं।
मैं बैकएंड पर दबाव कम करने के लिए इसे सभी क्लाइंट पक्ष करने की कोशिश कर रहा हूं।
दिलचस्प सवाल। एक तरफ, एक संकलित भाषा में हस्तलिखित एक राज्य मशीन रेगेक्स से बाहर नरक को हरा देती है, लेकिन दूसरी तरफ, जावास्क्रिप्ट स्वयं धीमा है, इसलिए आपको कोशिश करने और बेंचमार्क करने की आवश्यकता होगी कि रेगेक्स इंजन संकलित होने के कारण तेज है या नहीं । –
क्या यह जावास्क्रिप्ट होना चाहिए या आप इसे सर्वर के लिए रूपांतरण के लिए धक्का दे सकते हैं? यह कहना मुश्किल है कि कुछ डेटा बिना परीक्षण के अधिक कुशल होंगे। यदि आप पाइथन का उपयोग कर रहे हैं, उदाहरण के लिए, यदि आप वास्तव में आवश्यकता है तो आप डेटा को सेगमेंट कर सकते हैं और प्रक्रिया को थ्रेड कर सकते हैं। –
क्या आपको केवल पूरे शब्द या शब्द के कुछ हिस्सों को प्रतिस्थापित करने की आवश्यकता है - उदाहरण के लिए शब्द, कीवर्ड, शब्द-स्टेम में सभी में 'शब्द' शब्द है, उनका इलाज कैसे किया जाना चाहिए? – meouw