समस्या: तारों की एक बड़ी स्थिर सूची प्रदान की जाती है। एक पैटर्न स्ट्रिंग जिसमें डेटा और वाइल्डकार्ड तत्व शामिल हैं (* और?)। विचार पैटर्न से मेल खाने वाले सभी तारों को वापस करना है - काफी सरल।कुशल द्रव्यमान खोज समस्या
वर्तमान समाधान: मैं वर्तमान में बड़ी सूची स्कैन करने और पैटर्न के खिलाफ प्रत्येक प्रविष्टि को ग्लोबिंग करने के रैखिक दृष्टिकोण का उपयोग कर रहा हूं।
मेरा प्रश्न: क्या कोई उपयुक्त डेटा संरचनाएं हैं जो मैं बड़ी सूची को स्टोर कर सकता हूं ताकि खोज की जटिलता ओ (एन) से कम हो?
शायद प्रत्यय-त्रि के समान कुछ? मैंने एक हैशटेबल में द्वि-और त्रि-ग्राम का उपयोग करने पर भी विचार किया है, लेकिन लौटने वाले शब्दों की सूची के विलय के आधार पर एक मैच का मूल्यांकन करने के लिए आवश्यक तर्क और पैटर्न एक दुःस्वप्न है, इसके अलावा मैं इसे सही नहीं मानता दृष्टिकोण।
क्या शब्दों से बना तार हैं, और पैटर्न शब्द आधारित हैं? यदि हां, तो ऐसी कई जानकारी-पुनर्प्राप्ति तकनीकें हैं जिनका उपयोग आप खोज को तेज करने के लिए कर सकते हैं - यदि आप प्रारंभ में अनुक्रमित करने की ओ (एन) लागत के लिए भुगतान करते हैं। सबसे अच्छा हिस्सा यह है कि इसके लिए बहुत सारी पुस्तकालय हैं। – tucuxi
* ,? तत्व जंगली (कार्ड) के रूप में, कोष्ठक लेते हैं? – tucuxi