मेरे पास जावा आधारित एप्लिकेशन और एक MySQL डेटाबेस में कीवर्ड का एक सेट है (कुल 3 एम कीवर्ड में, उनमें से प्रत्येक में एक से अधिक शब्द शामिल हो सकते हैं, उदाहरण के लिए यह हो सकता है: "स्मृति", " पुराना घर "," यूरोपीय संघ कानून ", आदि)।जावा में एकाधिक कीवर्ड खोज
उपयोगकर्ता मनमाने ढंग से पाठ (कई बार कई पेज) के साथ एक दस्तावेज़ अपलोड करके आवेदन के साथ बातचीत करता है। मैं क्या करना चाहता हूं यह जानने के लिए कि दस्तावेज़ में कहां और कहां से 3 मिलियन कीवर्ड दिखाई देते हैं।
मैंने लूप का उपयोग करने और प्रत्येक कीवर्ड के लिए दस्तावेज़ खोजने का प्रयास किया है लेकिन यह बिल्कुल कुशल नहीं है। मुझे आश्चर्य है कि खोज करने के लिए लाइब्रेरी है और अधिक कुशल तरीके से।
मैं किसी भी मदद की सराहना करता हूं।
कीवर्ड के बगल में कॉलम में प्रत्येक कीवर्ड के लिए स्टोर हैश के बारे में और प्रत्येक शब्द को प्रत्येक शब्द की जांच करने के दौरान, कीवर्ड से कीवर्ड का चयन करें, जहां कीवर्ड_शैश = गणना हैश (शब्द टोच चेक) '? – rzysia
आपको क्या विचार करने की आवश्यकता है वह सबसे छोटा रास्ता होगा। अपलोड किए गए दस्तावेज़ से 3 मिलियन खोजें, या एन वाक्यांशों का निर्माण करना। दस्तावेज खोजने के लिए सभी 3 एम कीवर्ड की खोज बनाने के लिए एक समाधान हो सकता है। लुसेनेस कीवर्ड हाइलाइटर का उपयोग करें और 3 एम कीवर्ड के साथ सभी हाइलाइट किए गए शब्दों से मेल करें;) –
क्या हाइलाइटर में पाठ के समान निकाले गए हिस्से में बहु कीवर्ड परिणाम प्राप्त करने का कोई तरीका है? या इससे भी बेहतर कोई संरचना है जो फ़ाइल के भीतर पाए गए मिलान किए गए कीवर्ड की सूची वापस कर सकती है? –