मैं SQL सर्वर 2008 पूर्ण पाठ खोज इंजन का उपयोग कर ज्ञान आधार प्रोजेक्ट पर काम कर रहा हूं। प्रोजेक्ट उन लेखों और फ़ाइलों में शामिल है जहां प्रत्येक आलेख में एकाधिक फाइलें होती हैं। उन लेखों में पूरी सामग्री शुद्ध HTML है।एसक्यूएल सर्वर 2008 में एचटीएमएल टैग को अनदेखा कैसे करें पूर्ण पाठ खोज
अभी, मैंने सफलतापूर्वक SQL सर्वर 2008 पर पूर्ण टेक्स्ट कैटलॉग और अनुक्रमणिका बनाई है और मेरा डेटाबेस संस्करण 10 संगत है। जबकि इन लेखों में खोज,
1) html टैग की अनदेखी करने के क्या यह संभव है, और अधिक स्पष्ट रूप में "< ...>" युक्त ग्रंथों, क्योंकि अगर मैं div के लिए खोज करना चाहते हैं:
यहाँ मेरी सवाल कर रहे हैं , टेबल इत्यादि का कोई परिणाम नहीं लौटाया जाना चाहिए?
2) लेख किसी भी समय अपडेट किए जाएंगे, इसलिए जब कोई नया रिकॉर्ड डाला जाता है तो पूर्ण टेक्स्ट इंडेक्स को अपडेट किया जाना चाहिए। क्या पूर्ण टेक्स्ट कैटलॉग बनाते समय केवल "ट्रैक चेंज ऑटोमेटिक" सेट करना पर्याप्त है?
3) हम इसके बाद FILESTREAM सुविधा का उपयोग कर सकते हैं, क्या SQL Server 2008 पूर्ण पाठ अनुक्रमणिका का उपयोग कर फ़ाइलों पर अच्छा प्रदर्शन करता है? एसक्यूएल सर्वर 2008 इंडेक्सिंग पर क्या विशिष्ट दस्तावेज़ प्रकार अच्छा है?
सादर
हाय दोस्त, मुझे लगता है कि सबसे अच्छा समाधान रेगुलर एक्सप्रेशन "<(.|\n)*?>" एक SQL CLR विधानसभा चेक के साथ साथ एचटीएमएल को बदलने के लिए है यह लिंक http://justgeeks.blogspot.com/2008/08/adding-regular-expressions-regex-to-sql.html –