पढ़ें Queryपूर्ण पाठ खोज (Postgres) लचीला खोज बनाम
Posgres में, पूर्ण पाठ अनुक्रमण की अनुमति देता है दस्तावेजों preprocessed किया जाना है और एक सूचकांक बाद में तेजी से खोज के लिए बचा लिया। प्रीप्रोकैसिंग में शामिल हैं:
टोकन में दस्तावेज़ों को पार्स करना।
टोकन को लेक्सम में परिवर्तित करना।
खोज के लिए अनुकूलित प्रीप्रोसेस्ड दस्तावेज़ों को संग्रहीत करना।
tsvector
प्रकार पूर्ण पाठ खोज के लिए Postgres में प्रयोग किया जाता है
tsvector
प्रकार नीचे पहलुओं में text
प्रकार की तुलना में अलग है:
मामले को समाप्त करता है। ऊपरी/छोटे अक्षर पत्र समान
निकालता शब्द रोक रहे हैं (और, या, नहीं, वह उसे, और दूसरों के सैकड़ों) इन शब्दों -because
समानार्थी शब्द बदलता है और लेता पाठ खोज के लिए प्रासंगिक नहीं हैं शब्द उपजी (
elephant
->eleph
)। पूर्ण पाठ सूची में, इसमेंelephant
शब्द नहीं है लेकिनelep
शब्द है।(और चाहिए) GIST और जिन के साथ सूचीबद्ध किए जा
कस्टम वजन &
ts_rank
कैसे लचीला खोज (खोज इंजन) के साथ रैंकिंग सकते हैं पूर्ण पाठ खोज से अधिक लाभ दिया है पोस्टग्रेज़ में?
पोस्टग्रेस डेटाबेस सेटअप के अलावा, पूर्ण पाठ खोज के लिए, क्या हमें तैनाती के लिए और कुछ चाहिए? – overexchange
कोई अन्य घटक फिर से जरूरी नहीं है, इसका उपयोग करने से पहले पढ़ने और समझने के लिए काफी कुछ है .. – Jasen
हाँ मैंने यह पढ़ा [यहां] (https://github.com/shamhub/Web-app/tree/ मास्टर/Elastic_search/Full_text_search_Postgres), लेकिन मुझे लगता है कि ल्यूसीन का उपयोग करके लोचदार खोज पोस्टग्रेस टेबल के विपरीत स्कीमा कम दस्तावेज़ों का समर्थन करती है। यही है ना – overexchange