2010-11-28 21 views
5

के लिए पूर्ण पाठ खोज इंजन मैं पाइथन पूर्ण पाठ खोज इंजन की तलाश में हूं।पायथन

मैंने पायलुकेंस पर एक नज़र डाली, लेकिन मुझे लगता है कि एक पायथन परियोजना में जावा-आधारित लाइब्रेरी का उपयोग करना अच्छा नहीं है। जैसा कि मैं समझता हूं, स्फिंक्स में पाइथन एपीआई नहीं है।

कोई विचार?

उत्तर

6

क्या आपने Whoosh पर देखा है? यह शुद्ध पायथन है।

+2

बस सोचा कि मैं इसका जिक्र करूँगा..मैंने हाल ही में 1.5 मिलियन पंक्तियों के इनपुट डेटा को अनुक्रमित करने की कोशिश की है ... जबकि जोश स्थापित करने और चलाने के लिए बहुत आसान था .. यह मेरे लिए एक छोटी अनुक्रमणिका के लिए पर्याप्त तेज़ काम करता था और धीमा था मेरे सूचकांक आकार के लिए: 15 सेकंड में 1000 खोज परिणाम .. यह एक छोटे सूचकांक आकार – Abhi

4

"स्फिंक्स एक अजगर एपीआई नहीं है" सच नहीं है। रिलीज डाउनलोड करें और sphinx/api/sphinxapi.py

मैं इसे स्वयं उपयोग करता हूं और मैं इसके साथ बहुत खुश हूं। दस्तावेज केवल PHP के लिए है, लेकिन पायथन एपीआई सभी कार्यों के लिए समान नामों का उपयोग करता है।

2

मैं जोश की सिफारिश करूंगा। आप आसानी से स्थापित कर सकते हैं यानी easy_install हूँश यह एक साफ एपीआई भी

2

Apache Solr Lucene-आधारित है और इसलिए आप कोई मंच लॉक-इन या भाषा मुद्दे हैं इसकी खोज कार्यों के लिए एक बाकी/HTTP इंटरफ़ेस प्रदान करता है। आईएमओ यह अब तक के सबसे अच्छे सर्च सर्वर से अधिक सुविधाओं के साथ है जो आप कभी भी चाहते हैं और सक्रिय समुदाय को इसका समर्थन करने के लिए कर सकते हैं।

+0

के लिए अच्छा हो सकता है मैं एक पाइथन लड़का हूं और यहां तक ​​कि एक पायथन SQLite wrapper (एपीएसडब्ल्यू) बनाए रखता हूं। कुछ काम सामग्री के लिए मैं सोलर का भी उपयोग करता हूं। कॉन्फ़िगरेशन एक पिटा है लेकिन खोज परिणाम शानदार हैं। आप उन्हें जेएसओएन के रूप में वापस ले सकते हैं जो जीवन को आसान बनाता है। आपको एक्सएमएल के माध्यम से सामग्री बनाना है जो परेशान है। SQLite का FTS3 भी अच्छा है लेकिन कहीं भी लचीला के करीब नहीं है। उदाहरण के लिए स्टेमिंग और मेटाफोन एसओएलआर के साथ तुच्छ हैं लेकिन एफटीएस 3 के साथ बहुत मुश्किल है। –

1

क्या आपने स्क्लाइट की FTS सुविधाओं का प्रयास किया है? आपने स्क्लाइट टैग का उपयोग किया लेकिन मुझे आपके प्रश्न में स्क्लाइट का कोई उल्लेख नहीं है।

+0

नहीं मैंने इसे आजमाया नहीं। SQLAlchemy SQLite खोज का समर्थन नहीं करता था, और मैं प्लेट एसक्यूएल-सिंटैक्स का उपयोग नहीं करना चाहता। – uhbif19

2

विशेष रूप से पूर्ण पाठ खोज के लिए, सौर एक उत्कृष्ट विकल्प है। आपको अधिक व्यापक रूप से उपयोग और अधिक खुली पसंद खोजने में कठिनाई होगी। हम आपकी कंपनी में सोलर/लुसेन का उपयोग PHP वेब एप्लिकेशन के साथ क्लाइंट और HTTP/REST API के साथ करते हैं ताकि आप इंडेक्स से पूछ सकें। इसमें एक मूल PHP क्लाइंट के रूप में अधिक कार्यक्षमता होगी और बॉक्स से अधिक लचीलापन होगा। आप आरईएसटी एपीआई का उपयोग करके आप सभी को चुनने वाले किसी भी प्रश्न/फ़िल्टर को निष्पादित कर सकते हैं। लेकिन, उन सभी के शीर्ष पर, आपको एक बेहद निष्पादक और व्यापक रूप से उपयोग की जाने वाली खोज प्रणाली मिलती है जिसमें अंतर्निहित प्रतिकृति होती है जिसे लगातार सुधार किया जा रहा है। अपने प्रारंभिक बिंदु के रूप में सोलर 1.4.x की सशक्त रूप से अनुशंसा करें।