2009-05-05 16 views
6

क्या आप लुसीन प्रदर्शन के लिए अनुसरण किए जाने वाले चरणों पर सुझाव दे सकते हैं। विशेष रूप से बड़े डेटा के साथ (लगभग 1 टीबी पीडीएफ फाइलों को अनुक्रमित करने के लिए)लुसीन प्रदर्शन

उत्तर

8
  1. Scaling Lucene and Solr पढ़ें।
  2. लुसीन से अपनी आवश्यकताओं को परिभाषित करें (उदाहरण के लिए: आप पीडीएफ को अनुक्रमणित कर रहे हैं - क्या आपको इसे पूरा करने के लिए पूर्ण पाठ को स्टोर करने की आवश्यकता है, या बिल्कुल नहीं?)
  3. एक छोटे पैमाने पर प्रयोग करें - अनुक्रमणिका कुछ दस्तावेज, देखें कि पुनर्प्राप्ति पर्याप्त है या नहीं।
  4. पूरी चीज को इंडेक्स करने की कोशिश करें (त्वरित अनुक्रमण के लिए पेपर की युक्तियों पर विचार करना और पुनर्प्राप्ति गति के लिए अनुक्रमण के लिए) - क्या पुनर्प्राप्ति पर्याप्त है? क्या प्रदर्शन काफी अच्छा है?
  5. Iterate।
+0

हाय उत्तर के लिए धन्यवाद। सोलर कार्यान्वयन के लिए ल्यूसीन कार्यान्वयन को परिवर्तित करना कितना मुश्किल है? –

+1

मैंने कभी कोशिश नहीं की। जो मैं सुन रहा हूं, उससे सोलर का उपयोग शुरू करना बहुत आसान है। शायद आपको एक छोटे पैमाने पर सोलर का प्रयास करना चाहिए। शायद मुझे अपनी सलाह लेनी चाहिए ... –

5

कृपया Optimizing Lucene Performance पर प्रश्नों की जांच करें। चूंकि आप बड़ी मात्रा में डेटा के साथ काम कर रहे हैं, इसलिए आपको इंडेक्स निर्माण प्रदर्शन को भी देखना होगा। improving indexing performance और search performance पर कुछ सुझाव लुसीन विकी पर उपलब्ध हैं।

संबंधित मुद्दे