2011-12-05 15 views
5

मैं एक परियोजना पर एसओएलआर के साथ काम कर रहा हूं जहां हम समृद्ध दस्तावेजों, मुख्य रूप से एमएस वर्ड, पावरपॉइंट, एक्सेल और पीडीएफ का एक गुच्छा (~ 40k आइटम) आयात करते हैं।क्या अमीर दस्तावेज़ आयात करते समय एसओएलआर के लिए सबसे अच्छा अभ्यास schema.xml है?

वहाँ एक सबसे अच्छा अभ्यास schema.xml है और/जब ExtractingRequestHandler का उपयोग कर या solrconfig.xml SOLR में उपयोग करने के लिए?

मैं दिनांक संशोधन समय पर काम करने वाले पहलुओं को प्राप्त करने का प्रयास करने के लिए डिफ़ॉल्ट स्कीमा में बदलाव कर रहा हूं, लेकिन इसके बिना भी, मुझे लगता है कि इन फ़ाइलों को डिफ़ॉल्ट आउटपुट के दौरान कैसे होना चाहिए इसका एक अच्छा उदाहरण हो सकता है टिका से पर्याप्त है।

यदि कोई सर्वोत्तम अभ्यास schema.xml और/या solrconfig.xml जैसी कोई चीज़ नहीं है, तो मुझे अच्छे उदाहरणों में भी दिलचस्पी है, अधिमानतः मौजूदा ओपन सोर्स प्रोजेक्ट्स या यहां तक ​​कि अच्छे ब्लॉग पोस्ट से भी।

किसी भी पॉइंटर्स का स्वागत है!

उत्तर

0

पुस्तकें टेक्स्टिंग (http://www.manning.com/ingersoll/) में आपके पास निकालने के लिए कुछ संदर्भ है RequestHandler। यह पुस्तक ओपन सोर्स टूल्स जैसे सोलर, टीका या ल्यूसीन का उपयोग कर टेक्स्ट प्रोसेसिंग के बारे में है।

मैंने अध्याय 5 तक पढ़ा है और अब तक यह पुस्तक बताती है कि फ़ाइल schema.xml को संशोधित करने के लिए फ़ाइल स्कीमा.एक्सएमएल को संशोधित करके हलर कार्यक्षमता कैसे बढ़ाती है, और क्वेरी या इंडेक्सिंग में प्रोसेसिंग होती है।

+0

ठीक है, अगर आपको सर्वोत्तम प्रथाओं से संबंधित कुछ मिलता है या तो, अपना उत्तर अपडेट करना सुनिश्चित करें। धन्यवाद –

संबंधित मुद्दे