क्या अमीर दस्तावेज़ आयात करते समय एसओएलआर के लिए सबसे अच्छा अभ्यास schema.xml है?

मैं एक परियोजना पर एसओएलआर के साथ काम कर रहा हूं जहां हम समृद्ध दस्तावेजों, मुख्य रूप से एमएस वर्ड, पावरपॉइंट, एक्सेल और पीडीएफ का एक गुच्छा (~ 40k आइटम) आयात करते हैं।क्या अमीर दस्तावेज़ आयात करते समय एसओएलआर के लिए सबसे अच्छा अभ्यास schema.xml है?

वहाँ एक सबसे अच्छा अभ्यास schema.xml है और/जब ExtractingRequestHandler का उपयोग कर या solrconfig.xml SOLR में उपयोग करने के लिए?

मैं दिनांक संशोधन समय पर काम करने वाले पहलुओं को प्राप्त करने का प्रयास करने के लिए डिफ़ॉल्ट स्कीमा में बदलाव कर रहा हूं, लेकिन इसके बिना भी, मुझे लगता है कि इन फ़ाइलों को डिफ़ॉल्ट आउटपुट के दौरान कैसे होना चाहिए इसका एक अच्छा उदाहरण हो सकता है टिका से पर्याप्त है।

यदि कोई सर्वोत्तम अभ्यास schema.xml और/या solrconfig.xml जैसी कोई चीज़ नहीं है, तो मुझे अच्छे उदाहरणों में भी दिलचस्पी है, अधिमानतः मौजूदा ओपन सोर्स प्रोजेक्ट्स या यहां तक कि अच्छे ब्लॉग पोस्ट से भी।

किसी भी पॉइंटर्स का स्वागत है!

स्रोत

2011-12-05 Pål Brattberg

पुस्तकें टेक्स्टिंग (http://www.manning.com/ingersoll/) में आपके पास निकालने के लिए कुछ संदर्भ है RequestHandler। यह पुस्तक ओपन सोर्स टूल्स जैसे सोलर, टीका या ल्यूसीन का उपयोग कर टेक्स्ट प्रोसेसिंग के बारे में है।

मैंने अध्याय 5 तक पढ़ा है और अब तक यह पुस्तक बताती है कि फ़ाइल schema.xml को संशोधित करने के लिए फ़ाइल स्कीमा.एक्सएमएल को संशोधित करके हलर कार्यक्षमता कैसे बढ़ाती है, और क्वेरी या इंडेक्सिंग में प्रोसेसिंग होती है।

स्रोत

2011-12-09 14:04:25 josegil

ठीक है, अगर आपको सर्वोत्तम प्रथाओं से संबंधित कुछ मिलता है या तो, अपना उत्तर अपडेट करना सुनिश्चित करें। धन्यवाद –

क्या अमीर दस्तावेज़ आयात करते समय एसओएलआर के लिए सबसे अच्छा अभ्यास schema.xml है?

उत्तर

संबंधित मुद्दे