2012-11-27 21 views
6

मैं अपाचे सोलर में अरबी पीडीएफ खोजने की कोशिश कर रहा हूं। समस्या यह प्रतीत होती है कि टिकिका पीडीएफ को रिवर्स ऑर्डर (बाएं से दाएं) में (दाएं से बाएं) के बजाय अनुक्रमणित करती है।अरबी पीडीएफ के लिए सोलर

इस समस्या के बारे में यहाँ मैं पाया है संदर्भ:

हालांकि, मैं कैसे PDFBOX या के नवीनतम संस्करण को शामिल करने के लिए पता नहीं है मेरे अपाचे solr में ICU4J। मेरा Apache Solr Contrib/extraction/lib फ़ोल्डर में pdfbox-1.6.0.jar और icu4j-4.8.1.1.jar शामिल हैं। उल्लिखित फाइलों को हटा देगा और उन्हें अपने प्रोजेक्ट पृष्ठों से नवीनतम पुस्तकालयों के साथ बदलकर टीआईकेए को इस्तेमाल करने के लिए मजबूर होना संतोषजनक होगा?

कृपया बताएं क्योंकि मेरे पास जावा सर्वलेट के साथ पिछले अनुभव नहीं है। धन्यवाद!

उत्तर

0

आपके प्रश्न के टैग से मुझे लगता है कि आप Apache Solr को इंटरफ़ेस करने के लिए ड्रूपल का उपयोग कर रहे हैं। जब आप इसे द्विआधारी दस्तावेज भेजते हैं तो आप सोलर के भीतर से चल सकते हैं या आप दस्तावेजों को सोलर भेजने से पहले इसका इस्तेमाल कर सकते हैं। ड्रूपल सोलर अटैचमेंट मॉड्यूल में "टिक (स्थानीय जावा एप्लिकेशन)" की सेटिंग है। आपके द्वारा प्रदान किए गए दूसरे लिंक में उन्होंने सोलर को भेजने से पहले बाइनरी फ़ाइलों को पार्स करने के लिए टिका के बजाय पीडीएफबॉक्स का उपयोग करने के लिए सोलर अटैचमेंट मॉड्यूल को पैच किया। यदि आप Drupal का उपयोग नहीं कर रहे हैं तो आपको एक समान दृष्टिकोण का प्रयास करना चाहिए।