मैं अपाचे सोलर में अरबी पीडीएफ खोजने की कोशिश कर रहा हूं। समस्या यह प्रतीत होती है कि टिकिका पीडीएफ को रिवर्स ऑर्डर (बाएं से दाएं) में (दाएं से बाएं) के बजाय अनुक्रमणित करती है।अरबी पीडीएफ के लिए सोलर
इस समस्या के बारे में यहाँ मैं पाया है संदर्भ:
- Solr for Arabic
- How to parse arabic pdf with Tika
- http://www.linnovate.net/blog/apache-solr-search-hebrew-and-probably-arabic-documents-drupal-pdf-problem-solution
हालांकि, मैं कैसे PDFBOX या के नवीनतम संस्करण को शामिल करने के लिए पता नहीं है मेरे अपाचे solr में ICU4J। मेरा Apache Solr Contrib/extraction/lib
फ़ोल्डर में pdfbox-1.6.0.jar
और icu4j-4.8.1.1.jar
शामिल हैं। उल्लिखित फाइलों को हटा देगा और उन्हें अपने प्रोजेक्ट पृष्ठों से नवीनतम पुस्तकालयों के साथ बदलकर टीआईकेए को इस्तेमाल करने के लिए मजबूर होना संतोषजनक होगा?
कृपया बताएं क्योंकि मेरे पास जावा सर्वलेट के साथ पिछले अनुभव नहीं है। धन्यवाद!