मैं 3 Langues (, अरबी फ्रेंच और अंग्रेजी) में सूचकांक दस्तावेजों के Solr उपयोग कर रहा हूँ के लिए, मैं इस fieldType का इस्तेमाल किया है:Solr अरबी
<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true"/>
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
सब कुछ अच्छा था, लेकिन अरबी भाषा में जब मैं इस डाल حقل
जैसे शब्द को खोजने का अनुरोध सोलर शब्द नहीं ढूंढता है, लेकिन जब मैंने शब्द को لقح
से बाएं से दाएं तरफ रखा है तो शब्द शब्द और वापसी परिणाम ढूंढें।
क्या मेरे पास अरबी शब्द का परिणाम हो सकता है?
मुझे किसी भी तंत्र के बारे में पता नहीं है जो सोलर में आरटीएल पाठ के क्रम को उलट सकता है। आम तौर पर, लोगों को लगता है कि वे सभी अंतर्निहित रूपों से निपटने के लिए अरबी में कुछ प्रकार के लेमैमैटिज़ेशन चाहते हैं। यूआई बनाने के लिए आप क्या उपयोग कर रहे हैं कि आप खोज शब्द टाइप कर रहे हैं? – bmargulies
मैं एक वेब पेज का उपयोग कर रहा हूं, मेरे परीक्षण में भी मैं सीधे एपीएल सोल्रज के साथ एक्लिप्स का उपयोग करता हूं। –
क्या आप पीडीएफ फाइलों से अपने पाठ को अतिरिक्त करने के किसी भी मौके से हैं? यदि ऐसा है तो Tika के साथ एक ज्ञात समस्या प्रतीत होती है: https://issues.apache.org/jira/browse/TIKA-469?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel&focusedCommentId=12995516 –