मैं यह है कि जब मैं अपने कस्टम विश्लेषक के साथ एक क्षेत्र का विश्लेषण किया यह termvector के लिए अमान्य ऑफसेट दे देंगे, लेकिन यह मानक विश्लेषक के साथ ठीक है Lucene termvector ऑफसेट के बारे में एक समस्या है, यहाँ मेरी विश्लेषक कोड हैजावा ल्यूसीन कस्टम विश्लेषक और टोकनेज़र टर्मवेक्टर ऑफसेट में समस्या पैदा कर रहे हैं?
public class AttachmentNameAnalyzer extends Analyzer {
private boolean stemmTokens;
private String name;
public AttachmentNameAnalyzer(boolean stemmTokens, String name) {
super();
this.stemmTokens = stemmTokens;
this.name = name;
}
@Override
public TokenStream tokenStream(String fieldName, Reader reader) {
TokenStream stream = new AttachmentNameTokenizer(reader);
if (stemmTokens)
stream = new SnowballFilter(stream, name);
return stream;
}
@Override
public TokenStream reusableTokenStream(String fieldName, Reader reader) throws IOException {
TokenStream stream = (TokenStream) getPreviousTokenStream();
if (stream == null) {
stream = new AttachmentNameTokenizer(reader);
if (stemmTokens)
stream = new SnowballFilter(stream, name);
setPreviousTokenStream(stream);
} else if (stream instanceof Tokenizer) {
((Tokenizer) stream).reset(reader);
}
return stream;
}
}
इस "सहायता आवश्यक" के साथ क्या गलत है
चूंकि यह कोड टर्म ऑफसेट से संबंधित कुछ भी नहीं करता है, तो आपको ऐसा करना चाहिए जो आपको करता है। जैसे आपका अटैचमेंटनाम टॉकटाइज़र? – Earwin
ठीक है टोकनज़र कोड यहां है – Badr
अब तक पूरी तरह से निर्दोष दिखता है। अधिक कोड, इनपुट + आउटपुट (टूटा ऑफसेट्स के साथ) के सटीक उदाहरण आवश्यक हैं :) हालांकि, मैं इसके साथ ल्यूसीन उपयोगकर्ता मेलिंग सूची में जाऊंगा। – Earwin