मैं खुली नामित इकाई पहचान समस्या (जीवविज्ञान/रसायन शास्त्र) के लिए अनुकूलित करने के लिए सबसे अच्छा मॉडल क्या करने का प्रयास कर रहा हूं, इसलिए संस्थाओं का कोई शब्दकोश मौजूद नहीं है लेकिन उन्हें संदर्भ द्वारा पहचाना जाना चाहिए)।नामित इकाई पहचान के लिए TensorFlow RNNs
वर्तमान में मेरा सबसे अच्छा अनुमान सिंटेक्सनेट को अनुकूलित करना है ताकि शब्दों को एन, वी, एडीजे आदि के रूप में टैग करने की बजाय, यह BEGINNING, INSIDE, आउट (आईओबी नोटेशन) के रूप में टैग करना सीखता है।
हालांकि मुझे यकीन नहीं है कि इनमें से कौन सा दृष्टिकोण सबसे अच्छा है?
- Syntaxnet
- word2vec
- seq2seq (मैं जबकि seq2seq अनुवाद में के रूप में अलग-अलग लंबाई की दृश्यों के लिए डिज़ाइन किया गया है लगता है कि यह सही एक के रूप में मैं इसे की जरूरत है दो गठबंधन दृश्यों पर जानने के लिए नहीं है)
सही विधि के लिए सूचक के लिए आभारी होंगे! धन्यवाद!
Syntaxnet और seq2seq काम करेंगे। Contrib में एक रैखिक श्रृंखला सीआरएफ भी है। – drpng