2008-10-02 5 views
9

शहर/क्षेत्र या मूल के साथ स्वचालित रूप से लेबल लेबल करने के लिए कुछ अच्छे एल्गोरिदम क्या हैं? यही है, अगर कोई ब्लॉग न्यू यॉर्क के बारे में है, तो मैं प्रोग्रामेटिक तरीके से कैसे कह सकता हूं। क्या ऐसे पैकेज/पेपर हैं जो किसी निश्चित डिग्री के साथ ऐसा करने का दावा करते हैं?जियोटैगिंग या जिओलाबेलिंग टेक्स्ट सामग्री के लिए तरीके

मैंने कुछ टीएफआईडीएफ आधारित दृष्टिकोण, उचित संज्ञा चौराहे पर ध्यान दिया है, लेकिन अब तक, कोई शानदार सफलता नहीं है, और मैं विचारों की सराहना करता हूं!

अधिक सामान्य प्रश्न विषयों की कुछ सूची दिए गए विषयों पर ग्रंथों को निर्दिष्ट करने के बारे में है।

बेयसियन दृष्टिकोण पर पूर्ण/निष्पक्ष दृष्टिकोण को पूरा करने के लिए पसंदीदा, लेकिन मैं खुला हूं।

उत्तर

12

आप named entity recognition सिस्टम, या लघु NER के लिए देख रहे हैं। severalgoodtoolkits आपकी मदद करने के लिए उपलब्ध हैं। विशेष रूप से लिंगपिप में बहुत decent tutorial है। CAGEclass भौगोलिक स्थान के नाम पर एनईआर के आसपास उन्मुख होना प्रतीत होता है, लेकिन मैंने अभी तक इसका उपयोग नहीं किया है।

Here's भौगोलिक स्थानों के नामों के साथ एनईआर की कठिनाइयों के बारे में एक अच्छी ब्लॉग प्रविष्टि।

यदि आप जावा के साथ जा रहे हैं, तो मैं लिंगपिप एनईआर कक्षाओं का उपयोग करने की सलाह दूंगा। ओपनएनएलपी में कुछ भी है, लेकिन पूर्व में एक बेहतर दस्तावेज है।

यदि आप कुछ सैद्धांतिक पृष्ठभूमि की तलाश में हैं, Chavez et al. (2005) ने एक दिलचस्प वाक्य रचना बनाई है और इसे दस्तावेज किया है।

+0

सलाह के लिए धन्यवाद। यह एक कठिन, कठिन समस्या है, और आपका उत्तर, जिसे मैं "एनईआर देखो" के रूप में संक्षेप में सारांशित करता हूं, शायद सबसे अच्छा है! –

+2

क्या आपको इस प्रश्न के लिए कोई आसान समाधान मिला .. ?? चूंकि मैं भी इसी तरह के आवेदन की तलाश में हूं .. मैंने अपनी खुद की टेरी डेटा संरचना लागू की है और मैं आसानी से देख सकता हूं, लेकिन समस्या डेटा सेट एकत्र कर रही है .. मुझे शब्दकोश में सभी डेटा सेट प्राप्त करने की आवश्यकता है ... कृपया साझा करें तुम्हारे विचार.. –

2

Latent Semantic Mapping संभावित रूप से एक अच्छा फिट लगता है। यह एक एल्गोरिदम के बेवकूफ के बारे में है जैसा आपको ढूंढने की संभावना है।

संबंधित मुद्दे