मेरे पास टेक्स्ट दस्तावेज़ों का एक समूह है जो बीमारियों का वर्णन करता है। वे दस्तावेज ज्यादातर मामलों में काफी कम होते हैं और अक्सर केवल एक वाक्य होते हैं। एक उदाहरण यहाँ दिया जाता है:रोग पहचान इकाई नाम
प्राथमिक फुफ्फुसीय उच्च रक्तचाप एक प्रगतिशील बीमारी है, जिसमें सबसे छोटी फुफ्फुसीय धमनियों के व्यापक रोड़ा फेफड़े संवहनी प्रतिरोध वृद्धि हुई की ओर जाता है, और बाद में सही वेंट्रिकुलर असफलता है।
क्या मैं जरूरत है एक उपकरण है जो वाक्यों में (इस मामले में उदाहरण के लिए "फुफ्फुसीय उच्च रक्तचाप") सभी रोग शर्तों पाता है और उन्हें MeSH की तरह एक नियंत्रित शब्दावली के लिए नक्शे है।
आपके उत्तरों के लिए अग्रिम धन्यवाद!
यह बहुत विशिष्ट लगता है और प्रोग्रामिंग समस्या नहीं * प्रति * *। कम से कम यहां व्यक्त नहीं किया गया है। –
लगता है कि यह डेटा खनन प्रश्न से अधिक है? – Harpal