मैं वर्तमान में एक प्रोजेक्ट पर काम कर रहा हूं जहां मैं पाठ से भावनाओं को संदर्भित करने के लिए प्राकृतिक भाषा प्रसंस्करण का उपयोग करता हूं ताकि प्रासंगिक जानकारी के साथ उन्हें सहसंबंधित किया जा सके।समायोज्य, संस्करणित ग्राफ डेटाबेस
प्रासंगिक जानकारी की परिभाषा: प्रत्येक जानकारी जो एक समय की स्थिति में किसी इकाई की स्थिति का वर्णन करने के लिए प्रासंगिक है। डेटा संरचना की
विवरण मैं तलाश कर रहा हूँ:
वहाँ संस्थाओं की एक मनमाना संख्या जिनमें से मैं चाहता हूँ (एक इकाई या तो एक व्यक्ति या (चहचहाना हैश टैग) उदाहरण के लिए एक समूह हो सकता है) है प्रासंगिक जानकारी और अन्य इकाइयों के साथ उनकी बातचीत को ट्रैक करने के लिए। इकाइयों के बीच वार्तालापों को उनकी भावनात्मक विशेषताओं को वर्गीकृत करने के लिए संसाधित किया जाता है। मूल भावनात्मक विशेषताओं में एक वेक्टर होता है जो उनकी घटना को नियमित रूप से निर्दिष्ट करता है: {fear: 0.1, happiness: 0.4, joy: 0.1, surprise: 0.9, anger: 0}
संस्थाएं कोई भी प्रासंगिक जानकारी भी सबमिट कर सकती हैं, जिसे वे साझा करना चाहते हैं, उदाहरण के लिए: स्थान, कमरे का तापमान, रक्तचाप, ... और इसी तरह इसे प्रासंगिक चर) के रूप में। क्योंकि न तो किसी इकाई की वार्तालापों की संख्या, न ही संदर्भ चर वे किसी भी समय साझा करना चाहते हैं, डेटा संरचना को तदनुसार समायोजित करने में सक्षम होना चाहिए।
महत्वपूर्ण: डेटा में प्रत्येक परिवर्तन को अपने राज्य का भी प्रतिनिधित्व करना चाहिए क्योंकि मैं एक-दूसरे के साथ राज्य में कुछ बदलावों को सहसंबंधित करने की उम्मीद कर रहा हूं।
उदाहरण: बॉब और एलिस में एक वार्तालाप है जो डर की उच्च परिमाण दिखाता है। कुछ घंटों बाद उनके पास एक और वार्तालाप है जो कोई और डर नहीं दिखाता, बल्कि खुशी। अब, कोई तर्क दे सकता है कि उच्च परिमाण डर, खुशी के बाद वास्तव में भावना राहत के रूप में व्याख्या की जा सकती है।
हालांकि, इस जानकारी को निकालने में सक्षम होने के लिए मुझे अलग-अलग राज्यों को एक-दूसरे के साथ सहसंबंध करने में सक्षम होना चाहिए। बातचीत में ट्रैक की गई भावनाओं के साथ उन्हें संबंधित करने के लिए प्रासंगिक जानकारी का उपयोग करने के लिए भी जाता है। यही कारण है कि प्रत्येक राज्य परिवर्तन रिकॉर्ड और उपलब्ध होना चाहिए।
यह आपको और अधिक स्पष्ट करने के लिए, मैंने graphic बनाया है और इसे प्रश्न से जुड़ा हुआ है।
अब, मेरे पास वास्तविक प्रश्न है: मैं इस समस्या को हल करने के लिए किस डेटाबेस/डेटा संरचना का उपयोग कर सकता हूं? मैंने ईवेंट-सोर्सिंग डेटाबेस में देखा है लेकिन अगर मैं आसानी से उनके साथ ग्राफ संरचना को फिर से बना सकता हूं तो मुझे पूरा विश्वास नहीं था। मैंने ग्राफ डेटाबेस को भी देखा लेकिन मुझे वह नहीं मिला जो मैं ढूंढ रहा था।
इसलिए यह अच्छा होगा अगर कोई यहां मुझे सही दिशा में कम से कम इंगित कर सकता है या समस्या को हल करने के लिए मेरी संरचना को समायोजित करने में मेरी सहायता कर सकता है। यदि डेटा संरचनाएं समर्थित हैं, तो मैं इसे स्नैपशॉट्स के साथ ग्राफ़ डेटाबेस कहता हूं, तो उपयोग की आसानी शायद फ़िल्टर करने के लिए सबसे महत्वपूर्ण विशेषता है।