2008-10-23 4 views
7

मैं प्रक्रियात्मक भाषा के बाद वर्णों के बजाय शब्दों पर नियमित अभिव्यक्ति शैली परिवर्तन करने के लिए सिंथेटिक उदाहरण या सामान्य तकनीकों की तलाश में हूं।ए "शब्दों के लिए रेगेक्स" (अर्थात् प्रतिस्थापन) - कोई उदाहरण वाक्यविन्यास और पुस्तकालय?

उदाहरण के लिए, प्रतिलिपि का पता लगाने के लिए, कोई भी समान अर्थ वाले दस्तावेज़ बनाना चाहता है लेकिन विभिन्न शब्द विकल्पों के साथ।

मैं उन संभावित परिवर्तनों को संक्षेप में परिभाषित करने में सक्षम होना चाहता हूं जिन्हें मैं एक टेक्स्ट स्ट्रीम पर लागू कर सकता हूं।

ईजी। "तेज़ संज्ञा" टू "तीव्र संज्ञा", लेकिन "तेज़ी से जाएं।" तब्दील नहीं हो (कोई संज्ञा बाद में
या:। के

मैं उम्मीद थी इस व्याकरण चेकर्स में किया जाना है, इस तरह के "गीत ऐलिस द्वारा गाया किया जाएगा" "एलिस गीत गाना" निष्क्रिय आवाज़ का पता लगाने के रूप में।

एसी # इस प्रकार की भाषा प्रसंस्करण के लिए एसी # कार्यान्वयन वास्तव में साफ होगा, लेकिन मुझे लगता है कि किसी भी प्रयास का सही नियम सही नियमों के साथ आ रहा है - नियमों को स्पष्ट और समझने योग्य स्थान की तरह दिखता है शुरू करने के लिए।

उत्तर

0

शुरू करने के लिए एक अच्छी जगह एसआईएल कीहोगी इसके "कंप्यूटर सहायक संबंधित भाषा अनुकूलन" सूट के लिए। वैकल्पिक रूप से एसआईएल का Adapt It। एसआईएल में भाषाई विश्लेषण सॉफ्टवेयर की एक बड़ी श्रृंखला है, जो दिशा आपको दिखाई दे रही है। यह निश्चित रूप से नियमित अभिव्यक्तियों से एक बड़ी छलांग है, जो अर्थ के बारे में परवाह नहीं करता है, जो भाषाई विश्लेषण को संभालने में कुछ ऐसा कर सकता है।

+0

मुझे संदेह है कि मैंने गलत सवाल का जवाब दिया है, और मैं समझने की कोशिश करूंगा कि मैं कहां गलत हुआ। मुझे उम्मीद थी कि मैं नियम-सेट लिखूंगा, मैं नियम-सेट के उदाहरण ढूंढ रहा हूं और यदि उन्हें परिभाषित करने का एक मानक तरीका है। –

0

यदि आप प्राकृतिक भाषा पार्सिंग/ट्रांसफॉर्मिंग के लिए कुछ और मजबूत चाहते हैं, तो आप C# port of OpenNLP आज़मा सकते हैं।

2

शोध शुरू करने के लिए एक अच्छी जगह "वर्ड नेट" होगी - यह अर्थशास्त्र का एक शब्दकोश है, समान अर्थों से शब्दों को समूहीकृत करना, और उपयोगी तरीकों से शब्दों के बीच संबंधों को रिकॉर्ड करना भी।

वर्ड नेट कॉर्पस का लाभ उठाने वाली सॉफ्टवेयर परियोजनाओं का एक समूह है, उनमें से एक आपको चाहिए जो हो सकता है।

+0

एक शुरुआती बिंदु के लिए धन्यवाद। क्या आप किसी भी परियोजना की सिफारिश कर सकते हैं जो मानव दर्ज नियम के आधार पर पाठ को बदलता है? –

-1

मैं किसी भी वाक्यविन्यास है कि अंग्रेजी भाषा संसाधन के लिए मौजूद है जैसे आप पर चर्चा के बारे में पता नहीं कर रहा हूँ। आपको वहां से एक टूलसेट (जैसे वर्ड नेट) का उपयोग करके अपना स्वयं का डीएसएल बनाना होगा।

http://www.grammaticalframework.org/

जो स्पष्ट पारसर्स, आदि इस तरह की प्राकृतिक भाषा संसाधन के लिए उत्पन्न करने के लिए बनाया गया है:

2

आप एक विशेष भाषा से बंधे नहीं रहे हैं, तो हास्केल आर्ने रेंता का व्याकरणिक ढांचा है।

+1

लिंक टूटा हुआ है। जीएफ की वेबसाइट http: //www.grammaticalframework है।संगठन/ अरने रंता की वेबसाइट: http://www.cse.chalmers.se/~aarne/ –

+0

स्पष्ट रूप से लिंक रोका गया। धन्यवाद! स्थिर –

संबंधित मुद्दे