मैं NLTK में Earley पार्सर उपयोग करने के लिए इस तरह के रूप वाक्य पार्स करने के लिए कोशिश कर रहा हूँ पूर्णांकों/दिनांक का उपयोग करते हुए: अगर तिथि से पहले कीरूप NLTK पार्सर में टर्मिनलों
12/21/2010 तो धारावाहिक = 10
ऐसा करने के लिए, मैं एक CFG लिखने की कोशिश कर रहा हूँ, लेकिन समस्या मैं विशिष्ट मान के स्थान पर, दिनांक और टर्मिनलों के रूप में पूर्णांकों का एक सामान्य प्रारूप की आवश्यकता होती है। क्या नियमित अभिव्यक्ति के रूप में उत्पादन नियम के दाईं ओर निर्दिष्ट करने के कोई तरीके हैं, जो इस प्रकार की प्रसंस्करण की अनुमति देंगे?
कुछ की तरह:
S -> '[0-9]+'
जो सभी पूर्णांकों संभाल होगा।
आपका दिनांक प्रारूप लोकेल निर्भर है। और मुख्य रूप से ambigous है (एक गणितीय अभिव्यक्ति 12 div 21 div 2010 है जो शायद नहीं है के साथ भिड़ना है कि आप – VGE
चाहते हैं तो आप सही हो लेकिन यह है कि संभाल करने के बाद से इनपुट आप क्या उल्लेख किया है जैसे किसी भी गणितीय अभिव्यक्ति होते हैं कभी नहीं होगा आसान हो जाएगा। इसके अलावा तिथि प्रारूप तय किया जाएगा, कहें, एमएम/डीडी/वाई वाई वाई। मुझे पूर्णांक को संभालने का एक तरीका मिला, लेकिन मैं अभी भी तिथियों के लिए उचित समाधान ढूंढ रहा हूं। – FahimH