मैं मुफ्त टेक्स्ट से किराने का सामान निकालने के लिए एक अजगर लाइब्रेरी/एल्गोरिदम/पेपर ढूंढ रहा हूं।मुफ्त टेक्स्ट से किराने की सूची निकालें
उदाहरण के लिए:
"एक सलाद और दो बियर"
करने के लिए परिवर्तित किया जाना चाहिए:
{'salad':1, 'beer': 2}
मैं मुफ्त टेक्स्ट से किराने का सामान निकालने के लिए एक अजगर लाइब्रेरी/एल्गोरिदम/पेपर ढूंढ रहा हूं।मुफ्त टेक्स्ट से किराने की सूची निकालें
उदाहरण के लिए:
"एक सलाद और दो बियर"
करने के लिए परिवर्तित किया जाना चाहिए:
{'salad':1, 'beer': 2}
मैं WordNet उपयोग करने का सुझाव। आप इसे जावा (जेडब्ल्यूएनएल लाइब्रेरी) आदि से कॉल कर सकते हैं। यहां सुझाव है: प्रत्येक शब्द के लिए, इसे हाइपरनेम की जांच करें। हाइपरनीमी पदानुक्रम के शीर्ष स्तर पर edibles के लिए आपको "भोजन, पोषक तत्व" मिलेगा। जो संभवतः आप चाहते हैं। अब इसका परीक्षण करने के लिए, Online संस्करण में "बीयर" शब्द से पूछें। "एस" पर क्लिक करें, और उसके बाद "विरासत hypernym" पर क्लिक करें।
....
S: (n) beverage, drink, drinkable, potable (any liquid suitable for drinking) "may I take your beverage order?"
S: (n) food, nutrient (any substance that can be metabolized by an animal to give energy and build tissue)
....
आप अपनी पसंद, आदि के प्रोग्रामिंग भाषा के उपयोग एक बार जब आप सभी edibles चिह्नित किये, तो आप संख्या पकड़ कर सकते हैं इस पदानुक्रम पार कर सकते हैं, यानी 2 2 में ": आप पदानुक्रम में इस कहीं मिलेगा बीयर ", और आपके पास आवश्यक सारी जानकारी है। ध्यान दें कि संख्याओं को पकड़ना एक मूल कोडिंग कार्य हो सकता है! आशा करता हूँ की ये काम करेगा!
In [1]: from word2number import w2n
In [2]: print w2n.word_to_num("One")
1
In [3]: print w2n.word_to_num("Two")
2
In [4]: print w2n.word_to_num("Thirty five")
35
आप इस पैकेज का उपयोग के साथ नंबर एक पर परिवर्तित कर सकते हैं और बाकी चीजें जिन्हें आप अपनी जरूरतों के अनुसार लागू कर सकते हैं।
इस पैकेज की स्थापना।
pip install word2number
अद्यतन
आप इस तरह लागू कर सकते हैं।
from word2number import w2n
result = {}
input = "One salad and two beers"
b = input.split()
for i in b:
if type(w2n.word_to_num(i)) is int:
result[b[b.index(i)+1]] = w2n.word_to_num(i)
परिणाम
{ 'बियर': 2, 'सलाद': 1}
काम नहीं करेगा अगर यह "तीस पांच बीयर" ... – hashcode55
@ हैशकोड 55 यही कारण है कि मैंने उपरोक्त वर्णित किया है जैसे ओपी को अपनी जरूरतों पर एल्गोरिदम बदलना है। –
यह "अब तीन/3 मिनट के लिए उबाल अंडे" के साथ और अधिक मजबूत होगा। –