2016-07-17 17 views
6

मैं मुफ्त टेक्स्ट से किराने का सामान निकालने के लिए एक अजगर लाइब्रेरी/एल्गोरिदम/पेपर ढूंढ रहा हूं।मुफ्त टेक्स्ट से किराने की सूची निकालें

उदाहरण के लिए:

"एक सलाद और दो बियर"

करने के लिए परिवर्तित किया जाना चाहिए:

{'salad':1, 'beer': 2} 

उत्तर

2

मैं WordNet उपयोग करने का सुझाव। आप इसे जावा (जेडब्ल्यूएनएल लाइब्रेरी) आदि से कॉल कर सकते हैं। यहां सुझाव है: प्रत्येक शब्द के लिए, इसे हाइपरनेम की जांच करें। हाइपरनीमी पदानुक्रम के शीर्ष स्तर पर edibles के लिए आपको "भोजन, पोषक तत्व" मिलेगा। जो संभवतः आप चाहते हैं। अब इसका परीक्षण करने के लिए, Online संस्करण में "बीयर" शब्द से पूछें। "एस" पर क्लिक करें, और उसके बाद "विरासत hypernym" पर क्लिक करें।

.... 
    S: (n) beverage, drink, drinkable, potable (any liquid suitable for drinking) "may I take your beverage order?" 
     S: (n) food, nutrient (any substance that can be metabolized by an animal to give energy and build tissue) 
      .... 

आप अपनी पसंद, आदि के प्रोग्रामिंग भाषा के उपयोग एक बार जब आप सभी edibles चिह्नित किये, तो आप संख्या पकड़ कर सकते हैं इस पदानुक्रम पार कर सकते हैं, यानी 2 2 में ": आप पदानुक्रम में इस कहीं मिलेगा बीयर ", और आपके पास आवश्यक सारी जानकारी है। ध्यान दें कि संख्याओं को पकड़ना एक मूल कोडिंग कार्य हो सकता है! आशा करता हूँ की ये काम करेगा!

+1

यह "अब तीन/3 मिनट के लिए उबाल अंडे" के साथ और अधिक मजबूत होगा। –

3
In [1]: from word2number import w2n 
In [2]: print w2n.word_to_num("One") 
1 
In [3]: print w2n.word_to_num("Two") 
2 
In [4]: print w2n.word_to_num("Thirty five") 
35 

आप इस पैकेज का उपयोग के साथ नंबर एक पर परिवर्तित कर सकते हैं और बाकी चीजें जिन्हें आप अपनी जरूरतों के अनुसार लागू कर सकते हैं।

इस पैकेज की स्थापना।

pip install word2number 

अद्यतन

आप इस तरह लागू कर सकते हैं।

from word2number import w2n 
result = {} 
input = "One salad and two beers" 
b = input.split() 
for i in b: 
    if type(w2n.word_to_num(i)) is int: 
     result[b[b.index(i)+1]] = w2n.word_to_num(i) 

परिणाम

{ 'बियर': 2, 'सलाद': 1}

+0

काम नहीं करेगा अगर यह "तीस पांच बीयर" ... – hashcode55

+0

@ हैशकोड 55 यही कारण है कि मैंने उपरोक्त वर्णित किया है जैसे ओपी को अपनी जरूरतों पर एल्गोरिदम बदलना है। –

संबंधित मुद्दे