मैं एक रूबी रेसिपी प्रबंधन अनुप्रयोग का निर्माण कर रहा हूं, और इसके हिस्से के रूप में, मैं घटक मात्रा को एक रूप में पार्स करने में सक्षम होना चाहता हूं जिसे मैं तुलना और स्केल कर सकता हूं। मैं सोच रहा हूं कि ऐसा करने के लिए सबसे अच्छे उपकरण क्या हैं।व्यंजनों के लिए प्राकृतिक भाषा घटक मात्रा को पार्सिंग
मैं मूल रूप से तो कुछ अन्य कोड है कि पूर्णांकों में two
या five
की तरह मानव पठनीय संख्या, और अंत में कोड का कहना है कि 1 cup
और 3 teaspoons
कुछ आधार माप में बदल जाएगा धर्मान्तरित पर, एक जटिल regex पर योजना बनाई। मैं इनपुट को नियंत्रित करता हूं, इसलिए मैंने वास्तविक घटक को अलग रखा। हालांकि, मैंने उपयोगकर्ताओं को to taste
और 1 package
जैसे अमूर्त माप इनपुट करने वाले उपयोगकर्ताओं को देखा। कम से कम अमूर्त माप के साथ, मुझे लगता है कि मैं उन्हें केवल अनदेखा कर सकता हूं और स्केल कर सकता हूं और उन्हें पहले से किसी भी संख्या को स्क्रैप कर सकता हूं।
यहाँ कुछ और उदाहरण
1 tall can
1/4 cup
2 Leaves
1 packet
To Taste
One
Two slices
3-4 fillets
Half-bunch
2 to 3 pinches (optional)
रहे हैं वहाँ इस के लिए किसी भी चाल कर रहे हैं? मैंने देखा है कि उपयोगकर्ता कुछ हद तक उलझन में हैं जो मात्रा का गठन करते हैं। मैं कठोर नियमों को लागू करने और घटक भाग में tall can
और leaves
जैसी चीजों को धक्का देने का प्रयास कर सकता हूं। हालांकि, इसे लागू करने के लिए, मुझे यह बताने में सक्षम होना चाहिए कि क्या अमान्य है।
क्या कोई एपीआई या मणि मैं उपयोग कर सकता हूं? वुल्फ्राम एल्फा ने पहले वादा किया, लेकिन आखिरकार, मुझे नहीं लगता कि यह तब तक काम करेगा जब तक कि मैं उन्हें बता सकूं कि मैं केवल उन्हें नुस्खा मात्रा खिला रहा हूं।
मुझे यह भी सुनिश्चित नहीं है कि "आधार" माप मुझे मात्राओं को किस रूप में परिवर्तित करना चाहिए।
संपादित करें: किसी भी भ्रम को दूर करने के लिए, ये मेरे लक्ष्य हैं।
व्यंजनों को स्केल करने में सक्षम होने के लिए। माप की मनमानी इकाइयां
packages
को स्केल नहीं किया जाना चाहिए, लेकिनcups
याounces
जैसे सटीक वाले होने की आवश्यकता है।"मुख्य" अवयवों को चित्रित करें। इस प्रश्न के संदर्भ में, यह पता लगाने के द्वारा किया जाएगा कि नुस्खा में सबसे बड़ा घटक क्या है। उत्पादन में, घटक के प्रकार के आधार पर कुछ प्रकार के संशोधक होना चाहिए क्योंकि जाहिर है,
flour
लगभग "मुख्य" घटक कभी नहीं माना जाता है। हालांकि,chocolate
का उपयोग कम से कम किया जा सकता है, और इसे अभी भीchocolate cake
कहा जा सकता है।इनपुट सामान्यीकृत करें। साइट पर कुछ स्थिरता रखने के लिए, मैं निरंतर संक्षेप रखना चाहता हूं। उदाहरण के लिए,
pounds
के बजाय, यहlbs
होना चाहिए।
क्योंकि मैं सोच रहा हूँ अगर यह NLTK साथ अजगर में करने के लिए आसान होगा मैं भी NLTK टैग लगाया।
क्या आप इसे "आधा-गुच्छा" स्केल करने की कोशिश कर रहे हैं यदि मैं नुस्खा को तीन गुना करना चाहता हूं तो "1.5 बंच" बन जाता है? –
आखिरकार हाँ संस्करण 1 के लिए जो कि एक पुल बहुत दूर हो सकता है। – hadees
टैको मसाला का एक पैकेट 4oz है, क्रीमकीज़ का एक पैकेट 8oz है, इसलिए यह पता लगाने में मुश्किल है कि एक पैकेट कितना है। हालांकि, अगर आप संख्या को पार्स कर सकते हैं, तो आपको बस जो कुछ भी हो, उसे गुणा करने की आवश्यकता है। यह हमें बताने में मददगार हो सकता है कि आपका वांछित आउटपुट कुछ उदाहरणों के माध्यम से इनपुट पर आधारित है। –