मुझे एक चीनी वाक्य को अलग शब्दों में विभाजित करने की आवश्यकता है। चीनी के साथ समस्या यह है कि कोई रिक्त स्थान नहीं है। उदाहरण के लिए, वाक्य इस तरह दिखेगा: 主楼怎么走
(रिक्त स्थान के साथ यह होगा: 主楼 怎么 走
)।एक वाक्य को अलग शब्दों में विभाजित करें
फिलहाल मैं एक समाधान के बारे में सोच सकते हैं। मेरे पास चीनी शब्द (डेटाबेस में) के साथ एक शब्दकोश है। स्क्रिप्ट करेंगे:
कोशिश डेटाबेस (
主楼
) में वाक्य के पहले दो अक्षर लगता है,अगर
主楼
वास्तव में एक शब्द है और यह डेटाबेस स्क्रिप्ट की तलाश करेगा में है पहले तीन अक्षर (主楼怎
)।主楼怎
कोई शब्द नहीं है, इसलिए यह डेटाबेस में नहीं है => मेरा एप्लिकेशन अब जानता है कि主楼
एक अलग शब्द है।कोशिश पात्रों के बाकी के साथ करते हैं।
मुझे यह दृष्टिकोण वास्तव में पसंद नहीं है, क्योंकि एक छोटे से पाठ का विश्लेषण करने के लिए यह डेटाबेस को कई बार पूछताछ करेगा।
क्या इसके कोई अन्य समाधान हैं?
चीनी में कोई जगह नहीं होने पर बस जिज्ञासा है, आपको उन्हें * स्पेस के साथ * प्रदर्शित करने की आवश्यकता क्यों है? यहां उपयोग का मामला क्या है? हम्म - क्षमा करें, फिर से प्रश्न पढ़ें, स्पष्ट रूप से कुछ शब्द शब्दकोश लुकअप, कभी भी ध्यान न दें। –
विम का कहना है कि, यदि यह लाइन-रैपिंग के उद्देश्य के लिए है, तो परेशान न करें: जहां तक मुझे पता है, आप किसी भी चरित्र पर अपनी लाइन को लपेट सकते हैं। –
एप्लिकेशन को अलग-अलग शब्दों को खोजने और उन्हें पिनयिन (चीनी प्रतिलेखन) प्रदान करने की आवश्यकता है। – Peterim