निकट भविष्य में कुछ समय मुझे एक क्रॉस-भाषा शब्द गणना लागू करने की आवश्यकता होगी, या यदि यह संभव नहीं है, तो एक क्रॉस-भाषा वर्ण गणना।विभिन्न भाषाओं में शब्दों की गणना करने के लिए एक PHP लाइब्रेरी/कक्षा?
शब्द गणना से मेरा मतलब है पाठ के भाषा को लेते हुए दिए गए पाठ में निहित शब्दों की सटीक गणना। पाठ की भाषा किसी उपयोगकर्ता द्वारा निर्धारित की जाती है, और इसे सही माना जाएगा।
चरित्र गणना से मेरा मतलब है ऊपर वर्णित उसी भाषा की जानकारी के साथ दिए गए पाठ में मौजूद "संभवतः एक शब्द" वर्णों की गिनती।
मैं पूर्व गणना को अधिक पसंद करूंगा, लेकिन मुझे शामिल कठिनाइयों से अवगत है। मुझे यह भी पता है कि बाद की गिनती बहुत आसान है, लेकिन यदि संभव हो तो पूर्व को बहुत पसंद करते हैं।
अगर मुझे सिर्फ अंग्रेजी देखना है, तो मुझे यह अच्छा लगेगा, लेकिन मुझे यहां हर भाषा, चीनी, कोरियाई, अंग्रेजी, अरबी, हिंदी आदि पर विचार करना होगा।
मुझे पता है कि अगर स्टैक ओवरफ़्लो जहां एक मौजूदा उत्पाद/विधि की तलाश में PHP में यह करने के लिए शुरू करने के लिए, के रूप में मैं एक अच्छा आलसी प्रोग्रामर *
A simple test set_locale साथ कैसे str_word_count दिखा रहा हूँ पर कोई सुराग नहीं है चाहते हैं काम नहीं करता है, और php.net के str_word_count पृष्ठ से एक फ़ंक्शन।
* http://blogoscoped.com/archive/2005-08-24-n14.html
CJK, trickiest होने के लिए, क्योंकि वे शब्द अलग करने के लिए रिक्त स्थान का प्रयोग नहीं करते जा रहे हैं। – Turnor
अवलोकन अवलोकन। यही कारण है कि मैंने यहां अपना प्रश्न पोस्ट किया है;) –
यह सवाल मैंने पहले उत्तर के रूप में पूछा था: क्या आप "शब्द गणना" से क्या मतलब चाहते हैं? क्या आप यह सत्यापित करना चाहते हैं कि उस शब्द के शब्दकोश में वास्तव में एक शब्द मौजूद है, या आप केवल उस भाषा के डिलीमीटर द्वारा अलग वाक्यांशों की गिनती की तलाश कर रहे हैं? – Grantismo