2013-02-28 9 views
5

preg split और utf के साथ समस्या है।PHP preg_split utf8 अक्षर

Array 
(

    [text] => Šios baterijos kaista 
    [words] => Array 
     (
      [0] => � 
      [1] => ios 
      [2] => baterijos 
      [3] => kaista 

इस कोड CakePHP ढांचे में runing है:

$original['words'] = preg_split("/[\s]+/", $original['text']); 
print_r($original); 

यह जवाब है: यह कोड है। एक नोटिस बनाएं कि [टेक्स्ट] शब्दों से पहले सही ढंग से दिखाया गया है और विभाजित प्रगति में गड़बड़ है। वैसे, मैंने इन्हें उपयोग करने का प्रयास किया:

mb_internal_encoding('UTF-8'); 
mb_regex_encoding('UTF-8'); 
ini_set('default_charset','utf-8'); 

कोई भी मदद नहीं की। धन्यवाद।

+0

क्या आपने http://php.net/manual/en/function.mb-split.php को आजमाया है? –

उत्तर

8

आप नियमित अभिव्यक्ति के लिए umodifier जोड़कर preg_split के लिए UTF-8 मोड सक्षम करना होगा:

preg_split("/[\s]+/u", $original['text']); 

विन्यास निर्देशों आप एक समाधान यहाँ कोई भूमिका निभाते हैं खोजने की कोशिश कर के भाग के रूप का उल्लेख है।

संबंधित मुद्दे