- $string=mb_convert_encoding($string, 字符输出编码, 原字符编码);
-
例如:网页使用gbk编码,字符串使用utf-8编码,将字符转换为网页显示编码。
- echo mb_convert_encoding("php编码转换", "gbk", "utf-8");
总结:推荐使用mb_convert_encoding函数,该函数无iconv转换字符错误问题。
对字符串进行编码转换,要转成UTF-8。
如果知道原字符串编码,就可以使用大家都熟悉的iconv函数,但现在是不知道原字符串的编码,可能是GBK,也可能原来就是UTF-8,就不能使用这个方法了。
如果可以获取字符串编码类型,或者有一个自动识别原字符串编码的编码转换函数就好了。
结果找到了mb_convert_encoding函数就是那个可以自动识别原字符串编码的函数,但在使用中,发现GBK中的某些汉字被它转成了乱码。
后来又在php手册上找到了is_utf8函数,然后结合iconv函数,问题得以解决。
用到的编码转换函数:
- function is_utf8($string) {
- return preg_match(’%^(?:
- [\x09\x0A\x0D\x20-\x7E] # ASCII
- | [\xC2-\xDF][\x80-\xBF] # non-overlong 2-byte
- | \xE0[\xA0-\xBF][\x80-\xBF] # excluding overlongs
- | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} # straight 3-byte
- | \xED[\x80-\x9F][\x80-\xBF] # excluding surrogates
- | \xF0[\x90-\xBF][\x80-\xBF]{2} # planes 1-3
- | [\xF1-\xF3][\x80-\xBF]{3} # planes 4-15
- | \xF4[\x80-\x8F][\x80-\xBF]{2} # plane 16
- )*$%xs’, $string);
- } // function is_utf8
|