时间:2021-07-01 10:21:17 帮助过:6人阅读
//对待一个UTF8的中文字符是3个长度
//对待一个gbk的中文字符是2个长度
header("content-Type:text/html;charset=utf-8");
//设置内部编码
mb_internal_encoding('UTF-8');
//测试
$cn_str="钓鱼岛是中国的hehe";
$en_str="this is just a test";
//使用substr
echo substr($cn_str,0,3).'
'; //钓
echo substr($en_str,0,3).'
'; //thi
//使用mbsubstr()
echo "mb_substr-3:".mb_substr($cn_str,0,3).'
'; //钓鱼岛 按照字来划分
echo "substr-3:".substr($cn_str,0,3).'
';//钓 按照字节来划分
echo "mb_strcut-3:".mb_strcut($cn_str,0,3).'
'; //钓 按照字节来划分
echo "mb_substr-4:".mb_substr($cn_str,0,4).'
'; //钓鱼岛 按照字来划分
echo "substr-4:".substr($cn_str,0,4).'
'; //钓 按照字节来划分(出现乱码)
echo "mb_strcut-4:".mb_strcut($cn_str,0,4).'
'; //钓 按照字节来划分(不会出现乱码)
echo strlen($cn_str).'
'; //26
echo mb_strlen($cn_str).'
'; //12
echo iconv_strlen($cn_str).'
';//26
?>
三、结论
substr、mb_strcut表现都不够理想,mb_substr可以正常使用,但前提是要安装php扩展库,否则就要自己写一个适应各种情况的截取函数了。