当前位置:Gxlcms > PHP教程 > 如何解决phpsubstr乱码问题

如何解决phpsubstr乱码问题

时间:2021-07-01 10:21:17 帮助过:4人阅读

php substr是一种基于php语言开发的可以返回字符串的一部分的功能函数。有时候我们使用php substr会出现一些乱码问题,那该如何解决呢?

  1. string substr ( string $string , int $start [, int $length ] )

返回string中从start位置开始长度为length的字符串

substr函数在截取字符时是按字节来截取的,中文字符在GB2312编码时为2个字节,utf-8编码时为3个字节,所以截取指定长度的字符串时如果截断了汉字,那么返回的结果显示出来便会出现乱码。

查了一下,解决方案归结起来可分两类:

1、改用mb_substr()函数

  1. string mb_substr ( string $str , int $start [, int $length [, string $encoding ]] )

类似substr()函数,只是计数按字符数来计,保证字符安全

使用mb_substr()函数可保证不会出现乱码,但缺点是长度统计变成了字符数统计,而不是按字节数统计。用于显示时,同样长度的中文结果和英文结果会出现较大的显示长度的差别。

2、自建函数增强substr功能

这里提供一个函数可较好地解决substr遇到中文字符的问题。中文字符按2个长度单位来计算,使得中英文混用环境下字符串截取结果最后的显示长度接近;舍弃最后一个不完整字符,保证不会出现显示上的乱码;且兼容了中文字符常用的utf-8编码和GB2312编码,有很好的通用性。

查看源代码

  1. function getstr($string, $length, $encoding = 'utf-8') {
  2. $string = trim($string);
  3. if($length && strlen($string) > $length) {
  4. //截断字符
  5. $wordscut = '';
  6. if(strtolower($encoding) == 'utf-8') {
  7. //utf8编码
  8. $n = 0;
  9. $tn = 0;
  10. $noc = 0;
  11. while ($n < strlen($string)) {
  12. $t = ord($string[$n]);
  13. if($t == 9 || $t == 10 || (32 <= $t && $t <= 126)) {
  14. $tn = 1;
  15. $n++;
  16. $noc++;
  17. } elseif(194 <= $t && $t <= 223) {
  18. $tn = 2;
  19. $n += 2;
  20. } elseif(224 <= $t && $t < 239) {
  21. $tn = 3;
  22. $n += 3;
  23. $noc += 2;
  24. } elseif(240 <= $t && $t <= 247) {
  25. $tn = 4;
  26. $n += 4;
  27. $noc += 2;
  28. } elseif(248 <= $t && $t <= 251) {
  29. $tn = 5;
  30. $n += 5;
  31. $noc += 2;
  32. } elseif($t == 252 || $t == 253) {
  33. $tn = 6;
  34. $n += 6;
  35. $noc += 2;
  36. } else {
  37. $n++;
  38. }
  39. if ($noc >= $length) {
  40. break;
  41. }
  42. }
  43. if ($noc > $length) {
  44. $n -= $tn;
  45. }
  46. $wordscut = substr($string, 0, $n);
  47. } else {
  48. for($i = 0; $i < $length - 1; $i++) {
  49. if(ord($string[$i]) > 127) {
  50. $wordscut .= $string[$i].$string[$i + 1];
  51. $i++;
  52. } else {
  53. $wordscut .= $string[$i];
  54. }
  55. }
  56. }
  57. $string = $wordscut;
  58. }
  59. return trim($string);
  60. }
  61. // 示例
  62. echo getstr("0一二三四五六七",1).'<br />'; // 0
  63. echo getstr("0一二三四五六七",2).'<br />'; // 0
  64. echo getstr("0一二三四五六七",3).'<br />'; // 0一
  65. echo getstr("0一二三四五六七",4).'<br />'; // 0一
  66. echo getstr("0一二三四五六七",5).'<br />'; // 0一二
  67. echo getstr("0一a二b三四五六七",1).'<br />'; // 0
  68. echo getstr("0一a二b三四五六七",2).'<br />'; // 0
  69. echo getstr("0一a二b三四五六七",3).'<br />'; // 0一
  70. echo getstr("0一a二b三四五六七",4).'<br />'; // 0一a
  71. echo getstr("0一a二b三四五六七",5).'<br />'; // 0一a

此函数由UCHome 1.5中的getstr()函数修改而来。

以上就是如何解决php substr乱码问题的方案,之前我们还分享了关于php substr函数的一系列文章,有需要的可以关注PHP中文网。

相关推荐:

关于PHP substr()函数的几个程序

php substr()函数处理中文详解

php substr()函数字符串截取用法实例讲解

以上就是如何解决php substr乱码问题的详细内容,更多请关注Gxl网其它相关文章!

人气教程排行