当前位置:Gxlcms > PHP教程 > PHP如何将不是UTF8的字符过滤掉(代码)

PHP如何将不是UTF8的字符过滤掉(代码)

时间:2021-07-01 10:21:17 帮助过:178人阅读

本篇文章给大家带来的内容是关于PHP如何将不是UTF8的字符过滤掉(代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。

function utf8_filter($data)
  {
     $str = "";
     for($n = 0; $n < strlen($data);)
     {
          $s = substr($data, $n, 1);
          $v = ord($s);
          if($v >= 127)
          {
             ++$n;
             $cnt = 0;
             $tmp = $v;
             while($tmp & 0x80)
             {
                $tmp = $tmp << 1;
                ++$cnt;
              }
              $x = 0;
              while($x < $cnt && $n < strlen($data))
              {
                $s = substr($data, $n, 1);
                if((ord($s) & 0xC0) == 0x80)
                {
                   ++$n;
                   ++$x;
                 }else{
                         break;
                        }
                  }
                 if($x + 1 == $cnt)
                 {
                    $str  = $str . substr($data, $n - $cnt, $cnt);
                  }else{
                         while($n < strlen($data))
                        {
                          $s = substr($data, $n, 1);
                          if(ord($s) & 0x80)
                          {
                             ++$n;
                           }else{
                                    break;
                                 }
                            }
          }
         }else{
       $str = $str. $s;
       ++$n;
      }
}
return  $str;
}

相关推荐:

过滤utf8 字符中超过三个字节的字符,或者非utf8字符

PHP实现过滤掉非汉字字符只保留中文字符,

以上就是PHP如何将不是UTF8的字符过滤掉(代码)的详细内容,更多请关注Gxl网其它相关文章!

人气教程排行