当前位置:Gxlcms > PHP教程 > php取中文字符串中出现次数最多的子串的代码

php取中文字符串中出现次数最多的子串的代码

时间:2021-07-01 10:21:17 帮助过:13人阅读

  1. /***
  2. **子串的长度可以自定义,比如连续4个字符
  3. **site http://bbs.it-home.org
  4. $str ='我是中国人我是外国人我是韩国人我是美国人我是中国人我是英国人我是中国人我是外国人';
  5. Count_string($str,5);
  6. function Count_string($sstr,$length)
  7. {
  8. $cnt_tmp = 0;
  9. $cnt = 0;
  10. $str = '';
  11. $str_tmp = array();
  12. $str_arr = array();
  13. mb_internal_encoding("gb2312");
  14. $max_length = (mb_strlen($sstr)-$length);
  15. //取得子串集
  16. for($i=0;$i<=$max_length;$i++)
  17. {
  18. $str_tmp[] = mb_substr($sstr, $i, $length);
  19. }
  20. //去除重复子串
  21. $str_tmp = array_unique($str_tmp);
  22. //计算出现次数
  23. foreach($str_tmp as $key=>$value)
  24. {
  25. $cnt_tmp = mb_substr_count($sstr,$value);
  26. if($cnt_tmp>=$cnt)
  27. {
  28. $cnt = $cnt_tmp;
  29. $str_arr[$value] = $cnt;
  30. }
  31. }
  32. //处理出现多重结果
  33. foreach($str_arr as $key=>$value)
  34. {
  35. if($value == $cnt)
  36. {$str .=$key."
    ";}
  37. }
  38. echo '出现最多的子串是:
    '.$str.'
    出现次数:'.$cnt;
  39. }
  40. ?>

有兴趣的朋友,还可以参考下这篇:php计算未知长度的字符串中出现的次数最多字符的代码

人气教程排行