一个比较全面的截取函数(多用于采集内容的分析)
时间:2021-07-01 10:21:17
帮助过:4人阅读
/* - 采集截取函数,主要用于分析采集的内容
- getcon - 截取后去掉html字符,并去掉空格
- getcon2 - 单纯截取,直接返回截取内容。
- 参数:
- $par可接受两种格式:
- 1.前面字符{DATA}后面字符
- 2.正则表达式
- */
function getcon($pat,$str){ - $title_var=explode("{DATA}",$pat);
- if(count($title_var)>1){
- $title_1=explode($title_var[0],$str);
- $title_2=explode($title_var[1],$title_1[1]);
- return strip_s(strip_tags($title_2[0]));
- }else{
- preg_match_all($pat,$str,$res);
- return strip_s(strip_tags($res[1][0]));
- }
- }
-
- function getcon2($pat,$str){
- $title_var=explode ("{DATA}",$pat);
- if(count($title_var)>1){
- $title_1=explode($title_var[0],$str);
- $title_2=explode($title_var[1],$title_1[1]);
- return $title_2[0];
- }else{
- preg_match_all($pat,$str,$res);
- return $res[1][0];
- }
- }
-
- function strip_s($str){
- $str = preg_replace ("/(\s+)/", ' ', $str);
- $str = str_replace(chr(13),'',$str);
- $str = str_replace(chr(10),'
',$str); - $str = ltrim($str);
- $str = trim($str);
- return $str;
- }
- ?>
|