- function check_html($html) {
- preg_match_all("/<([a-zA-Z0-9]+)\\s*[^\\/>]*>/",$html,$start_tags);
- preg_match_all("/<\\/([a-zA-Z0-9]+)>/", $html, $end_tags);
- if(count($start_tags[1]) != count($end_tags[1])) return false;
- for($i = 0; $i < count($start_tags[1]); $i++) {
- if(!in_array($start_tags[1][$i], $end_tags[1])) return false;
- }
- return true;
- }
解释:
/<([a-zA-Z0-9]+)\\s*[^\\/>]*>/这个模式是用来匹配HTML的标记(如:、、等等,但是除了 这种)的,并且在$start_tags保持着标签的名字(如:head、div等)。而/<\\/([a-zA-Z0-9]+)>/这个模式是用来匹配闭合的HTML标记(如:,等)的。并且在$end_tags中保持这闭合的标签名。然后我们用count($start_tags[1]) != count($end_tags[1])这个条件语句来判断开始的标记跟闭合的标记是否相等,不相等就说明没闭合。最后用in_array($start_tags[1][$i], $end_tags[1])来判断开始标跟闭合的标记是否相等。至此,我们就完成了HTML的匹配了! |