当前位置：Gxlcms > Python > python正则表达式中的中文匹配例子

python正则表达式中的中文匹配例子

时间：2021-07-01 10:21:17 帮助过：97人阅读

#coding=utf-8 
import re 
from urllib2 import urlopen 
webpage = urlopen('http://www.baidu.com')       #获取百度页面的信息
text = webpage.read()                           #读取为文本
tmp = text.decode('utf8')                       #对原文本进行utf8转码, 此处要跟代码的编码格式一致
pat = '<title>(.*)?([\u4e00-\u9fa5]*)?</title>' #对中文进行匹配
re.escape(pat)                                  #对匹配模式中需要转义的符号进行转义
pat = re.compile(pat)                           #compile一下
m = re.search(pat,tmp) 
title = m.group(1) 
print title 
webpage.close()

人气教程排行

384次 1 对Python2.7pandas中的read_excel详解
383次 2 Python实现定时弹窗提醒
383次 3 python爬虫入门（3）--利用requests构建知乎API
382次 4 python如何爬取搜狗微信公众号文章永久链接的思路解析
381次 5 python字典的键可以相同吗
381次 6 python是一种面向什么的语言？
381次 7 python通过pil为png图片填充上背景颜色的方法
380次 8 python语言的编程模式有什么
380次 9 使用python获取进程pid号的方法
380次 10 Python中如何解决无限循环的问题
378次 11 怎么解决pip不是内部或外部命令
378次 12 python中def是什么意思
376次 13 对numpy中数组元素的统一赋值实例
374次 14 python的选择语句是什么语句
374次 15 Python中构造方法的解析（附示例）
373次 16 关于python中引入导入与自定义模块以及外部文件的实例分享
372次 17 python如何在不同类之间调用方法
372次 18 python中的【//】是什么运算符号
371次 19 python中╲t是什么
371次 20 python同时给多个变量赋值