时间:2021-07-01 10:21:17 帮助过:23人阅读
2.关于编码和解码
#!/usr/bin/env python # _*_ encoding:utf-8 _*_ import chardet a="天天" print chardet.detect(a) 结果: {‘confidence‘: 0.75249999999999995, ‘encoding‘: ‘utf-8‘}
import urllib from chardet.universaldetector import UniversalDetector usock = urllib.urlopen(‘http://www.baidu.com/‘) #创建一个检测对象 detector = UniversalDetector() for line in usock.readlines(): #分块进行测试,直到达到阈值 detector.feed(line) if detector.done: break #关闭检测对象 detector.close() usock.close() #输出检测结果 print detector.result 运行结果: {‘confidence‘: 0.99, ‘encoding‘: ‘GB2312‘}
>>> name="天天" >>> name ‘\xe5\xa4\xa9\xe5\xa4\xa9‘ #天天 汉字的gbk码 >>> b=name.decode(‘gbk‘) >>> b u‘\u6fb6\u2541\u3049‘ >>> c=b.encode(‘utf8‘) >>> c ‘\xe6\xbe\xb6\xe2\x95\x81\xe3\x81\x89‘ —————————————————————————— >>> ‘\xcc\xec\xcc\xec‘.decode(‘gbk‘) u‘\u5929\u5929‘ >>> ‘\xcc\xec\xcc\xec‘.decode(‘gbk‘).encode(‘utf8‘) ‘\xe5\xa4\xa9\xe5\xa4\xa9‘ >>> ‘天天‘ ‘\xe5\xa4\xa9\xe5\xa4\xa9‘
python字符集的转换(mysql数据乱码的处理)
标签:乱码问题 passwd 数据转换 try 提高 pen bsp pre admin