当前位置：Gxlcms > AJAX > 编码为GB2312网站让AJAX接收的数据显示支持中文
编码为GB2312网站让AJAX接收的数据显示支持中文

时间：2021-07-01 10:21:17 帮助过：44人阅读
代码如下:

<script> 
var xmlHttp; 
var BrowerType="ie"; 
function createXML(){ 
try{ 
xmlHttp = new ActiveXObject("Msxml2.XMLHTTP"); 
} catch (e){ 
try{ 
xmlHttp = new ActiveXObject("Microsoft.XMLHTTP"); 
}catch(e2) { 
xmlHttp =false; 
} 
} 
if (!xmlHttp && typeof XMLHttpRequest != 'undefined'){ 
xmlHttp = new XMLHttpRequest(); 
BrowerType = "ff"; //用于记录是否火狐，以便下面处理接收中文数据分析使用。 
} 
} 
function querytelcode(citys){ 
createXML(); 
showState=document.getElementById("showtelcode"); 
xmlHttp.onreadystatechange = function(){ 
if (xmlHttp.readyState == 2){ 
showState.innerHTML = '<img src="/img/process.gif" />'; 
}else if (xmlHttp.readyState == 4 && xmlHttp.status == 200){ 
if (BrowerType=="ff"){ 
getLastCode=xmlHttp.responseText;//FireFox 
}else{ 
getLastCode=gb2utf8(xmlHttp.responseBody); 
} 
showState.innerHTML = getLastCode; 
} 
} 
var url='myorderAjax.asp?oid=<%=Request.QueryString("orderid")%>&cityname='+citys; 
xmlHttp.open ("GET",url,true); 
if (BrowerType=="ff"){ 
xmlHttp.overrideMimeType("text/html;charset=gb2312");//设定以gb2312编码识别数据，只有FF支持。IE不行 
} 
xmlHttp.send(null); 
} 
function gb2utf8(data){ 
var glbEncode = []; 
gb2utf8_data = data; 
execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript"); 
var t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2"); 
t=t.split("@"); 
var i=0,j=t.length,k; 
while(++i<j) { 
k=t[i].substring(0,4); 
if(!glbEncode[k]) { 
gb2utf8_char = eval("0x"+k); 
execScript("gb2utf8_char = Chr(gb2utf8_char)", "VBScript"); 
glbEncode[k]=escape(gb2utf8_char).substring(1,6); 
} 
t[i]=glbEncode[k]+t[i].substring(4); 
} 
gb2utf8_data = gb2utf8_char = null; 
return unescape(t.join("%")); 
} 
</script> 
 
以下是此篇文章全文： 
XMLHttpRequest 默认是用UTF-8 传递数据。当服务端的返回数据是UTF-8编码的时候，它工作得很好(开发web应用，当服务端和客户端以及数据库统一使用UTF-8编码可以有效的避免乱码问题)。如果服务端设置了正确的Content-Type Response Header以及编码信息，那么XmlHttpRequest也可以正确工作。 
可是当使用XMLHttpRequest读取中文网页内容时， 如果服务端的程序没有设置Content-Type Response Header，或者Header没有设置编码类型，那么我们访问responseText属性的时候就可能遭遇乱码。如以下代码用XMLHttpRequest获取雅虎中国网站的星座站首页: 
 代码如下:
xmlhttp = getXMLHttpRequest(); 
var url = "http://cn.astrology.yahoo.com/";; 
xmlhttp.open("GET", url, true); 
xmlhttp.onreadystatechange = function(){ 
if (xmlhttp.readyState == 4) 
if (xmlhttp.status == 200) 
alert(xmlhttp.responseText); 
}; 
xmlhttp.send(null); 
 
纵使yahoo中国这样专业的网站，对web标准的支持还很不彻底，弹出的html源码中充斥不符合web标准的html标签，当然还有已预见的乱码。 
同样遗憾的是，FireFox 和 IE 的解决方法也是南辕北辙 
FireFox 做法： 
FireFox 的XMLHttpRequest对象支持overrideMimeType方法，可以指定返回数据的编码类型，利用该方法可以解决中文乱码，前面的代码修改如下： 
 代码如下:
xmlhttp = getXMLHttpRequest(); 
var url = "http://cn.astrology.yahoo.com/";; 
xmlhttp.open("GET", url, true); 
xmlhttp.overrideMimeType("text/html;charset=gb2312");//设定以gb2312编码识别数据 
xmlhttp.onreadystatechange = function(){ 
if (xmlhttp.readyState == 4) 
if (xmlhttp.status == 200) 
alert(xmlhttp.responseText); 
}; 
xmlhttp.send(null); 
 
Internet Explorer 做法： 
IE不支持overrideMimeType方法，并且只能用一种很蹩脚的方法来解决，此时需要引入一个杂交的函数： 
 代码如下:
function gb2utf8(data){ 
var glbEncode = []; 
gb2utf8_data = data; 
execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript"); 
var t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2"); 
t=t.split("@"); 
var i=0,j=t.length,k; 
while(++i<j) { 
k=t[i].substring(0,4); 
if(!glbEncode[k]) { 
gb2utf8_char = eval("0x"+k); 
execScript("gb2utf8_char = Chr(gb2utf8_char)", "VBScript"); 
glbEncode[k]=escape(gb2utf8_char).substring(1,6); 
} 
t[i]=glbEncode[k]+t[i].substring(4); 
} 
gb2utf8_data = gb2utf8_char = null; 
return unescape(t.join("%")); 
} 
xmlhttp = getXMLHttpRequest(); 
var url = "http://cn.astrology.yahoo.com/";; 
xmlhttp.open("GET", url, true); 
xmlhttp.onreadystatechange = function(){ 
if (xmlhttp.readyState == 4) 
if (xmlhttp.status == 200) 
alert(gb2utf8(xmlhttp.responseBody)); //注意这里要用responseBody 
}; 
xmlhttp.send(null); 
 
gb2utf8函数直接解析XMLHttpRequest返回的二进制数据，其中要利用execScript方法来执行VBScript的函数。所以说是一个杂交的函数。感谢blueidea论坛 提供的算法。 
虽然有了解决的办法，但形式丑陋，而且不符合web标准。所以应该在编程中尽量避免，如果是开发web应用，应尽量使用UTF-8编码，或者在服务端设置正确的编码信息。至于以上范例，有盗取其他网站内容的嫌疑，更是不为提倡。 
附一篇：讨论： 
原因：AJAX在接收responseText或responseXML的值的时候是按照UTF-8的格式来解码的，如果服务器段发送的数据不是UTF-8的格式，那么接收responseText或responseXML的值有可能为乱码。 
解决办法： 在服务器指定发送数据的格式： 
在jsp文件中： 
response.setContentType("text/text;charset=UTF-8");//返回的是txt文本文件 
或是 
response.setContentType("text/xml;charset=UTF-8");//返回的xml文件 
PHP:header('Content-Type:text/html;charset=GB2312'); 
ASP:Response.Charset("GB2312") 
JSP:response.setHeader("Charset","GB2312"); 
讨论： 
PHP:header('Content-Type:text/html;charset=GB2312'); 
这样写除非是小项目 
大项目都是按照框架走 
对于HEADER定义于config文件最前端解决方案 
在JS里有一个解析utf-8xml的方法写的非常强 
建议用那 
非物理生命 traindiy
编码为GB2312网站让AJAX接收的数据显示支持中文

人气教程排行