当前位置:Gxlcms > html代码 > 这个网页是如何取得实际数据的?_html/css_WEB-ITnose

这个网页是如何取得实际数据的?_html/css_WEB-ITnose

时间:2021-07-01 10:21:17 帮助过:35人阅读

我在做些从网页中采集数据的程序。例如股票数据吧,例如这个网页:
http://stock.jrj.com.cn/share,600036.shtml
可以看到页面一部分是这样的:


我想把这些部分数据用程序采集下来:
昨收:18.36元 最高:18.86元 涨停:20.20元
今开:18.60元 最低:18.41元 跌停:16.52元

数据采集的思路很容易,取回它的html,再分析提取就可以了。我希望取回的html是这样:
......
昨收:18.36元
最高:18.86元
涨停:20.20元
......
这样我就好做分析和提取了。但我检查了上述页面,它的html居然是这样的:
......
昨收:--
最高:--
涨停:--
......
没有具体数据在html里面。我就没法从这个html提取我要的数据了。
它的数据好像是调用不知道什么地方然后实时从网上取得的。因为如果我断开网络,打开这个html文件,它就是这样的情况:

所有的数据都变“--”了。如果连上网络就正常了。我很想搞清楚这个网页到底是如何取得数据的?是调了哪个js函数吗?怎么知道是哪个?貌似跟标签有关?因为如果我去掉这些标签之后,不管有没有联网,浏览器显示也是上图这样了。但标签我百度了下,不是这是强调用只是影响字体的吗?怎么会跟数据有关系呢?我不太懂html和css,请大家指教,告诉我这个网页的实时数据是怎么取到的?非常感谢!


回复讨论(解决方案)

http://www.cnblogs.com/me115/archive/2011/05/09/2040826.html
http://hq.sinajs.cn/list=sh600036

这是用ajax技术做的
去看看ajax方面的资料你就明白了

http://www.cnblogs.com/me115/archive/2011/05/09/2040826.html
http://hq.sinajs.cn/list=sh600036


这个文章我也看过,但我要提取的不只是股票信息。我只是举个例子。我就是想有个办法提取像1楼那样网页的数据

这是ajax加载过来的,你要找到数据源(那些数据的真正url)

这是ajax加载过来的,你要找到数据源(那些数据的真正url)


我就是问如何找这些真正的数据源?

http://qmx.jrjimg.cn/stocks/pubdata/hotHqData.js

分析脚本
浏览器 f12 Network标签页 看记录

人气教程排行