当前位置:Gxlcms > PHP教程 > 网络爬虫-PHP模拟网络请求

网络爬虫-PHP模拟网络请求

时间:2021-07-01 10:21:17 帮助过:33人阅读

比如我请求百度,我想知道本次共请求了那些资源,包括图片,JS,CSS,但又不想FILE_GET_CONTENT以后拿这些然后在用正则分析,有更好的办法吗?

回复内容:

比如我请求百度,我想知道本次共请求了那些资源,包括图片,JS,CSS,但又不想FILE_GET_CONTENT以后拿这些然后在用正则分析,有更好的办法吗?

没有这种方法。也许你能找到一个封装好的对象完成你的需求,但是这个对象的内部必然也是通过分析字符串进行统计的。

其实思考一下就知道,你的意图本身是不符合逻辑的。浏览器又怎么样,不也是第一部获取html源码,然后逐行执行,从而逐个请求css, js, image等资源吗?这才是符合事物规律的逻辑,就像是问你一栋楼有多少层,唯一的办法就是数一数,也许有一些仪器能算出来,但是仪器的工作原理也是一层一层的数。

程序是建立在逻辑的基础上的,开发功能的时候可以不用别人造好的轮子,但是不等于你可以抹杀那个轮子所代表的逻辑。

无论用哪种方式,都要稍微做一些工作的。

建议使用 simplehtmldom

人气教程排行