当前位置:Gxlcms > html代码 > 【Jsoup】doc.getElementsByTag("img");无法获得验证码图片<img/>_html/css_WEB-ITnose

【Jsoup】doc.getElementsByTag("img");无法获得验证码图片<img/>_html/css_WEB-ITnose

时间:2021-07-01 10:21:17 帮助过:34人阅读

里面的元素
    



m.abchina.com

全国24小时服务热线:95599

中国农业银行版权所有

m.abchina.com
全国24小时服务热线:95599
中国农业银行版权所有



这个页面的所有元素,只能取得
 

而无法取到


使用 doc.select("[src]"); 也无法得到此


回复讨论(解决方案)

jsoup是不是无法获得验证码的元素?
我这边需要获得验证码图片,想到的解决方法是:取得验证码图片元素,并得到它的“src”,
这样来得到验证码图片。

还有没有其他方法获得呢?谢谢了!


没人回答呀!!!!

1.你贴的源码是 浏览器复制的,还是jsoup采集下来打印的

2,如果是复制的,那么请使用jsoup 访问并打印,看看是否存在你说的那个img

3,按照你的描述应该是不存在你说的img,这个img可能是js生成的。

4如果是js生成的,那么你就要研究一下这个页面的js,然后找到这个生成url的js自己生成一下就ok了

5,得到url之后,需要注意的是,请求这个url的时候,你要保持你这个页面的会话,也就是sessionid,有的网站可能对rf也有要求,建议是使用谷歌浏览器看一下请求的所有参数,然后全部模拟,这样获取的验证码才可能正确

1.你贴的源码是 浏览器复制的,还是jsoup采集下来打印的

2,如果是复制的,那么请使用jsoup 访问并打印,看看是否存在你说的那个img

3,按照你的描述应该是不存在你说的img,这个img可能是js生成的。

4如果是js生成的,那么你就要研究一下这个页面的js,然后找到这个生成url的js自己生成一下就ok了

5,得到url之后,需要注意的是,请求这个url的时候,你要保持你这个页面的会话,也就是sessionid,有的网站可能对rf也有要求,建议是使用谷歌浏览器看一下请求的所有参数,然后全部模拟,这样获取的验证码才可能正确



谢谢回复!
现在问题解决了!
1、代码是jsoup采集下来的;
3、4、这个img应该是js生成的。我无法得到这个页面的js,但猜测到了它的生成方法,最后取到了img;
5、得到url后,我可以直接将这个url在浏览器访问到img,这个url有个参数ebf_cookie,应该就是来保持会话的吧。


刚开始使用学习jsoup,虽然这个问题解决了,但是我一开始没意识到这是img可能是由js生成的。你这分析问题的方法很好,值得学习,谢谢回复!我要结贴了。

人气教程排行