当前位置：Gxlcms > Python > Python基于scrapy采集数据时使用代理服务器的方法

Python基于scrapy采集数据时使用代理服务器的方法

时间：2021-07-01 10:21:17 帮助过：51人阅读

本文实例讲述了Python基于scrapy采集数据时使用代理服务器的方法。分享给大家供大家参考。具体如下：

# To authenticate the proxy, 
#you must set the Proxy-Authorization header. 
#You *cannot* use the form http://user:pass@proxy:port 
#in request.meta['proxy']
import base64
proxy_ip_port = "123.456.789.10:8888"
proxy_user_pass = "awesome:dude"
request = Request(url, callback=self.parse)
# Set the location of the proxy
request.meta['proxy'] = "http://%s" % proxy_ip_port
# setup basic authentication for the proxy
encoded_user_pass=base64.encodestring(proxy_user_pass)
request.headers['Proxy-Authorization'] = 'Basic ' + encoded_user_pass

希望本文所述对大家的python程序设计有所帮助。

< 上一篇
在Python的Flask框架中实现全文搜索功能
下一篇 >
python类继承与子类实例初始化用法分析

人气教程排行

384次 1 对Python2.7pandas中的read_excel详解
383次 2 Python实现定时弹窗提醒
383次 3 python爬虫入门（3）--利用requests构建知乎API
382次 4 python如何爬取搜狗微信公众号文章永久链接的思路解析
381次 5 python字典的键可以相同吗
381次 6 python是一种面向什么的语言？
381次 7 python通过pil为png图片填充上背景颜色的方法
380次 8 python语言的编程模式有什么
380次 9 使用python获取进程pid号的方法
380次 10 Python中如何解决无限循环的问题
378次 11 怎么解决pip不是内部或外部命令
378次 12 python中def是什么意思
376次 13 对numpy中数组元素的统一赋值实例
374次 14 python的选择语句是什么语句
374次 15 Python中构造方法的解析（附示例）
373次 16 关于python中引入导入与自定义模块以及外部文件的实例分享
372次 17 python如何在不同类之间调用方法
372次 18 python中的【//】是什么运算符号
371次 19 python中╲t是什么
371次 20 python同时给多个变量赋值