当前位置：Gxlcms > Python > Python使用scrapy采集时伪装成HTTP/1.1的方法

Python使用scrapy采集时伪装成HTTP/1.1的方法

时间：2021-07-01 10:21:17 帮助过：9人阅读

本文实例讲述了Python使用scrapy采集时伪装成HTTP/1.1的方法。分享给大家供大家参考。具体如下：

添加下面的代码到 settings.py 文件

代码如下:

DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.HTTPClientFactory'

保存以下代码到单独的.py文件

代码如下:

from scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetter
class PageGetter(ScrapyHTTPPageGetter):
def sendCommand(self, command, path):
self.transport.write('%s %s HTTP/1.1\r\n' % (command, path))
class HTTPClientFactory(ScrapyHTTPClientFactory):
protocol = PageGetter

希望本文所述对大家的Python程序设计有所帮助。

< 上一篇
Python正则表达式匹配HTML页面编码
下一篇 >
解析Python中的变量、引用、拷贝和作用域的问题

人气教程排行

384次 1 对Python2.7pandas中的read_excel详解
383次 2 Python实现定时弹窗提醒
383次 3 python爬虫入门（3）--利用requests构建知乎API
382次 4 python如何爬取搜狗微信公众号文章永久链接的思路解析
381次 5 python字典的键可以相同吗
381次 6 python是一种面向什么的语言？
381次 7 python通过pil为png图片填充上背景颜色的方法
380次 8 python语言的编程模式有什么
380次 9 使用python获取进程pid号的方法
380次 10 Python中如何解决无限循环的问题
378次 11 怎么解决pip不是内部或外部命令
378次 12 python中def是什么意思
376次 13 对numpy中数组元素的统一赋值实例
374次 14 python的选择语句是什么语句
374次 15 Python中构造方法的解析（附示例）
373次 16 关于python中引入导入与自定义模块以及外部文件的实例分享
372次 17 python如何在不同类之间调用方法
372次 18 python中的【//】是什么运算符号
371次 19 python中╲t是什么
371次 20 python同时给多个变量赋值