时间:2021-07-01 10:21:17 帮助过:1人阅读
链接池功能:1、 存储链接;2、 对链接去重;3、对链接设置优先级。
实践方案有:1、保存在数据库;2、redis;3、内存集合;4、队列。
链接池和抓取调度的代码怎么写?
链接池功能:1、 存储链接;2、 对链接去重;3、对链接设置优先级。
实践方案有:1、保存在数据库;2、redis;3、内存集合;4、队列。
链接池和抓取调度的代码怎么写?
先将所有待爬取的链接取到,然后将每个链接的抓取动作放到队列中,推荐使用beanstalk,最后又队列执行这些动作。