时间:2021-07-01 10:21:17 帮助过:25人阅读
2. 问题解决 我们首先想到的解决办法是添加索引,对拍卖公司字段添加索引,但是因为日期是大于7月1号,小于10月31号,在这里用索引的效率很低,
并且要重复的查询出来五十家公司,效率很低,有没有好的解决方案呢???
3.解决问题思路 1.查询五百条数据,我们会发现内存不够用,这时候我们只查询一百万条数据,分五次处理完毕。 2.因为这一百万条数据在内存中,把这一百万条数据放到list中去,同时把五十家拍卖公司组合成字符串,然后for循环每一条数据,
比较拍卖公司是否在字符串中,比较日期是否大于7月一号,小于10月31号。这样去处理,避免数据查询的速度慢。提高数据处理效率。 4.感想: 好的解决问题的思路胜过好的解决问题的人
Python 爬虫 大量数据清洗 ---- sql语句优化
标签:添加 方案 处理 bsp post for color 公司 name