scrapy下载大文件失败问题

03-13 python/机器&深度学习/人工智能 797

由于scrapy并发请求过多，默认情况下会同时下载16个文件，而连接时间默认超过三分钟就会丢失。就是说如果三分钟之内你的网速没法支持你同时下载完16个文件的话就会造成这个问题。

解决方法就是在settings.py中将默认并发连接数调小或者将timeout时间调大

CONCURRENT_REQUESTS = 2
DOWNLOAD_TIMEOUT=1800

此时并发请求被调成2，等待时间被1800秒，一般的视频和图片是没有问题了。

微信公众号

手机浏览(小程序)

分享到：