Scrapyrt 为 Scrapy 提供了一个调度的 HTTP 接口,有了它,我们就不需要再执行 Scrapy 命令而是通过请求一个 HTTP 接口来调度 Scrapy 任务了。Scrapyrt 比 Scrapyd 更轻量,如果不需要分布式多任务的话,可以简单使用 Scrapyrt 实现远程 Scrapy 任务的调度。
1. 相关链接
2. pip 安装
这里推荐使用 pip 安装,命令如下:
1 |
pip3 install scrapyrt |
接下来,在任意一个 Scrapy 项目中运行如下命令来启动 HTTP 服务:
1 |
scrapyrt |
运行之后,会默认在 9080 端口上启动服务,类似的输出结果如下:
1 |
scrapyrt |
如果想更换运行端口,可以使用 \-p
参数,如:
1 |
scrapyrt -p 9081 |
这样就会在 9081 端口上运行了。
3. Docker 安装
另外,Scrapyrt 也支持 Docker。比如,要想在 9080 端口上运行,且本地 Scrapy 项目的路径为 /home/quotesbot,可以使用如下命令运行:
1 |
docker run -p 9080:9080 -tid -v /home/user/quotesbot:/scrapyrt/project scrapinghub/scrapyrt |
这样同样可以在 9080 端口上监听指定的 Scrapy 项目。
来源:https://cuiqingcai.com/5456.html