配置文件路径错误
from scrapy.cmdline import execute
execute((['scrapy','crawl','mingyan','--nolog']))
SCHEDULER = "scrapy_redis.scheduler.Scheduler" 调度器类
DUPEFILTER_CLASS = 'PolicyRobot.dupefilter.SplashAwareDupeFilter'指纹生成、去重类
SCHEDULER_PERSIST = True 持久化请求队列、指纹集合 可以暂停、恢复、爬取
SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.FifoQueue' 使用优先级调度请求队列
COOKIES_ENABLED = False cookie状态保持
SCHEDULER_IDLE_BEFORE_CLOSE = 0 最大空闲防止分布式爬虫因为等待而关闭
https://www.cnblogs.com/nixingguo/articles/7253200.html
ValueError: signal only works in main thread
本人使用 flask + scrapy 搭建爬虫简易测试接口
前端向后端传递 url 以及对应的 xpath 规则
搭建后进行测试出现上述问题
最后得出结论,访问接口,在其返回数据给前端之前,如果要开启爬虫程序,需要单独在一个进程之中运行
Splash提供的Web页面输入网址无法渲染问题解决
思路提供 https://www.jianshu.com/p/72b0663f6dea
资源未正确加载,下面展示如何解决这个BUG
1、全局搜索 splash/resources.py文件
这里有两种处理方式,一种进入容器内部修改,一种在宿主机修改,容器修改经测试是暂时性的,删除容器后就失效了。主机修改永久有效
以root身份进入容器
docker exec -it --user root xxx /bin/bash
find / -name "resources.py"
宿主机修改,搜索方式命令一样,需要修改的文件
只需要修改前两个红框内的文件
2、修改容器对应的文件
这里需要主机和容器文件复制传递
docker cp containerid:xxx xxx
docker cp xxx containerid:xxx
需要修改的三个资源关键字,修改对应的 script 标签里的 src
使用的 cdn 网站 https://www.bootcdn.cn/
jquery-migrate | jquery-migrate | https://cdn.bootcdn.net/ajax/libs/jquery-migrate/1.2.1/jquery-migrate.js |
---|---|---|
jquery-1.11.1.min.js | jquery | https://cdn.bootcdn.net/ajax/libs/jquery/1.11.1/jquery.min.js |
maxcdn.bootstrapcdn.com/bootstrap/3.2.0/js/bootstrap.min.js | twitter-bootstrap | https://cdn.bootcdn.net/ajax/libs/twitter-bootstrap/3.2.0/js/bootstrap.min.js |
3、重新启动容器
docker stop xxx
docker start xxx
docker run -d -p 8050:8050 --name xxx imagename 或者重新创建容器
4、验证
可以正常显示了
5、上传到 docker hub
参考 https://blog.csdn.net/yuhui123999/article/details/82220093
在 https://hub.docker.com/ 创建自己的账户,并且创建一个开放仓库
docker login #输入账户名和密码 docker commit my-splash woainizyl/xxx
docker images 查看自己生成的镜像
docker tag woainizyl/xxx woainizyl/dockerhub仓库名字
docker push wozinizyl/zh-splash
根据上面的图片可知已经上传成功了
拉镜像
docker pull woainizyl/zh-splash
splash添加cookie
docker查看容器的文件位置
docker inspect container_ID
北国的莽原简直是一个谜,黑色的森林直铺到更空旷的冻土荒原,这是一个谜。河流向北流去,不知所踪,这是同一个谜。一个人向森林走去,不知道为什么,这也是同一个谜。河边上有一块巨石,水下的沉木千年不腐,这还是同一个谜。空旷,孤独,白色的冰雪世界令人神往,这就是那个谜
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。