登录
注册
开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们
开源
企业版
高校版
私有云
Gitee AI
NEW
我知道了
查看详情
登录
注册
代码拉取完成,页面将自动刷新
开源项目
>
WEB应用开发
>
Web爬虫
&&
捐赠
捐赠前请先登录
取消
前往登录
扫描微信二维码支付
取消
支付完成
支付提示
将跳转至支付宝完成支付
确定
取消
Watch
不关注
关注所有动态
仅关注版本发行动态
关注但不提醒动态
1.2K
Star
4.8K
Fork
1.9K
GVP
黄亿华
/
webmagic
代码
Issues
62
Pull Requests
5
Wiki
统计
流水线
服务
Gitee Pages
JavaDoc
质量分析
Jenkins for Gitee
腾讯云托管
腾讯云 Serverless
悬镜安全
阿里云 SAE
Codeblitz
我知道了,不再自动展开
全部
全部
清除搜索筛选条件
看板
里程碑
全部
开启的
62
进行中
0
已完成
10
已关闭
0
排序
默认排序
最新创建
最早创建
最近更新
最早更新
高优先级
低优先级
优先级
不指定
严重
主要
次要
不重要
里程碑
无里程碑
标签
无标签
负责人
创建者
解析器正则匹配时,无法取到值
#IKE39
风中.
是否支持抓取浏览器向下滚动,动态加载数据的列表页?
#IJ6DY
Jin
线程控制间隔有办法实现吗
#IJ543
嘉文
动态ip代理
#IH7LB
孤独追梦
3
线程死锁bug
#IGS5M
ZDL
是否添加下载图片等的内容
#IGF6K
xiaolu
0.7.3版本: maven依赖下载失败
#IFSDF
阿林
css选择对class的支持不够啊
#IFICX
Morty
webmagic-selenium遇到302重定向会报错,请问该如何解决
#IF34A
888888
是不是对xpath支持的不全啊
#IEVD9
Lison
1
是否支持js点击事件
#IEEVB
bruce.ts
1
大并发下会报org.apache.http.conn.ConnectionPoolTimeoutException: Timeout waiting fo...
#IDW4S
栈道
模拟登陆添加cookie不能使用
#IDUC0
xiamaoxuan
1
爬去的网页里有 如何去掉呢?替换空格或正则均没能成功去除
#IDMKZ
焉知丧失
2
0.7.1 Request 没有实现序列化报错
#IDGIW
luchatex
1
UrlUtils.fixAllRelativeHrefs会过滤掉迅雷下载链接
#ID821
aceasm
1
抓取地址的时候是否能自己保存网站cookies呢?
#ICYUU
Skqing
1
跟spring配合使用的时候保存数据并不是很舒服
#ICY6D
Skqing
项目中lib目录没看到
#IC251
shunsong_li
1
Spider的processRequest处理pageProcessor能不能做成像责任链那样?
#IBTUD
ihuotui
1
Java
1
https://gitee.com/flashsword20/webmagic.git
git@gitee.com:flashsword20/webmagic.git
flashsword20
webmagic
webmagic
点此查找更多帮助
搜索帮助
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
评论
仓库举报
回到顶部
登录提示
该操作需登录 Gitee 帐号,请先登录后再操作。
立即登录
没有帐号,去注册