1 Star 0 Fork 0

青林 / antispider

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

antispider 为书籍《Python3 反爬虫原理与绕过实战》配套代码

详细目录和封面预览

前往掘金社区查看

前往微信公众号查看

本书共 10 章,除第 1 章环境安装配置外和第 3 章爬虫与反爬虫之外,其他章节涉及的 Python 代码均记录在 antispider 中。包括:

  • 第 2 章 WEB网站的构成和页面渲染
  • 第 4 章 信息校验型反爬虫
  • 第 5 章 动态渲染反爬虫
  • 第 6 章 文本混淆反爬虫
  • 第 7 章 特征识别反爬虫
  • 第 8 章 APP 反爬虫
  • 第 9 章 验证码
  • 第 10 章 综合知识

编号说明

章节与对应代码以数字表示,如第 1 章对应 01 目录。9.1 小节对应 09/9-1 目录。

文件名说明

同一小节的代码文件名为该节编号,但考虑到每个小节会有多段代码,所以以英文 one two three 命名。 如 9.1.1 小节出现的第一段 Python 代码的文件名为 9-1-1-one.py,第二段 Python 代码的文件名为 9-1-1-two.py。

特别说明

1、书中部分代码有固定的文件名称,如 Custom64,那么该文件的名称就是 custom64.py。

2、验证码实现的 HTML/CSS/JS 代码存放在目录 09 中,目录名称为 captcha。

3、部分案例中包含图片或密钥文件,文件已存储在指定目录。

代码运行说明

antispider 项目中的代码均经过运行验证,与书本所述相同。使用时只需要搭配书本所述运行即可。

版权说明

antispider 项目所包含的代码为图书配套代码,仅供书籍读者个人学习研究所用,任何个人与机构不得以任何方式摘抄、转载、公开项目代码。

README 更新记录

2020-05-29 很多读者反馈第九章用于训练验证码的示例图片下载链接失效,经过核查发现文件还在,但链接莫名其妙的被微云替换了,新链接为 https://share.weiyun.com/5ptKIUg

百度网盘的字符验证码素材: https://pan.baidu.com/s/1LoQTK51RHbdXSrJ0o8uxqA 密码: tl5i

空文件

简介

暂无描述 展开 收起
HTML 等 4 种语言
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
1
https://gitee.com/huapenghui/antispider.git
git@gitee.com:huapenghui/antispider.git
huapenghui
antispider
antispider
master

搜索帮助