1 Star 0 Fork 0

fysama / transformers-code

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

手把手带你实战Transformers

简介

手把手带你实战Transformers课程的代码仓库

代码适配

  • transformers==4.36.2

课程规划

  • 基础入门篇:Transformers入门,从环境安装到各个基础组件的介绍,包括Pipeline、Tokenizer、Model、Datasets、Evaluate、Trainer,并通过一个最基本的文本分类实例将各个模块进行串讲

  • 实战演练篇:Transformers实战,通过丰富的实战案例对Transformers在NLP任务中的解决方案进行介绍,包括命名实体识别、机器阅读理解、多项选择、文本相似度、检索式对话机器人、掩码语言模型、因果语言模型、摘要生成、生成式对话机器人

  • 高效微调篇:Transformers模型高效微调,以PEFT库为核心,介绍各种常用的参数高效微调方法的原理与实战,包括BitFit、Prompt-tuning、P-tuning、Prefix-Tuning、Lora和IA3

  • 低精度训练篇:Transformers模型低精度训练,基于bitsandbytes库,进行模型的低精度训练,包括LlaMA2-7B和ChatGLM2-6B两个模型的多个不同精度训练的实战演练,包括半精度训练、8bit训练、4bit训练(QLoRA)

  • 分布式训练篇:Transformers模型分布式训练,基于accelerate库讲解transformers模型的分布式训练解决方案,介绍分布式训练的基本原理以及accelerate库的基本使用方式,包括与Deepspeed框架的集成

  • 对齐训练篇: ...

  • 性能优化篇: ...

  • 系统演示篇: ...

课程地址

课程视频发布在B站与YouTube,代码与视频会逐步进行更新,目前课程主要更新在B站,YouTube后续会持续更新

Transformers 基础入门篇 (已更新完成)

Transformers 实战演练篇 (已更新完成)

  • 08 基于 Transformers的 NLP解决方案

  • 09 实战演练之 命名实体识别

  • 10 实战演练之 机器阅读理解(上,过长截断策略)

  • 10 实战演练之 机器阅读理解(下,滑动窗口策略)

  • 11 实战演练之 多项选择

  • 12 实战演练之 文本相似度(上,基于交互策略)

  • 12 实战演练之 文本相似度(下,基于匹配策略)

  • 13 实战演练之 检索式对话机器人

  • 14 实战演练之 预训练模型

  • 15 实战演练篇之 文本摘要(上,基于T5模型)

  • 15 实战演练篇之 文本摘要(下,基于GLM模型)

  • 16 实战演练篇之 生成式对话机器人(基于Bloom)

Transformers 参数高效微调篇 (已更新完成)

Transformers 低精度训练篇(已更新完成)

  • 24 低精度训练与模型下载

  • 25 半精度模型训练(上,基于LLaMA2的半精度模型训练)

  • 25 半精度模型训练(下,基于ChatGLM3的半精度模型训练)

  • 26 量化与8bit模型训练

  • 27 4bit量化与QLoRA模型训练

Transformers 分布式训练篇

Transformers 番外技能篇

  • 基于Optuna的Transformers模型自动调参

Star History

Star History Chart

请作者喝杯奶茶

空文件

简介

暂无描述 展开 收起
Jupyter Notebook 等 2 种语言
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/fysama/transformers-code.git
git@gitee.com:fysama/transformers-code.git
fysama
transformers-code
transformers-code
master

搜索帮助