1 Star 0 Fork 12

hujianjun_d00d / Datawhale-Tianchi-NLP-Tutorial

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

零基础入门NLP-新闻文本分类

模型

  • TextCNN
  • TextRNN
  • HAN
  • BERT

目录

├── bert                # BERT预训练  
├── config              # 模型配置    
├── data                # 训练数据   
├── docs                # 教程文档   
├── emb                 # 词向量以及BERT权重    
├── module              # 模块相关代码    
├── src                 # 训练相关代码   
├── preprocessing.py    # 预处理   
├── README.md           # 说明文档  
├── train.py            # 训练代码  
├── train.sh            # 训练脚本  
└── word2vec.py         # word2vec训练代码  

依赖

  • fitlog
  • gensim
  • pandas
  • pytorch == 1.2.0
  • transformers == 2.9.0
  • tensorflow == 1.12

快速开始

  1. 将数据和词向量分别放在dataemb目录下,初始化fitlog fitlog init .
  2. 运行预处理代码python preprocessing.py
  3. 运行训练脚本bash train.sh

关于Datawhale

Datawhale是一个专注于数据科学与AI领域的开源组织,汇集了众多领域院校和知名企业的优秀学习者,聚合了一群有开源精神和探索精神的团队成员。Datawhale 以“for the learner,和学习者一起成长”为愿景,鼓励真实地展现自我、开放包容、互信互助、敢于试错和勇于担当。同时 Datawhale 用开源的理念去探索开源内容、开源学习和开源方案,赋能人才培养,助力人才成长,建立起人与人,人与知识,人与企业和人与未来的联结。

欢迎关注:

空文件

简介

取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
Python
1
https://gitee.com/hujianjun_d00d/Datawhale-Tianchi-NLP-Tutorial.git
git@gitee.com:hujianjun_d00d/Datawhale-Tianchi-NLP-Tutorial.git
hujianjun_d00d
Datawhale-Tianchi-NLP-Tutorial
Datawhale-Tianchi-NLP-Tutorial
master

搜索帮助