1 Star 0 Fork 10

chen / mindocr

forked from MindSpore Lab / mindocr 
加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
ic19_art.md 1.13 KB
一键复制 编辑 原始数据 按行查看 历史
Shah Jahan Ishaq 提交于 2023-07-06 17:50 . Fix docs links (#477)

ICDAR2019 ArT 数据集

数据集下载

ICDAR2019 ArT数据集 官网 | 下载链接

注意: 在下载之前,请先注册一个账号。

图像需要下载“任务1和任务3”部分中的存档文件train_images.tar.gz。注释需要下载同一节中的.JSON文件train_labels.json

请从上述网站下载数据并解压缩文件。解压文件后,数据结构应该是这样的:

ICDAR2019-ArT
  |--- train_images
  |    |--- train_images
  |    |    |--- gt_0.jpg
  |    |    |--- gt_1.jpg
  |    |    |--- ...
  |--- train_labels.json

数据准备

检测任务

要准备用于文本检测的数据,您可以运行以下命令:

python tools/dataset_converters/convert.py \
    --dataset_name ic19_art --task det \
    --image_dir path/to/ICDAR2019-ArT/train_images/train_images/ \
    --label_dir path/to/ICDAR2019-ArT/train_labels.json \
    --output_path path/to/ICDAR2019-ArT/det_gt.txt

运行后,在文件夹ICDAR2019-ArT/下会生成注释文件det_gt.txt

返回dataset converters

1
https://gitee.com/zhenling2023/mindocr.git
git@gitee.com:zhenling2023/mindocr.git
zhenling2023
mindocr
mindocr
main

搜索帮助