5 Star 27 Fork 10

MindSpore Lab / mindocr

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
ctw1500.md 1.39 KB
一键复制 编辑 原始数据 按行查看 历史
Shah Jahan Ishaq 提交于 2023-07-06 17:50 . Fix docs links (#477)

SCUT-CTW1500 数据集

数据下载

文本检测数据集(SCUT-CTW1500)下载链接

请从上述网站下载数据并解压缩文件。解压文件后,数据结构应该是这样的:

ctw1500
 ├── ctw1500_train_labels
 │   ├── 0001.xml
 │   ├── 0002.xml
 │   ├── ...
 ├── gt_ctw_1500
 │   ├── 0001001.txt
 │   ├── 0001002.txt
 │   ├── ...
 ├── test_images
 │   ├── 1001.jpg
 │   ├── 1002.jpg
 │   ├── ...
 ├── train_images
 │   ├── 0001.jpg
 │   ├── 0002.jpg
 │   ├── ...

数据准备

检测任务

要准备用于文本检测的数据,您可以运行以下命令:

python tools/dataset_converters/convert.py \
    --dataset_name ctw1500 --task det \
    --image_dir path/to/ctw1500/train_images/ \
    --label_dir path/to/ctw1500/ctw_1500_train_labels \
    --output_path path/to/ctw1500/train_det_gt.txt
python tools/dataset_converters/convert.py \
    --dataset_name ctw1500 --task det \
    --image_dir path/to/ctw1500/test_images/ \
    --label_dir path/to/ctw1500/gt_ctw_1500 \
    --output_path path/to/ctw1500/test_det_gt.txt

运行后,在文件夹 ctw1500/ 下有两个注释文件 train_det_gt.txttest_det_gt.txt

返回dataset converters

1
https://gitee.com/mindspore-lab/mindocr.git
git@gitee.com:mindspore-lab/mindocr.git
mindspore-lab
mindocr
mindocr
main

搜索帮助