451 Star 3.5K Fork 858

PaddlePaddle / PaddleOCR

 / 详情

识别结果数据中,没有文字方向数据啊,是30度还是-45度?但看矩形四个顶点毫无用处,怎么没有旋转角度数据呢?

待办的
创建于  
2024-03-08 10:43

识别结果数据中,没有文本框方向数据啊!
---问题-----
result = ocr.ocr(img_path, cls=True)
[[[487.0, 438.0], [547.0, 436.0], [571.0, 1243.0], [511.0, 1244.0]], ('土地整治与土壤修复研究中心', 0.975981593132019)]
四个坐标点看不出文字是横向还是竖向的,很多情况下需要给出这个角度才能很好的还原当时情况!

---目前临时方案----------
这个方案的只能靠赌博了,大部分情况下是对的。
假设文字是正方形的,计算文本框矩形的宽和高,如果:num=宽/高,且约等于文字的个数,则是横向的,如果mun的倒数约等于文字的个数则是竖向的,但这个方案不准确。

---未来希望的解决方案-------
起始这个问题也很好解决,不需要增加额外的数据输出,只需要将四个点的数据按照文本方向的规则顺序输出则可,
四个点:(文本起始位上,文本结束位上,文本结束位下,文本起始位下),这样即可轻易计算出文本框与水平x轴方向的夹角,请百度研发人员出来说两句!

评论 (0)

微笑浆糊 创建了任务

登录 后才可以发表评论

状态
负责人
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
参与者(1)
8353425 songxh2 1625842031
Python
1
https://gitee.com/paddlepaddle/PaddleOCR.git
git@gitee.com:paddlepaddle/PaddleOCR.git
paddlepaddle
PaddleOCR
PaddleOCR

搜索帮助