代码拉取完成,页面将自动刷新
识别结果数据中,没有文本框方向数据啊!
---问题-----
result = ocr.ocr(img_path, cls=True)
[[[487.0, 438.0], [547.0, 436.0], [571.0, 1243.0], [511.0, 1244.0]], ('土地整治与土壤修复研究中心', 0.975981593132019)]
四个坐标点看不出文字是横向还是竖向的,很多情况下需要给出这个角度才能很好的还原当时情况!
---目前临时方案----------
这个方案的只能靠赌博了,大部分情况下是对的。
假设文字是正方形的,计算文本框矩形的宽和高,如果:num=宽/高,且约等于文字的个数,则是横向的,如果mun的倒数约等于文字的个数则是竖向的,但这个方案不准确。
---未来希望的解决方案-------
起始这个问题也很好解决,不需要增加额外的数据输出,只需要将四个点的数据按照文本方向的规则顺序输出则可,
四个点:(文本起始位上,文本结束位上,文本结束位下,文本起始位下),这样即可轻易计算出文本框与水平x轴方向的夹角,请百度研发人员出来说两句!