100 Star 801 Fork 1.4K

MindSpore / models

 / 详情

[Bug]: Yolov5训练代码报错

DONE
创建于  
2024-05-13 17:46

问题描述

gitee.com/mindspore的model仓里的r2.1及其master分支的yolov5代码的yolo.py文件代码有问题。
在第356行——359行代码会导致报错。
源代码:输入图片说明
本人尝试修改后的代码:
输入图片说明
修改后是可以跑通的。建议后端的专家复现并修改上传的代码,少点bug,以保证一线能正常跑通。

环境信息

  • Hardware Environment(Ascend/GPU/CPU) / 硬件环境: Ascend910B1

Please delete the backend not involved / 请删除不涉及的后端:
/device Ascend

  • Software Environment / 软件环境 (Mandatory / 必填):cann_6.3.2
    -- MindSpore version (e.g., 2.0.0) :mindspore_2.1.0
    -- Python version (e.g., Python 3.7.5) :py_3.7
    -- OS platform and distribution (e.g., Linux Ubuntu 16.04):euler_2.10.7-aarch64

  • Execute Mode / 执行模式 (Mandatory / 必填)(PyNative/Graph): ms.GRAPH_MODE

Please delete the mode not involved / 请删除不涉及的模式:
/mode graph

关联用例

报错截图:输入图片说明
修改后跑通截图:
输入图片说明

重现步骤

1、下载gitee.com/mindspore的models仓r2.1分支的yolov5代码
2、准备coco2017数据集
3、执行bash run_standalone_train.sh [DATASET_PATH] [DEVICE_ID]
指定数据集路径和device id(比如0)
4、查看train/log.txt

预期结果

代码bug修复,一线按照文档下载代码和数据集,上传后,执行脚本可以开箱即可跑通。

日志/截图

报错日志:输入图片说明

备注

评论 (10)

cuibaobao 创建了任务
cuibaobao 添加了
 
kind/bug
标签
展开全部操作日志

Please assign maintainer to check this issue.
请为此issue分配处理人。
@fangwenyi @chengxiaoli @Shawny

感谢您的提问,您可以评论//mindspore-assistant更快获取帮助:

  1. 如果您刚刚接触MindSpore,或许您可以在教程找到答案
  2. 如果您是资深Pytorch用户,您或许需要:
  1. 如果您遇到动态图问题,可以设置set_context(pynative_synchronize=True)查看报错栈协助定位
  2. 模型精度调优问题可参考官网调优指南
  3. 如果您反馈的是框架BUG,请确认您在ISSUE中提供了MindSpore版本、使用的后端类型(CPU、GPU、Ascend)、环境、训练的代码官方链接以及可以复现报错的代码的启动方式等必要的定位信息
  4. 如果您已经定位出问题根因,欢迎提交PR参与MindSpore开源社区,我们会尽快review
Shawny 负责人设置为代宇鑫
Shawny 任务类型任务 修改为Question
Shawny 关联项目设置为MindSpore Issue Assistant
Shawny 计划开始日期设置为2024-05-14
Shawny 计划截止日期设置为2024-06-14
Shawny 移除了
 
kind/bug
标签
Shawny 移除了
 
kind/bug
标签
Shawny 添加了
 
mindspore-assistant
标签

请问您训练的是否是默认的coco数据集呢?

是默认的coco2017数据集

Shawny 任务状态TODO 修改为WIP

2.1版本对于您使用的机器型号来说太旧了,使用新发布的2.3版本暂未复现您提到的问题
可以升级CANN以及MindSpore版本后再次尝试

你这个结论我并不能接收,存有质疑

请问我的机器型号是910B1怎么就太旧了
2.1的版本对于910B1来说怎么就叫旧。我在910A上同样会复现这个问题。910A和910B1硬件都会复现。
同时,查询版本对应关系,mindspore2.1的版本对应的cann就是6.3的版本。

我在master分支上都可以复现。
现在后端回复就这么敷衍了吗

  1. 910A,910B机器在2.3版本都未复现上述问题的
  2. 2.1版本并未在910B机器上做充分验证,不是指机器旧,是版本对于机器而言旧了
  3. 代码逻辑经检查是符合逻辑的,内部复现可正常训练未出现上述问题,推测可能是其他问题导致。因此建议升级CANN和MindSpore,或对比本地与代码仓代码,查看是否有修改代码的记录。

如您的问题仍未解决,MindSpore社区会继续协助您定位

您好,由于问题单没有回复,我们后续会关闭,如您仍有疑问,可以反馈下具体信息,并将ISSUE状态修改为WIP,我们这边会进一步跟踪,谢谢

cuibaobao 任务状态WIP 修改为DONE

登录 后才可以发表评论

状态
负责人
项目
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
预计工期 (小时)
参与者(3)
8108889 shawny233 1628167362
1
https://gitee.com/mindspore/models.git
git@gitee.com:mindspore/models.git
mindspore
models
models

搜索帮助

344bd9b3 5694891 D2dac590 5694891