99 Star 800 Fork 1.4K

MindSpore / models

 / 详情

[Bug]: 【910B3】【继承特性/新需求】【模型训练】MindSpore 2.2.0.B020版本 910B3 32核环境模型训练DBnet混合精度,模型跑1000个epoch后报错”The pointer[res_manager_] is null“

DONE
创建于  
2023-08-23 11:29

问题描述

模型训练DBnet混合精度,模型跑1000个epoch后报错”The pointer[res_manager_] is null“

环境信息

关联用例

Train_MS_DBNet_Resnet50_Perf_001

重现步骤

模型训练DBnet混合精度,模型跑1000个epoch

预期结果

模型训练成功

日志/截图

[图片上传中…(image-xUWDGHD2aikef0grdh5U)]

备注

张君

评论 (2)

王凡 创建了任务
王凡 添加了
 
kind/bug
标签
展开全部操作日志

Please assign maintainer to check this issue.
请为此issue分配处理人。
@fangwenyi @chengxiaoli @Shawny

感谢您的反馈,您可以评论//mindspore-assistant更快获取帮助,更多标签可以查看标签列表

  1. 如果您刚刚接触MindSpore,或许您可以在教程找到答案
  2. 如果您是资深Pytorch用户,您或许需要:
    与PyTorch典型区别 / PyTorch与MindSpore API映射表
  3. 如果您遇到动态图问题,可以设置mindspore.set_context(pynative_synchronize=True)查看报错栈协助定位
  4. 模型精度调优问题可参考官网调优指南
  5. 如果您反馈的是框架BUG,请确认您在ISSUE中提供了MindSpore版本、使用的后端类型(CPU、GPU、Ascend)、环境、训练的代码官方链接以及可以复现报错的代码的启动方式等必要的定位信息
  6. 如果您已经定位出问题根因,欢迎提交PR参与MindSpore开源社区,我们会尽快review
王凡 修改了描述
王凡 任务状态TODO 修改为DONE

登录 后才可以发表评论

状态
负责人
项目
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
预计工期 (小时)
参与者(2)
1
https://gitee.com/mindspore/models.git
git@gitee.com:mindspore/models.git
mindspore
models
models

搜索帮助

344bd9b3 5694891 D2dac590 5694891