99 Star 799 Fork 1.4K

MindSpore / models

 / 详情

[Bug]: 算力切分2切场景wide_deep模型训练失败:

TODO
创建于  
2023-10-11 21:46

问题描述

算力切分2切场景wide_deep模型训练失败:

环境信息

Hardware Environment(Ascend/GPU/CPU) / 硬件环境:
Ascend Training Solution 23.0.RC3.B080
CANN 7.0.RC1.B080
Ascend HDK 23.0.RC3.B080
Software Environment / 软件环境 (Mandatory / 必填):
-- MindSpore version (e.g., 2.0.0) :MindSpore 2.2.0 B070
-- Python version (e.g., Python 3.7.5) :python3.7.5
-- OS platform and distribution (e.g., Linux Ubuntu 16.04):openeuler22.03_arm

关联用例

vNPU_vir12_0004
/01xs5itoqrp/03210uq2ba2ln/03270v0lt2jej/03270v0lt2jfd/031l0v0m4asjqeb5/031l0v0m4b5c7eqh/031l0v0m4b5rqerh/031l0v0m4b5ujerm/031l0v0m4b5v4/031l0v0m4b60ierp/031l0v0m4bj48pkg/031l0v0m4bj4ppmc/

重现步骤

cd ../mindspore/official/recommend/Wide_and_Deep
python train_and_eval.py --data_path=/home/data/wide_deep_mindrecord/ --dataset_type=mindrecord --device_target=Ascend > train_log.txt 2>&1 &

预期结果

训练正常

日志/截图

输入图片说明[在这里上传图片]

备注

目前待看
董鸿儒 wx1150228

评论 (2)

chenjiahao_dbl 创建了任务
chenjiahao_dbl 添加了
 
kind/bug
标签
展开全部操作日志

Please assign maintainer to check this issue.
请为此issue分配处理人。
@fangwenyi @chengxiaoli @Shawny

感谢您的反馈,您可以评论//mindspore-assistant更快获取帮助,更多标签可以查看标签列表

  1. 如果您刚刚接触MindSpore,或许您可以在教程找到答案
  2. 如果您是资深Pytorch用户,您或许需要:
    与PyTorch典型区别 / PyTorch与MindSpore API映射表
  3. 如果您遇到动态图问题,可以设置mindspore.set_context(pynative_synchronize=True)查看报错栈协助定位
  4. 模型精度调优问题可参考官网调优指南
  5. 如果您反馈的是框架BUG,请确认您在ISSUE中提供了MindSpore版本、使用的后端类型(CPU、GPU、Ascend)、环境、训练的代码官方链接以及可以复现报错的代码的启动方式等必要的定位信息
  6. 如果您已经定位出问题根因,欢迎提交PR参与MindSpore开源社区,我们会尽快review

登录 后才可以发表评论

状态
负责人
项目
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
预计工期 (小时)
参与者(2)
1
https://gitee.com/mindspore/models.git
git@gitee.com:mindspore/models.git
mindspore
models
models

搜索帮助