name | about | labels |
---|---|---|
Bug Report | Use this template for reporting a bug | kind/bug |
模型仓库地址:https://gitee.com/mindspore/mindformers/blob/dev/research/baichuan2/baichuan2.md
Ascend
/GPU
/CPU
) / 硬件环境:Please delete the backend not involved / 请删除不涉及的后端:
/device ascend/GPU/CPU/kirin/等其他芯片
Software Environment / 软件环境 (Mandatory / 必填):
-- MindSpore version (e.g., 2.2.11) :
-- Python version (e.g., Python 3.9.19) :
-- OS platform and distribution (e.g., eulerosv2r10.aarch64 ):
-- GCC/Compiler version (if compiled from source):
Excute Mode / 执行模式 (Mandatory / 必填)(PyNative
/Graph
):
Please delete the mode not involved / 请删除不涉及的模式:
/mode graph
用例:belle_chat_ramdon_10k.json数据集
Baichuan2-7B-Base
Baichuan2-7B-Chat
Baichuan2-13B-Base
Baichuan2-13B-Chat
网络训练成功,编译时间达标
Please assign maintainer to check this issue.
请为此issue分配处理人。
@fangwenyi @chengxiaoli @Shawny
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
感谢您的提问,您可以评论//mindspore-assistant更快获取帮助:
您好,建议移步mindformers issue获取更多支持:https://gitee.com/mindspore/mindformers/issues
您好,我看到同事已经在mindformers提issue,但是现在还没有回复:#I9ITOT:baichuan2-13B,推理已经成功,现在运行lora微调报错,报错为缺少了一个类
同时我在搜解决案例时看到了之前有解决过类似报错,看能否有参考:#I9HO47:[ST][MS][MF][r2.3][qwen_7b/14b][910B3 8P]网络训练失败,ValueError: Can't find class type optimizer class name AdamWeightDecayX in class registry
您好,我看到同事已经在mindformers提issue,但是现在还没有回复:#I9ITOT:baichuan2-13B,推理已经成功,现在运行lora微调报错,报错为缺少了一个类
同时我在搜解决案例时看到了之前有解决过类似报错,看能否有参考:#I9HO47:[ST][MS][MF][r2.3][qwen_7b/14b][910B3 8P]网络训练失败,ValueError: Can't find class type optimizer class name AdamWeightDecayX in class registry
@feria-tu 看报错截图是使用了run_mindformer.py进行训练,research下模型应该使用run_baichuan2.py
登录 后才可以发表评论