代码拉取完成,页面将自动刷新
我们正在使用910B测试大模型的推理性能,目前对int8/int4的量化有需求。
看了下文档,目前mindformers还不支持量化模型的推理。
但是在CANN的文档里看到Ascend Transformer Boost这个推理加速库,是支持int8量化推理的。
想请教下mindformers和Ascend Transformer Boost这个库是什么联系呢,后续会集成相关的量化推理支持吗?
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
此Issue已超过15天无回复,已将Issue关闭。如需继续进行,请将Issue状态置为TODO以重新打开,并在评论中进行回复。
您好,由于问题单没有回复,我们后续会关闭,如您仍有疑问,可以反馈下具体信息,并将ISSUE状态修改为WIP,我们这边会进一步跟踪,谢谢
您好,由于问题单没有回复,我们后续会关闭,如您仍有疑问,可以反馈下具体信息,并将ISSUE状态修改为WIP,我们这边会进一步跟踪,谢谢
您好,由于问题单没有回复,我们后续会关闭,如您仍有疑问,可以反馈下具体信息,并将ISSUE状态修改为WIP,我们这边会进一步跟踪,谢谢
您好,由于问题单没有回复,我们后续会关闭,如您仍有疑问,可以反馈下具体信息,并将ISSUE状态修改为WIP,我们这边会进一步跟踪,谢谢
登录 后才可以发表评论