代码拉取完成,页面将自动刷新
68369
kbyk profiler performance optimization
已合并
What type of PR is this?
/kind bug
What does this PR do / why do we need it:
优化kbyk profiler采集性能
1、优化采集项。 去掉ACL_PROF_ACL_API,用户不需要此项数据;优化ACL_PROF_AICORE_METRIC使能方式,如果用户不采集aicore_metric,就不使能此项开关
2、优化保存kbyk host侧数据的频率,从原来的1毫秒保存一次,改成1秒保存一次
3、优化采集kbyk host侧数据:性能分析不需要进程id,不进行采集;profiler host侧采集数据接口依赖从原来的CNode改成full_scope_name
Which issue(s) this PR fixes:
Fixes #
[CT][profiler]stable_diffusion_v2网络在kernel by kernel模式下step性能比 kernel by kernel单训练场景劣化
https://e.gitee.com/mind_spore/projects/67813/milestones/31248/issues/table?issue=I9CXK0
Code review checklist 【代码检视checklist说明】:
-
典型安全编码问题 【违反安全编码案例】
- 是否进行空指针校验
- 是否进行返回值校验 (禁止使用void屏蔽安全函数、自研函数返回值,C++标准库函数确认无问题可以屏蔽)
- 是否正确释放new/malloc申请的内存
-
性能分析 (如果涉及某个子项,请概述设计思想/修改内容)
- 是否修改热点函数 / 算法 / 算子
- 是否考虑并发场景
- 是否考虑通信场景
-
- 是否符合编码规范 【编码规范】
-
- 是否遵守 SOLID原则 / 迪米特法则
-
- 是否涉及模块/特性间交互 (若涉及请概述实现思路)
-
- 是否具备UT测试用例看护 && 测试用例为有效用例 (若新特性无测试用例看护请说明原因)
-
- 是否正确加载、释放秘钥
-
错误处理与记录
- 是否充分考虑接口的异常场景
- 是否正确记录错误信息
Special notes for your reviewers: