OnDevice执行,即整图卸载执行,充分发挥异腾芯片的算力,可以大大降低交互的开销,从而提升加速器占用率,关于0nDevice执行以下描述错误的是?

发布于 2021-07-29 15:32:27
【单选题】
A MindSpore 通过梯度数据驱动的自适应图优化,实现去中心化的自主 A11 Reduce,梯度聚合步调一致, 计算与通信充分流水
B 超强芯片算力下模型执行的挑战:内存墙问题、交互开销大、数据供给难。部分在 Host 执行,部分在 Device 执行,交互开销甚至远大于执行开销,导致加速器占用率低
C MindSpore 通过面向芯片的深度图优化技术,同步等待少,最大化“数据计算通信”的并行度,训练性能相比 Host 侧图调度方式持平
D 超强芯片算力下分布式梯度聚合的挑战:ReslNet50 单迭代 20ms 时间时会产生中心控制的同步开销和频繁同步的通信开销。传统方法需要 3 次同步完成 A11 Reduce, 数据驱动方法自主 A11 Reduce, 无控制开销

查看更多

关注者
0
被浏览
133
  • 体验AI问答!更聪明、超智能!
  • 一款基于GPT的超级AI助手,可以对话、创作、写文案!
1 个回答

撰写答案

请登录后再发布答案,点击登录

发布
问题

手机
浏览

扫码手机浏览

分享
好友

在线
客服