【单选题】
A MindSpore 通过梯度数据驱动的自适应图优化,实现去中心化的自主 A11 Reduce,梯度聚合步调一致, 计算与通信充分流水
B 超强芯片算力下模型执行的挑战:内存墙问题、交互开销大、数据供给难。部分在 Host 执行,部分在 Device 执行,交互开销甚至远大于执行开销,导致加速器占用率低
C MindSpore 通过面向芯片的深度图优化技术,同步等待少,最大化“数据计算通信”的并行度,训练性能相比 Host 侧图调度方式持平
D 超强芯片算力下分布式梯度聚合的挑战:ReslNet50 单迭代 20ms 时间时会产生中心控制的同步开销和频繁同步的通信开销。传统方法需要 3 次同步完成 A11 Reduce, 数据驱动方法自主 A11 Reduce, 无控制开销
查看更多