电子元器件论坛
直播中

张敏

7年用户 1528经验值
私信 关注

用于准确的CPU功率检测的快速功率模型化

中央处理器 (CPU) 微架构师投入了大量的工程精力来改进连续几代 CPU 产品中的每周期指令数 (IPC) 和最大工作频率 (F MAX )。 然而,挤出额外的 IPC 越来越被证明是一个艰难的任务。

以前为我们提供良好服务的高性能技术,例如更积极的推测、进一步的并行性和专门的执行单元增加了片上晶体管的数量。这在过去不是问题。以前,使晶体管更小允许将更多的晶体管封装在同一管芯区域内(摩尔定律缩放),而降低电源电压(登纳德缩放)使晶体管运行效率更高。今天,通过 3D 集成、晶圆级计算和新型晶体管技术进行的工艺技术创新仍然提供了更高的晶体管集成度。不幸的是,电压缩放实际上已经停滞,这意味着仅通过缩放就可以大大降低效率增益。

功率灵敏度挑战

不幸的是,封装更多晶体管以解锁更多架构特性会导致更大的开关活动,从而导致更大的电流需求。这会影响 CPU 功耗,而 CPU 功耗近年来呈上升趋势。更糟糕的是,供电资源跟不上。例如,互连线在 5nm 及以下节点的电阻特别大。同样,封装技术的发展速度较慢,无法满足现代 CPU 的di/dt需求。这些因素的组合有助于提高产品路线图中的功率敏感性,从而推动在设计期间和运行时对 CPU 功率自省的需求。

在设计时进行电源内省的现有技术依赖于极其准确的 EDA 工具。这使它们成为需要签核级功率基准测试的首选方法。然而,这很昂贵,并且在分析复杂的高性能 CPU 内核时通常会在几天(如果不是几周)内消耗大量计算资源。在分析加电完整系统时对运行时间的影响更为显着。替代方法使用基于活动的功率模型,这些模型依赖于对特定微架构事件的计数,这些事件在功率建模的上下文中通常被称为功率代理。这些包括高速缓存活动、指令退出率和特定功能单元的激活率。

这些方法在以下情况下可以具有很高的准确度水平需要粗粒度的分辨率(毫秒级),并且当在更精细的窗口(或细粒度的时间分辨率)上测量功率时,通常保真度很差。这种对精度的影响使得这些方法不适用于运行时 di/dt 管​​理,在这种情况下,需要在 10 个或更少的 CPU 周期内缓解严重的电压降。因此,现有的功率内省技术在功率跟踪的准确性、计算速度和时间分辨率之间提供了鲜明的对比。

在 Arm Research,我们正在研究一种植根于机器学习和数据科学方法的技术,称为 APOLLO。APOLLO 在同一统一框架内实现了针对设计和运行时功耗自省的快速而准确的功耗建模(图 1)。在算法上,APOLLO 使用了一种基于极小极大凹惩罚 (MCP) 回归的新的幂代理选择技术。它选择 RTL 信号的一小部分 (<0.05%) 来估计 CPU 功耗,以每个周期的时间粒度实现高精度 (~90%)。

APOLLO 模型还可以合成为低成本的片上功率计 (OPM),由于作为功率代理监测的 RTL 信号数量很少,因此面积开销不到 1%。APOLLO 已经在 Neoverse N1 CPU 上进行了原型设计,并将进一步评估以充分挖掘其未来潜力。

2.jpg

图 1:APOLLO 在同一框架内统一了设计时功耗模型和运行时 OPM。在对 Neoverse N1 进行初步原型设计后,APOLLO 正在接受进一步评估以探索其未来潜力。

APOLLO自动训练数据生成

依赖数据科学方法的技术对训练数据生成很敏感。他们需要一组多样化的训练数据,并充分覆盖功能单元。当您考虑 CPU 微架构的底层复杂性时,这通常很难实现。借助 APOLLO,我们通过使用与微架构无关的基于遗传算法 (GA) 的框架 自动生成微基准训练集,从而规避了这些实际工程挑战。

基于 GA 的优化循环准备好生成最坏情况下的功耗基准或电源病毒,如图 2 所示的曲线图的包络线所示。跨代低功耗和高功耗基准的组合自然而然地创建了丰富多样的基准,涵盖了很大的功率范围。

2.jpg

图 2:该图是使用自动生成的微基准的功耗分布。前几代显示出低功耗基准的优势,而后几代则显示出更高的功率。

阿波罗结果

APOLLO 的功率估算精度如图 3 所示,在 Arm 功率指示工作负载上进行了测试。图 3 显示了具有 159 个功率代理的 APOLLO 模型的每个周期预测,我们在其中与地面实况包络线(以粉红色显示)非常一致。

2.jpg

图 3:具有 159 个代理的 APOLLO 功率模型显示与功率指示工作负载非常吻合。标签表示使用 EDA 工具为相同工作负载测量的真实功率。预测叠加在顶部,显示 MAE 约为7%。

我们测量平均绝对误差 (MAE)、均方根误差 (RMSE) 和 R 平方相关性的预测准确性。所有工作负载的 MAE 均小于 10%,错误主要是由于逐周期估计的微小变化所致。x 轴是循环指数,y 轴是缩放功率值。

原作者:Shidhartha Das

更多回帖

发帖
×
20
完善资料,
赚取积分