[经验]

使用Streamline分析在Linux上运行的Arm NN机器学习应用程序

2022-8-11 15:46:06

2788 ARM 分析器计数器 Linux系统

Arm Streamline 性能分析器提供系统性能指标、软件跟踪和统计分析，以帮助工程师从硬件中获得最大性能并找到软件中的重要瓶颈。

Streamline v7.4 增加了对用于 CPU、GPU 和 NPU 的 Arm NN 机器学习推理引擎的支持。Arm NN 弥合了现有框架和底层硬件之间的差距。Streamline 可以自动分析 Arm NN 应用程序并提供有关推理运行时的有用性能信息。

此处讨论的示例是在 Arm 上运行 ML 推理的 Linux 应用程序。我们之前已经在 MNIST 数据集上训练了一个神经网络来识别手写数字。使用 Arm NN 和 Streamline，我们希望了解我们模型的效率以及如何进一步优化它。

在应用程序中启用 Arm NN 分析

要在应用程序中启用 Streamline 分析，必须使用 Streamline 分析标志编译 Arm NN。这是使用定义完成的：
DPROFILING_BACKEND_STREAMLINE=1
此外，对于使用分析的应用程序，它必须启用分析选项，通常在应用程序源代码中完成。在应用程序中启用 Arm NN 分析选项：

options.m_ProfilingOptions.m_EnableProfiling = true;

options.m_ProfilingOptions.m_TimelineEnabled = true;

让我们看看如何启用分析并捕获在 N1 SDP上运行的应用程序的 Streamline 跟踪并显示 ML 推理信息。

设置一个 ML 应用程序来分析

首先，我们将使用之前指定的定义选项构建 Gator、Arm Streamline 的分析代理、依赖库和 Arm NN。可以使用 github 上 Arm 工具解决方案存储库中的脚本之一轻松完成。安装所需的包并运行脚本以在 ${HOME}/armnn-devenv 中构建 Arm NN。

要安装 ML 应用程序，请转到以下存储库并编译示例：

$ ~/gatord --app ./mnist_tf_convol 0 80

要在时间轴中可视化 Arm NN 事件，需要从计数器配置菜单中启用 Arm NN_Runtime 事件，以便 Gator 收集它们。请注意，应用程序需要先运行一次才能在菜单中看到这些事件，因为 Arm NN 需要计数和收集与 ML 相关的计数器以将它们传递给 Gator。此外，我们还启用了指令 PMU 以了解 SIMD 性能。

使用 Streamline 分析 Arm NN 活动

在 Streamline 中打开结果时，时间轴选项卡中会显示额外信息：

Arm NN_Runtime 图表显示后端注册（后端是将网络图的层映射到负责执行这些层的硬件的抽象：Arm Cortex-A、Mali-GPU 或 Arm ML 处理器）、网络负载和推论。此图表有助于监控推理，使用在许多后端运行的不同模型。在我们的示例中，我们在Neoverse N1 CPU上运行单个推理；