GPU上OpenVINO基准测试的推断模型的默认参数与CPU上的参数不同是为什么？

在 CPU 和 GPU 上推断出具有 OpenVINO™ 基准的相同模型：
benchmark_app.exe -m model.xml -d CPU
benchmark_app.exe -m model.xml -d CPU
导致的 GPU 延迟和吞吐量高于 CPU。
无法确定为什么 GPU 上的延迟和吞吐量都高于 CPU，因为低延迟会导致高吞吐量。

回帖（1）

李龙

2023-8-15 10:20:26

延迟可测量同步处理单个输入所需的推断时间。
使用默认参数运行OpenVINO™基准时，它是在异步模式下推断。因此，延迟测量处理推理请求数量所需的总推断时间。
此外，在具有默认参数的 CPU 上运行基准应用程序时，会创建 4 个推理请求，而在使用默认参数的 GPU 上运行基准应用程序时，会创建 16 个推理请求。因此，GPU 推断的延迟高于 CPU。
在 CPU 和 GPU 上运行基准应用程序时指定相同数量的推理请求以进行相当的比较：
benchmark_app.exe -m model.xml -d CPU -nireq 4
benchmark_app.exe -m model.xml -d CPU -nireq 4

更多回帖

王萍

GPU上OpenVINO基准测试的推断模型的默认参数与CPU上的参数不同是为什么？

回帖（1）

李龙

相关问答

运行多个进程时，OpenVINO trade推断时间会增加是为什么？如何解决？

如何将Detectron2和Layout-LM模型转换为OpenVINO中间表示（IR）和使用CPU插件进行推断？

推断FP32模型格式的速度比CPU上的FP16模型格式快是为什么？

请问在新CPU上推断INT8模型的速度是否比旧CPU快？

为什么Caffe模型可以直接与OpenVINO™工具套件推断引擎API一起使用，而无法转换为中间表示（IR）？

请问OpenVINO™工具套件英特尔®Distribution是否与Windows® 10物联网企业版兼容？

是否可以使用IR实施OpenVINO运行时推断管道？

为什么无法检测到OpenVINO™工具套件中的英特尔®集成图形处理单元？

在Raspberry Pi上从源代码构建OpenVINO 2021.3收到错误怎么解决？

无法在AMD Ryzen CPU上运行OpenVINO trade怎么解决？

20万+工程师都在用，免费PCB检查工具

王萍

GPU上OpenVINO基准测试的推断模型的默认参数与CPU上的参数不同是为什么？

回帖（1）

李龙

相关问答

运行多个进程时，OpenVINO trade推断时间会增加是为什么？如何解决？

如何将Detectron2和Layout-LM模型转换为OpenVINO中间表示（IR）和使用CPU插件进行推断？

推断FP32模型格式的速度比CPU上的FP16模型格式快是为什么？

请问在新CPU上推断INT8模型的速度是否比旧CPU快？

为什么Caffe模型可以直接与OpenVINO™工具套件推断引擎API一起使用，而无法转换为中间表示 （IR）？

请问OpenVINO™工具套件英特尔®Distribution是否与Windows® 10物联网企业版兼容？

是否可以使用IR实施OpenVINO运行时推断管道？

为什么无法检测到OpenVINO™工具套件中的英特尔®集成图形处理单元？

在Raspberry Pi上从源代码构建OpenVINO 2021.3收到错误怎么解决？

无法在AMD Ryzen CPU上运行OpenVINO trade怎么解决？

20万+工程师都在用，免费PCB检查工具

为什么Caffe模型可以直接与OpenVINO™工具套件推断引擎API一起使用，而无法转换为中间表示（IR）？