一段时间以来,我一直在努力尝试让 NPU 检测与 C++ 程序一起工作。同样的代码在 CPU 上得到了最佳结果,但是使用 VX delegate 检测是完全错误的。代码似乎运行顺利,推理显示了良好的时机(yolov5s 模型,输入为 448x448 ~ 70ms)。
现在我正在尝试使用 Yolov5(uint8 量化),但我尝试使用不同的预训练模型获得相同的行为,在 CPU 上进行良好检测,在 NPU 上进行随机检测。
为了获得模型,我使用了 yolov5 存储库的导出:
python export.py --weights yolov5s.pt --imgsz 448 --include tflite --int8我还尝试过 TFlite 集线器模型,如 SSD 和 mobilenet,它们已经转换为 uint8。
在附件中,我用于推理和转换后的 yolov5n 模型的代码片段。
这可能是什么原因?