对于硬件设计来说,红框中资源是比较重要的,影响着深度学习前向推断的性能和速度,之前帖子也说明了该板卡能够实现的DPU为B2306的lowDSPs,这也就限制了前向推断的性能,最后面的zu9cg资源可达本次试用板卡的10倍,通向的前向推断的速度也是10倍以上的差距,当然价格也是10倍以上的,官方板卡也是以万为单位。当然,就目前而言,本次试用的板卡如果对于输入的视频或者算法没有特别的要求,实际上在性能上已经较为不错,能够实现基本的功能。也就是说,从应用的角度来看,低端产品的应用利用该芯片还是足以。
二、外围资源总结对于图像应用而言,有以太网、USB、MIPI、BT1120接口,已经完全足够,基本上市面上较为常见的视频输入接口都可以使用或者扩接相应板卡即可,其中MIPI接口米尔科技还提供了开发例程,可以在这个的基础上进行自己的开发和改进。对于数据交互而言,板卡提供了PCIE、UART、USB、千兆以太网,还有更值得一说的是丰富的扩展IO,能够扩展自己的接口,此次试用的项目就使用了扩展IO作为串口发送数据的功能,官方提供了uart_lite、uart16550、IIC、SPI等接口的驱动和应用程序,完全足够自己的开发,因此该板卡在灵活性上应该是其他类型的深度学习板卡无法相比的。本次试用的项目就是利用了这些扩展IO,甚至可以根据自己的需求任意修改,只需要外围在设计一些简单的
电路,不像其他板卡,要么资源固定,浪费大量的空间,要么无法提供需求的资源,自能改变自己的要求。
三、自己开发的AI系统与自带AI系统的比较首先需要对比的是实时性,当然这个无法对比,不是相同的算法,并且目前xilinx提供的工具对有mobile部分的算法需要微调,完全没有例子参考,也不懂怎么微调,但是自带系统就是mobile_VGG算法的,但是直观对比来看,米尔科技自带的系统在实时性上更加优异,毕竟百度团队做的,在算法优化上肯定是我无法相比的,而且也不太明白百度是根据什么进行深度学习开发的,xilinx目前提供的是DPU,百度也许也是这个,也许是自己开发的架构。
然后是灵活性,这个就可以吹一波自己的了,毕竟知根知底,而且是公开的、资料丰富的Xilinx标准开发流程,因此在灵活性上肯定是自己开发的更加优秀,能够根据自己的需求加入PL端的外设,更改深度学习算法等。
再者是开发周期,如果撇去算法以及扩展接口的需求,自带的系统在开发周期上更短,因为提供了配套的EasyDL,如果只是单纯的检测目标或者图片分类,只需要将自己的数据上传等待训练完成并将数据导入即可,开发过程简单并且时间较短,如果是自己的系统,还需要利用DNNDK或者VART开发套件进行转换,编写推断代码等才能真正完成,当然前提是自己完成了模型的部署。
最后是稳定性上的对比,自己开发的系统ai推断上和自带系统在深度学习推断上都差不多稳定,但是在外设驱动的加载上,由于自己开发的系统没有动态加载文件,老是容易出现驱动无法自动加载的情况,而自带的是有的,即使没能自动加载也可以手动加载(这也无法责怪,毕竟即使是windows系统也可能出现驱动无法自动加载的情况)。因此在系统稳定性上,必然是自带系统更加优秀。
四、试用感受首先是在服务上,米尔科技给我们使用者配置了与购买者同等的服务上,提供了专门的技术人员进行解答,由于我自己的开发方向与板卡方向不太一致,遗憾这一次没能请教什么问题。
然后是试用头疼程度,头疼程度拉满,当然这不是米尔科技的问题,主要是自己的问题。
再者是试用bug上,最后会列出几个小问题,但是不知道是板卡硬件的问题还是芯片的问题还是自己开发的问题,除此之外没有什么问题。
最后就是感谢提供的试用机会,学生党不容易,千把块钱啊~~~~~~
五、试用问题USB3.0驱动自动加载老是无法加载,需要反复重启,不清楚是什么原因,在Xilinx
论坛也没有得到解答。
PL端的外设驱动自动加载也有问题,反复重启才能成功。
此致!
`