引用: vuywsdfwf 发表于 2018-8-1 06:44
c66x内核MAC功能单元可以计算32次Fixed point 16x16 MACs per cycle,所以得出1.25x32=40GMAC per core。
GFLOP的计算方法在***子给出了详细的解释。
https://e2e.ti.com/support/dsp/c6000_multi-core_dsps/f/639/t/485503
我找了许多地方关于gflops和gmac计算途径的,https://e2e.ti.com/support/dsp/c6000_multi-core_dsps/f/639/t/485503给出了详细解释,但没有相关的测试方法,关于c6xx dsp单核的gmac和gflops的实际gflops和gmac值,TI应该有测试程序吧,与理论值有一点差距没关系,有相关的测试程序就行,否则每个人想一个算法,这个难度有点大啊。
@Shine Zhang :是否有测试gmac或者gflops值的例子,给一份吧。
在网上,x86的例子比较容易找到,c66x的实在是找不到.
引用: vuywsdfwf 发表于 2018-8-1 06:44
c66x内核MAC功能单元可以计算32次Fixed point 16x16 MACs per cycle,所以得出1.25x32=40GMAC per core。
GFLOP的计算方法在***子给出了详细的解释。
https://e2e.ti.com/support/dsp/c6000_multi-core_dsps/f/639/t/485503
我找了许多地方关于gflops和gmac计算途径的,https://e2e.ti.com/support/dsp/c6000_multi-core_dsps/f/639/t/485503给出了详细解释,但没有相关的测试方法,关于c6xx dsp单核的gmac和gflops的实际gflops和gmac值,TI应该有测试程序吧,与理论值有一点差距没关系,有相关的测试程序就行,否则每个人想一个算法,这个难度有点大啊。
@Shine Zhang :是否有测试gmac或者gflops值的例子,给一份吧。
在网上,x86的例子比较容易找到,c66x的实在是找不到.
举报