完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
本帖最后由 一只耳朵怪 于 2018-6-22 10:34 编辑
测试了在不开DDR2 cacheability、不开cacheability、L2中三种情况下计算效率。开了cacheability的计算效率是明显的,大概是不开的6-8倍。但是将数据全部放在L2中计算的效率只是开了DDR2 cacheability的1.3倍左右,另外我将大块的数据EDMA到L2中计算其效率是开DDR2 cacheability的1.2倍(比全部在L2中多了EDMA启动开销)左右,感觉这个提升幅度有低。理想情况EDMA搬移数据到L2中计算,其效率应该是在开启DDR2 cacheability的效率的几倍?谁能解释下这个没有大幅的效率提升可能是什么原因。 |
|
相关推荐
3个回答
|
|
|
|
|
|
不过能不能解释的具体点,在这种情况下(DDR2 cacheability), 使用EDMA (pingpong结构)有没交大的效率提升,另外DDR2的cacheability开多大的片区为好呢,开多了有没什么影响。 |
|
|
|
wenxueshu 发表于 2018-6-22 08:30 1. Cache的机制就是把外存的数据Buf到片内RAM,这个操作的过程就是DMA控制器完成的,如果CPU用到的数据在Cache里,叫Hit,不在,则CPU还需要对外存进行访问,叫Miss,不同的CPU的Cache有本身的工作机制,譬如4-Set(发射)什么的,不需要代码去干预,指令Cache会自动预测下一条指令的位置,从而进行预取,这样流水线工作效率才会高,这也就是为什么不要在while或者循环里用goto的原因,这样会清空指令Cache流水线,重新Buf指令数据;对于数据Cache,理论是一样的; 2. DDR2里如果有你的Codec使用的数据或者是非ARM/Linux系统使用到的内存区域,这些区域要设置成不可Cache |
|
|
|
只有小组成员才能发言,加入小组>>
TMS320F28377D:新做了以377d为芯片的板子,上电后芯片复位引脚出现方波请问如何解决?
1888 浏览 0 评论
TPS55340通电后输入端保险丝烧断,芯片输入和GND之间短路
3641 浏览 4 评论
5027 浏览 0 评论
请问如何用DM368对RGB格式的图片数据进行编码生成JPEG格式图片?
1732 浏览 1 评论
9353 浏览 8 评论
CC3100BOOST使用CC3200lunchXL进行烧录
664浏览 2评论
707浏览 1评论
TMS320F28034: 利用C2prog通过SCI给TMS320F28034烧录程序,出现错误提示:Bootloading... failed (invalid echo)!
668浏览 1评论
1186浏览 1评论
求DLPC350 Programmer’s Guide User's Guide 中文版说明书
1189浏览 1评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-4-20 03:37 , Processed in 0.433938 second(s), Total 47, Slave 40 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号