完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
本章介绍大多数ARMv8 A64指令的高级性能特征。
一系列表格总结了有效执行延迟和吞吐量(每个周期的指令带宽)、所利用的流水线以及与每组指令相关联的特殊行为。 在下表中,执行延迟被定义为依赖于所述组中的指令的操作所看到的最小延迟。 执行吞吐量定义为指定指令组在整个Neoverse E1微体系结构中可以实现的最大吞吐量(以每周期的指令数为单位)。 同时在Neoverse E1上运行的单独硬件线程可能会增加延迟并减少每个线程感知的指令带宽,同时还会巧妙地利用单线程CPU中通常会由于延迟和其他低效因素而丢失的周期,这些周期阻止了可用执行带宽的消耗。 下面的执行延迟和执行吞吐量数字分别是来自线程的指令序列遇到的实际最小值和最大值,而不考虑SMT执行的影响,软件调度将从相应的优化中受益。
|
|
相关推荐
|
|
只有小组成员才能发言,加入小组>>
5822 浏览 5 评论
ARM9学习4-S3C2410的启动代码分析-For ADSv1.2
2865 浏览 0 评论
554浏览 1评论
503浏览 1评论
453浏览 0评论
安装适用于STMicroelectronics Edition 1.1版的Keil MDK应用说明
289浏览 0评论
528浏览 0评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-12-22 19:40 , Processed in 1.012150 second(s), Total 74, Slave 54 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号