完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
ARMv8-A高级SIMD指令集在64位或128位的固定长度向量上运行。
对于处理大量数据的行业应用,例如计算机视觉和机器学习、服务器、数据分析,人们已经认识到,运行较长向量长度的处理器可能更适合。 然而,没有一个特定的矢量长度可以很好地适用于所有应用。 由于每次需要新的矢量长度时指定一个新的指令集的编码成本相对较高,ARM采用了一种新颖的方法,并创建了一个可根据不同的矢量长度进行缩放的唯一指令集。 这种下一代ARM SIMD指令集称为可伸缩向量扩展(SVE)。 它允许矢量长度不可知的编码风格,其中代码不需要重新编写或重新编译,因为它动态地适应所实现的矢量长度。 SVE架构允许实现最大为2048位的矢量长度,其中矢量长度必须是128位的倍数。 SVE还支持为固定向量长度编写的代码。 由ARMv8-A高级SIMD指令集促进的矢量化方法对循环计数不是向量长度的倍数的情况很敏感。 为了适应这种情况,ARMv8-A高级SIMD矢量化循环之后是处理剩余数据的标量循环。 SVE支持的向量分割机制允许控制对向量的哪些元素进行操作。 这使得能够更容易地处理循环终止条件。 这套精心挑选的指令将条件语句或控制流转换为谓词向量操作,从而实现无缝循环控制。 因此,大多数复杂的嵌套循环变得可向量化。 SVE支持许多算术运算的归约指令。 这些指令实现了这样的矢量化,其中在不同的矢量通道中计算部分结果。 在矢量化循环完成之后,借助归约指令从这些部分结果中获得最终结果。 SVE指令集提供了广泛的加载/存储指令支持、谓词和循环控制支持以及逻辑和按位指令支持。 SVE指令集还提供全面的浮点算术支持和基本整数算术支持。 SVE2是可伸缩向量扩展v2,是具有扩展功能的ARMv8-A SVE的超集。 SVE2指令集添加了全面的整数算术支持
|
|
|
|
只有小组成员才能发言,加入小组>>
5822 浏览 5 评论
ARM9学习4-S3C2410的启动代码分析-For ADSv1.2
2865 浏览 0 评论
554浏览 1评论
503浏览 1评论
453浏览 0评论
安装适用于STMicroelectronics Edition 1.1版的Keil MDK应用说明
289浏览 0评论
527浏览 0评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-12-22 10:19 , Processed in 0.607923 second(s), Total 72, Slave 53 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号