[问答]

你知道ARM处理器 neon优化技巧有哪些吗

问答对人有帮助，内容完整，我也想知道答案 0 1. 去除数据依赖不要将当前指令的目的寄存器作为下一条指令的源寄存器！原因：ARM架构采用的是多级流水线技术，如果下一条指令的源寄存器是当前指令的目的寄存器，就需要当前指令执行完之后，下一条指令才能取指执行，这样会产生很大的延迟，影响性能。 2. 减少分支跳转 ARM处理器中广泛使用分支预测技术。但是一旦分支预测失败，性能就会损失很大。所以，尽量不要用分支跳转！可以采用逻辑运算指令替代分支跳转！比如： VCEQ, VCGE, VCGT, VCLE, VCLT…… VBIT, VBIF, VBSL…… 另外，可以使用条件执行指令，比如addgt,suble等减少分支跳转！建议一次性多处理几行数据，从而减少循环跳转的次数，提升性能。 3. 建议使用预载指令 PLD允许处理器告知内存系统在不久的将来会从指定地址读取数据，若数据提取加载到cache中，将会提高cache hit，从而提升性能。风险：不过最新架构对PLD指令的支持并不好，在不确定的情况下使用，可能会损失性能！ PLD syntax: PLD{cond} [Rn {, #offset}] PLD{cond} [Rn, +/-Rm {, shift}] PLD{cond} label Where: Cond - is an optional condition code. Rn - is the register on which the memory address is based. Offset - is an immediate offset. If offset is omitted, the address is the value in Rn. Rm - contains an offset value and must not be PC (or SP, in Thumb state). Shift - is an optional shift. Label - is a PC-relative expression. 4. 关注指令周期延迟 0 VMLA指令可以替代VMUL+VADD，但是由于VMLA的指令延迟比较大，在后面没有并行指令时，可能性能并不如VMUL+VADD。 5. NEON assembly and NEON intrinsic PeRFormance Contrast NEON assembly: 6 }8 N7 f2 v8 n: Always shows the best performance for the specified platform for an experienced developer. NEON intrinsic: Depends heavily on the toolchain that is used. 原作者：haidaowang 0
2022-4-29 09:28:45　　评论淘帖0 邀请回答您可以邀请以下用户，快速回答问题 × dianzijie5 该类别下有 16 个回答。邀请回答嵌入式-H 该类别下有 16 个回答。邀请回答 hgimtk 该类别下有 16 个回答。邀请回答 hucc 该类别下有 14 个回答。邀请回答舍我其谁84 该类别下有 13 个回答。邀请回答 HCPcry 该类别下有 12 个回答。邀请回答冰箱洗衣机该类别下有 12 个回答。邀请回答 iettke 该类别下有 11 个回答。邀请回答学生物的程序猿该类别下有 11 个回答。邀请回答小刘该类别下有 11 个回答。邀请回答 sjjs001 该类别下有 11 个回答。邀请回答 YOYOOO 该类别下有 10 个回答。邀请回答 bigbangboom 该类别下有 10 个回答。邀请回答 drakannie 该类别下有 9 个回答。邀请回答 siyugege 该类别下有 9 个回答。邀请回答 wuli北该类别下有 9 个回答。邀请回答 zengweishuai 该类别下有 9 个回答。邀请回答广州洋钒该类别下有 9 个回答。邀请回答 mintsy 该类别下有 8 个回答。邀请回答 fanB 该类别下有 8 个回答。邀请回答举报 juju宇哥相关推荐 • ARM与Intel处理器之间有什么区别？ 2897 • ARM处理器模式和ARM处理器状态有何区别？ 2365 • ARM和Intel处理器有哪些区别 2737 • 在arm处理器上多线程如何优化加速呢 2235 • ARM处理器有哪些系列？ 2524 • NEON汇编与NEON intrinsics编程的优缺点比较 3425 • 怎么使用ARM处理器上的GPU进行编程工作呢 3199 • 嵌入式机器视觉系统有什么特性？怎么优化？ 2574 • NEON在armv8(arch64)下如何去使用呢 2778 • 常用的ARM Cortex-M处理器有哪些？ 2684