[资料] 优化技巧:提前if判断帮助CPU分支预测

[复制链接]

高级工程师

发表于 5 天前   81 查看 0 回复 显示全部楼层 倒序浏览
分享
摘要: 在stackoverflow上有一个非常有名的问题:为什么处理有序数组要比非有序数组快?,可见分支预测对代码运行效率有非常大的影响。要提高代码执行效率,一个重要的原则就是尽量避免CPU把流水线清空,那么提高分支预测的成功率就非常重要。分支预测在stackoverflow上有一个非常有名的问题:为什么处理有序数组要比非有序数组快?,可见分支预测对代码运行效率有非常大的影响。现代CPU都支持分支预测(branch prediction)和指令流水线(instruction pipeline),这两个结合可以极大提高CPU效率。对于像简单的if跳转,CPU是可以比较好地做分支预测的。但是对于switch跳转,CPU则没有太多的办法。switch本质上是据索引,从地址数组里取地址再跳转。要提高代码执行效率,一个重要的原则就是尽量避免CPU把流水线清空,那么提高分支预测的成功率就非常重要。那么对于代码里,如果某个switch分支概率很高,是否可以考虑代码层面帮CPU把判断提前,来提高代码执行效率呢?Dubbo里ChannelEventRunnable的switch判断在ChannelEventRunnable里有一个switch来判断channel state,然后做对应的逻辑:查看一个channel建立起来之后,超过99.9%情况它的state都是ChannelState.RECEIVED,那么可以考虑把这个判断提前。benchmark验证下面通过jmh来验证下:public class TestBenchMarks {public enum ChannelState {    CONNECTED, DISCONNECTED, SENT, RECEIVED, CAUGHT}@State(Scope.Benchmark)public static class ExecutionPlan {    @Param({ "1000000" })    public int size;    public ChannelState[] states = null;    @Setup    public void setUp() {        ChannelState[] values = ChannelState.values();        states = new ChannelState[size];        Random random = new Random(new Date().getTime());        for (int i = 0; i < size; i++) {            int nextInt = random.nextInt(1000000);            if (nextInt > 100) {                states = ChannelState.RECEIVED;            } else {                states = values[nextInt % values.length];            }        }    }}@Fork(value = 5)@Benchmark@BenchmarkMode(Mode.Throughput)public void benchSiwtch(ExecutionPlan plan, Blackhole bh) {    int result = 0;    for (int i = 0; i < plan.size; ++i) {        switch (plan.states) {        case CONNECTED:            result += ChannelState.CONNECTED.ordinal();            break;        case DISCONNECTED:            result += ChannelState.DISCONNECTED.ordinal();            break;        case SENT:            result += ChannelState.SENT.ordinal();            break;        case RECEIVED:            result += ChannelState.RECEIVED.ordinal();            break;        case CAUGHT:            result += ChannelState.CAUGHT.ordinal();            break;        }    }    bh.consume(result);}@Fork(value = 5)@Benchmark@BenchmarkMode(Mode.Throughput)public void benchIfAndSwitch(ExecutionPlan plan, Blackhole bh) {    int result = 0;    for (int i = 0; i < plan.size; ++i) {        ChannelState state = plan.states;        if (state == ChannelState.RECEIVED) {            result += ChannelState.RECEIVED.ordinal();        } else {            switch (state) {            case CONNECTED:                result += ChannelState.CONNECTED.ordinal();                break;            case SENT:                result += ChannelState.SENT.ordinal();                break;            case DISCONNECTED:                result += ChannelState.DISCONNECTED.ordinal();                break;            case CAUGHT:                result += ChannelState.CAUGHT.ordinal();                break;            }        }    }    bh.consume(result);}
}
  • benchSiwtch里是纯switch判断
  • benchIfAndSwitch 里用一个if提前判断state是否ChannelState.RECEIVED
benchmark结果是:
Result "io.github.hengyunabc.jmh.TestBenchMarks.benchSiwtch":  576.745 ±(99.9%) 6.806 ops/s [Average]  (min, avg, max) = (490.348, 576.745, 618.360), stdev = 20.066  CI (99.9%): 569.939, 583.550
Run complete. Total time: 00:06:48Benchmark (size) Mode Cnt Score Error Units
TestBenchMarks.benchIfAndSwitch 1000000 thrpt 100 1535.867 ± 61.212 ops/s
TestBenchMarks.benchSiwtch 1000000 thrpt 100 576.745 ± 6.806 ops/s
可以看到提前if判断的确提高了代码效率,这种技巧可以放在性能要求严格的地方。
Benchmark代码:https://github.com/hengyunabc/jmh-demo
总结
  • switch对于CPU来说难以做分支预测
  • 某些switch条件如果概率比较高,可以考虑单独提前if判断,充分利用CPU的分支预测机制
原文链接

只有小组成员才能发言,加入小组>>

168个成员聚集在这个小组

加入小组

创建小组步骤

关闭

站长推荐 上一条 /9 下一条

快速回复 返回顶部 返回列表
-

推荐专区

技术干货集中营

专家问答

方案交易

用户帮助┃咨询与建议┃版主议事

工程师杂谈

项目|工程师创意

招聘|求职}工程师职场

论坛电子赛事

社区活动专版

发烧友活动

-

嵌入式论坛

ARM技术论坛

Android论坛

Linux论坛

单片机/MCU论坛

MSP430技术论坛

FPGA|CPLD|ASIC论坛

STM32/STM8技术论坛

NXP MCU 技术论坛

PIC单片机论坛

DSP论坛

瑞萨单片机论坛

嵌入式系统论坛

-

电源技术论坛

电源技术论坛

无线充电技术

-

硬件设计论坛

PCB设计论坛

电路设计论坛

电子元器件论坛

控制|传感

总线技术|接口技术

-

测试测量论坛

LabVIEW论坛

Matlab论坛

测试测量技术专区

仪器仪表技术专区

-

EDA设计论坛

multisim论坛

PADS技术论坛

Protel|AD|DXP论坛

Allegro论坛

proteus论坛|仿真论坛

EasyEDA-中国人自已的EDA工具

Orcad论坛

-

综合技术与应用

电机控制

智能电网

光电及显示

工程资源中心

汽车电子技术论坛

医疗电子论坛

-

开源硬件

-

无线通信论坛

无线通信技术专区

天线|RF射频|微波|雷达技术

-

IC设计论坛

芯片测试与失效分析

Mixed Signal/SOC[数模混合芯片设计]

Analog/RF IC设计

设计与制造封装测试

-

厂商专区

TI论坛

TI Deyisupport社区

-

检测技术与质量

电磁兼容(EMC)设计与整改

安规知识论坛

检测与认证

-

消费电子论坛

手机技术论坛

平板电脑/mid论坛

音视/视频/机顶盒论坛

-

电子论坛综合区

聚丰众筹官方社区

新人报道区

聚丰供应链

-

论坛服务区

-

供求信息发布

供需广告

电子展览展会专区

芯片求购|供应发布区