随着英特尔和AMD等大型主流科技厂商的押宝,RISC-V架构正快速崛起,其生态在嵌入式应用中也正迅速发展。随着高性能RISC-V内核的出现,RISC-V生态系统还将朝着高性能计算的方向发展。而对于通用MCU和边缘AI芯片架构来说,是选择Arm还是RISC-V?就此,多位业内专家在本文中给出了明确见解。
过去30年的计算时代发展大致可以分为三个阶段:1995年微软Windows开启了以x86架构CPU为主的PC时代;2007年苹果iPhone开启了以Arm架构为主的智能手机时代;2012年基于英伟达GPU的卷积神经网络AlexNet的成功开启了人工智能(AI)时代。AI经过10年的快速发展,已经从云端扩展到边缘和终端,渗透到数据中心、边缘服务器、5G基站和各种各样的智能终端中。
在Arm架构处理器从手机扩展到新兴物联网、汽车ADAS/自动驾驶和各种AI应用场景的同时,开源灵活的RISC-V微处理器架构也蓬勃发展起来。在越来越多的计算应用设计中,都可以看到Arm和RISC-V的身影。具体到芯片级别的硬件实现,广泛应用于嵌入式计算的微控制器(MCU)和面向边缘/端侧计算的AI芯片成了Arm和RISC-V架构微处理器内核正面对决的主战场。
可定制化的指令集(ISA)
RISC-V指令集架构从一开始就支持基础ISA、标准扩展,以及定制化ISA扩展指令。Arm最初不支持定制化扩展,但迫于竞争压力也开始向Arm生态合作伙伴开放定制化功能了。即便封闭的x86生态也开始松动,英特尔最近也开始考虑对外授权,甚至定制化扩展也有可能。
因为没有Arm和X86的历史包袱,RISC-V ISA在指令规划上比较简单。在标准指令集之上根据特定应用的需要进行扩展,为各种碎片化的新兴应用提供了极大的灵活性。例如,RISC-V矢量扩展(RVV)可以让处理器内核加速海量数据集的单指令流计算,特别适合如下计算任务:机器学习、图像压缩处理、数据加密、音频和视频多媒体处理、语音识别和自然语言处理。这些正是新兴物联网应用中实施AI所必须的计算任务。
RISC-V对定制化扩展指令的支持在某些特定应用中可能是设计成败的关键所在。使用定制化扩展指令与其主ISA并不冲突,可以同时支持通用的RISC-V软件。
在上面的RISC-V软件堆栈示意图中,带定制化ISA扩展的RISC-V处理器可以支持对实时性要求比较高的嵌入式OS(比如embOS、FreeRTOS或RT-Thread),也可以支持对处理性能要求比较高的OS(比如Linux、Android或Windows)。其上的App1不需要性能增强,也不采用定制化ISA扩展指令,只需要标准的编译器就行了。而App2和App3采用了定制化ISA扩展以增强性能,因此必须使用兼容定制化ISA扩展的编译器。
Codasip是一家专注于RISC-V和特定域架构(DSA)处理器方案的欧洲开发商。该公司CTO ZdeněkPřikryl(裴德)在接受《电子工程专辑》采访时表示,对于任何一个MCU厂商来说,无论基于RISC-V还是Arm架构,如果采用的是通用设计,那么在性能上就一定会有所妥协。人工智能通常要求较高的处理性能,而边缘应用则需要低功耗、小尺寸的MCU。但现实情况是,通用处理器内核很少有适于这种组合的性能要求。对于一些边缘AI应用,通过在RISC-V处理器内核中添加定制指令可以使算法在相对有限的处理资源中得到充分执行。而可定制的领域专用架构能够使处理器更适合AI算法和软件工作负载。
微处理器内核对性能的影响
处理器内核架构是影响处理器性能的关键因素,先进的架构具有更强大的指令集和更优秀的运算单元,因而拥有更为强大的算力。而在相同处理器架构下,采用不同的实现技术也会影响到性能的发挥。例如,采用总线并发架构技术实现CPU无等待指令访问,可比同级别处理器运算性能提高30%以上。
对于MCU性能,要从两个维度来衡量,一方面是主频,另一方面就是内核架构。主频很容易理解,类似于速度,对于同一种架构的MCU,当然是主频越高MCU的速度就越快。先进的架构可以使内核在单位时间内执行更多的指令,也就是完成更多的任务。因此,不同架构的MCU如果只看主频,是无法判断其性能高低的。一般来说,越先进的内核架构,在单位时间内可以执行的指令数和处理数据的数量就越多。
由此可以看出,主频越高且内核架构越先进的MCU,其性能就越好。这可以类比为赛跑:当步幅一样大(即架构相同)的时候,步频快(主频高)的选手跑得就快;而当步频一样(主频相同)时,步幅大(即指令执行效率高)的选手跑得就快。
当然还有其他影响因素,内存容量大小以及晶圆工艺等也都会在一定程度上影响处理器性能。例如,缓存越大,处理器访问数据的命中率越高,内核计算的效能就越高。
通常情况下,嵌入式MCU对处理器内核的主要诉求为稳定、可靠、安全、实时等控制特性需求,而边缘AI芯片往往要求更高的计算性能和存储容量,以及更低的功耗。对MCU来说,不同架构内核的区别更多地体现在软件和开发生态上,而不是性能上。对于AI芯片,除了通用处理器的功能要求以外,还会有针对算法和应用的需求,这可能需要相关的算力和性能,比如SIMD/Vector能力、DSP能力、扩展指令的开放性等。
MCU:Arm还是RISC-V?
根据国民技术市场总监颜君生的看法,在MCU市场,Arm内核目前占比最大,其生态比较健全,架构也已经完善成熟了,因此应用十分广泛。但Arm内核局限于封闭的指令集架构、授权及专利费用,不方便细分定制。此外,不同Arm内核的性能差异较大,而随着Arm内核工作频率的提升,MCU芯片的能耗增加很快。因此,采用高主频Arm内核的MCU芯片如何降低能耗,这对MCU厂商来说是个不小的挑战。
对通用MCU来说,采用Arm架构的好处是可以跟主流的生态保持兼容,充分复用现有的应用设计,降低design-in的门槛。大多数国产MCU厂商都是基于这个理念而切入MCU市场的,事实证明这也符合中国半导体行业的发展需求。然而,这样做的危害也日渐凸显,我们已经看到国产MCU芯片的同质化问题越来越严重。如果只能在价格上竞争,这对整个行业和其中的大部分公司都没有益处。一些有实力和远见的国产MCU厂商已经意识到这一点,并开始转向差异化的产品规划和市场竞争。
在处理器内核的选择上,除Arm外现在还有RISC-V。RISC-V架构具有低功耗、低成本、开源开放、可模块化、简洁、面积小和速度快等优点。但其缺点也很明显,主要表现在:开发工具链不够友好;软件生态不够完善;没有丰富的芯片系列选型。归结到底,其实是因为发展时间太短,整体生态不完善。
据爱普特微电子产品市场总监魏璐称,其公司从成立之初就一直坚持使用自主产权的内核和MCU所需要的各种IP。虽然通过技术研发创新来实现微处理器的自主可控十分艰难,但坚持下来的价值和优势也十分明显。针对目前RISC-V MCU的发展痛点,爱普特与平头哥一起合作打造了一个“开发编辑工具链”。目前编译器已经可以支持“所见即所得”,支持包括AliOS在内的多个RTOS,整个工具连从底层到基础系统,再到核心组件都已实现完整生态。
针对工程师和开发者面临的开发选型丰富度不够问题,爱普特开发了完整系列的RISC-V产品:引脚从20Pin直到200Pin,频率从32KHz直到2GHz,处理器从32位到64位。魏璐表示,其公司计划发布25个系列,超过300多个型号的RISC-V产品,覆盖消费类、工控类和车规级应用。
边缘AI芯片:Arm还是RISC-V?
时擎科技是一家基于RISC-V内核开发边缘AI芯片的初创公司,其联合创始人兼总裁于欣在接受《电子工程专辑》采访时表达了对Arm和RISC-V架构的观点。Arm拥有更好的生态,包括开发工具、操作系统支持和广泛的开发者基础,以及更丰富的可选型号。然而,AI芯片更需要的是对于各类人工智能算法的高效支持,而这本身不是通用处理器的强项。如果仅仅通过Arm原生的VFP、NEON等扩展,起到的效果还是比较有限的。因此,AI芯片需要更专用的处理器内核,这就在Arm(或者说通用处理器)覆盖的范围之外了。
与Arm相反,RISC-V的开放性、模块化及可扩展特性会帮助AI处理器更好地与应用和算法特点及需求相结合。时擎在这方面也做了一些探索,基于RISC-V架构开发的Timesformer处理器就是针对端侧语音和视觉算法特点而设计的DSA处理器,这也是RISC-V所具有的独特优势。
在软件和生态方面,基于RISC-V架构的AI芯片目前还会遇到一些挑战。但是由于AI应用往往需要芯片原厂提供芯片+算法的完整解决方案,底层的架构对于大多数下游客户来说并不是特别敏感,这在一定程度上掩盖了RISC-V的缺失。
微处理器与应用的最佳匹配
对于处理器架构,没有绝对的好与坏,而要看具体的应用需求。偏通用型的芯片采用Arm架构会存在得天独厚的优势,短时间来看还是难以撼动的。Arm是一个32位精简指令集(RISC)处理器架构,其应用领域十分广泛,目前主要有手机、PC、服务器、汽车、物联网、人工智能解决方案等。在新兴应用领域,特别是在智能控制、边缘计算、便携式产品等嵌入式产品应用领域,Arm架构处理器具有非常好的应用前景。例如,物联网、工业联网及工业控制、智能家电及智能家庭物联网终端、消费电子、电机驱动、电池及能源管理、智能表计、医疗电子、汽车电子、安防、生物识别、通讯、传感器、机器自动化等,都非常适合采用Arm架构的MCU产品。
据颜君生介绍,国民技术目前主要基于Arm Cortex-M0、Cortex-M4、Cortex-M7等内核平台开发系列芯片产品,其中以通用MCU、安全芯片和无线射频为主,现已广泛应用于电控、工业、车载、医疗、物联网、消费等领域,并正在扩展到车规MCU、数字电源、电机控制等细分MCU市场。
物联网类应用和专用性较强的应用比较适合采用基于RISC-V的MCU。RISC-V是一种适合通用MCU和特定领域专用加速器(例如AI)的ISA,具有模块化和可定制的优势,这意味着它可以被部署以满足特定应用的需求,因此可以为物联网应用的不同需求‘量体裁衣’。物联网应用属于长尾市场,碎片化很严重,有很多绝对体量不大但种类繁多的应用陆续显现出来。至于专用性市场,RISC-V凭借着开源和低成本的特性,更加如鱼得水。
据魏璐透露,爱普特计划2022年同步进军通用市场和专用市场。在专用市场方面,其新产品将覆盖公司已经涉足的领域,包括电机驱动、触摸按键、HMI、智能语音等应用场景;通用市场方面,计划推出具有各种丰富外设的通用型MCU,从48MHz到250MHz,存储容量从64K/8K到512K/128K全覆盖,外设方面也包括了USB、CAN、SDIO、加密引擎等关键外设。
时擎于欣认为,对于偏专用型的AI芯片,即需要通过底层架构创新来实现更好的算法和硬件融合的芯片,RISC-V可能是个不错的选择,可以让芯片开发者有更多的灵活性来设计处理器的微架构,并且一些底层和基础的工具链和指令集不需要从零开始去造轮子,也在很大程度上是对现阶段RISC-V扬长避短的可行做法。
未来生态发展
Arm的精简指令集功耗较小、价格便宜、并发处理效率高、升级速度快,而且Arm自带物联网基因,在5G网络基础设施和物联网应用领域具有竞争优势。Arm目前的趋势是往服务器和高性能计算的方向发展,也许会蚕食更多X86的份额。Arm未来面对的市场主要包括服务器、移动终端、ICT基础设施、汽车、嵌入式等场景。Arm生态在以上这些应用方面的整体可参与度和市场上升空间都十分巨大,有着非常好的发展前景。
目前整个MCU生态绝大部分仍被Arm架构主导,许多厂商选择仿制和兼容欧美芯片这条捷径。但是慢慢地,我们看到越来越多的国产厂商加入RISC-V这个行列。现在终端客户也开始接受RISC-V MCU了。
谈及RISC-V MCU生态建设,魏璐表示爱普特将携手平头哥一起打造完整的RISC-V工具链和完整MCU生态。除了RISC-V的CSI组件认证外,爱普特还会打造“1520”生态标准,即1天上手、5天出原型,20天量产。目前爱普特已独立开发了完整的开发套件,包括调试工具、烧录工具、编译软件等,可以让工程师很方便地使用RISC-V MCU。
RISC-V生态在嵌入式应用中得到了迅速发展。随着高性能RISC-V内核的出现,RISC-V生态系统将朝着高性能计算的方向发展。但是,在可以预见的未来(比方说3-5年内),RISC-V想要与Arm分庭抗礼,全面对抗还是比较困难的。于欣认为,RISC-V也许可以先从一些细分领域突破,再去寻求以点带面,这是比较现实的路径。某些细分领域对生态不敏感,对差异化要求比较高,比如端侧AI芯片。此外,对于国内市场来说,对“自主可控”有着更高要求的领域也是RISC-V发展的沃土,比如信创行业。
总的来说,作为后来者和相对小众的RISC-V,需要立足其开放、精简、可扩展、模块化这些优势,充分扬长避短,才有可能一步步发展壮大,最终形成与Arm和X86“三分天下”之势。
来源:电子工程专辑
参考原文:[通用MCU和边缘AI芯片之选:Arm还是RISC-V?]