完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
全球芯片上以光速的协调 新兴的互联技术用于G尺度集成 ieee电脑设计与测试 2010.9 2020-1-7 lpda的通讯媒体为电磁波,其能力毕竟有限,随着互联网的发展,和光学理论的应用,取长补短,则优互补,光电集成的天线通讯方式,这里了解一下,微观的单一个芯片上的多芯(数十数百或者更多)之间通过这种微观的光电纳米天线的数据通讯交通的优化和协调。 ******************** 芯片上光学链接对于大量的多芯片的通讯背骨设计是一种有效的方式。使用纳米光学技术让设计者给多芯芯片开发一种低功率,低潜在的互连基础。 ******************** 两种物业,全球在芯片协调的必要性,全球覆盖,潜在关键,纳米光学技术,纳米光学广播网络,物理设计与集成,结构设计与协调,协议支持,通讯资源分配,实验结果,缓存一致性协调,网络资源协调,功率效率评估,新兴的多芯芯片,致谢,和参考资料 ********************************** 两种物业从物质上贡献给军队的能力成功地发起一场战争是士兵,武器和物资的部队协调和运输。前者在现代已经更加重要。两种广播技术,无线电(首次部署于第一次世界大战),和手提无线电话机(首次部署于第二次世界大战)已经提供了量子进步,首先是在集中,然后是分布式团队协调。 目前数十到数百的芯已经集成到了单一个芯片,运输和协调,我们称为“计算团队”是一个炽热的话题。大量的数据必须分布于计算节点中,通过高通互联,而多线平行程序请求线程中的即时协调。采用同步信息协调线程执行,一致性协议信息消减了来管理数据分享和缓存线布局,而仲裁信息用于配置全球资源,例如运输网络中分享的链接。不同于在芯片上的数据运输,这些协调信心的大小通常短,但是具有多个目的地,而且潜在关键性。 可是电气互联对于这个问题不合适。金属的互联线的性能和损耗不如三极管所能达到的尺度。全球的在芯片通讯变得缓慢且昂贵较之于有源器件中的处理。要讲解这些挑战,大量的注意力集中在新的电气,光学在芯片上的通讯解决方案上了。可以实现高通的数据传输,但是低潜在多目标协调仍然是一个挑战。 包开关电气互联制造在多处理器中逐渐采用(MPSoCs),而通用芯片多处理器(CMPs)演示了优良的吞吐量手段。可是在功率效率和潜在可量测性方面还远远不理想。对于功率,包开关互联,因为它们的富裕的全球金属线和复杂的路由器结构,消耗了多于25%的总芯片损耗。对于性能,包开关的电气网络引入了过度和变量的潜在性,因为运行时间多跳数据缓冲,资源仲裁,和链接竞争。随着在片上的处理器芯的数量增加,最严重的潜在情况和承受的功率损耗随着每个包的跳跃次数的平均数增加。更为严重的是,必须广播或者多播的协调信息翻译成一个系列的独立单播放信息,并且通过网络继电出去。所以潜在性由最慢的单包播放来确定,进一步约束了总体通讯网络的性能。最近的研究学习显示,甚至如果仅仅多播总的在芯片网络上的交通的一小部分,整个网络的潜在性和吞吐量可能实质性地变坏,取消了电气包开关在芯片上网络的点到点效率和性能的优点。 纳米光学通讯技术保证地址性能和功率瓶颈更有效。一项最近的研究学习显示纳米光学互联可以提供吞吐量的次数倍的幅度增长,以及电气互联上的潜在性和功率效率。在硅光学器件,纳米电路设计,和制造上的实质上的进展让纳米光学互联几乎触手可及。所有必要的纳米光学部件(发射器,波导,和接收器),除了激光源之外,都已经成功地集成在芯片上了,并且演示了鼓励性的性能和功率效益的侧面。力量纳米光学技术,最近提出的在芯片上的光学互联设计焦距在吞吐量束搏的交通通讯的效率。 很不幸,甚至对于光学互联,潜在的严重性协调信息没有处理好,主要是因为光学部件的制造和在芯片上集成的挑战。特别是,以一种互补金属氧化硅(CMOS)兼容的方式制造光学缓冲器很困难,而且光电信号的转换消耗大量功率。结果,纳米光学在芯片上的通讯解决方案是回路开关,常常取消设立电路给一种潜在优化的电气网络,或者标记协议管理纳米光学网络的使用,以一种环形知更鸟的形式在在芯片计算和通讯单元内。对于短,潜在重要的协调信息这有效地增加了通讯潜在性。另外,由于硅的低电光系数,光电接口功耗大。常常广播协调信息或者多载,使得有必要设立多重回路,并且对于每次协调交易从新发射信息,更进一步加剧了通讯潜在性和能耗。 我们提议了一种CMOS兼容,低潜在性和能效好的纳米光学广播解决方案来挑战全球的协调于许多多芯系统和并行应用设计。这种解决方案包含有一种纳米光学天线阵列提供了在芯片处理和记忆单元的整体覆盖,广播光学信号以低潜在性高效的形式。短潜在重要性频繁广播或者多载协调信息可以以光速广播或者多载。我们的研究学习显示这种解决方案提供的有效全球协调可以有意义地增强现存的一致性和同步协议。我们的纳米光学广播解决方案还可以有益于管理其它在芯片通讯资源,例如,路径的设立给回路开关的在芯片上的网络。 我们集成了提议了低潜在广播网络带一种线性波导基,全通优化,回路开关的纳米光学网络。我们做了实 验,使用一个64芯的CMP设立来比较我们提议的解决方案与两种先进的选项:一种电气窥探基的解决方案和 一种混合的窥探基的光电解决方案。我们提议的解决方案减少了缓存丢失潜在性28.7%和6.6%,并且减少了 网络能耗77.1%和66.5%,比较与相对的电气和混合的解决方案。另外,比较于一种电气目录基的解决方案 和一个混合的目录基光电解决方案,我们的解决方案相应地减少了缓存丢失潜在性50.7%和47.5%,并且相 应地减少了网络能耗60.7%和60.5%。 全球在芯片上协调的必要性 低潜在性和能效协调机制对于可测尺度多芯系统设计和平行编程是基础。在一种多芯系统中,协调性运行 几乎覆盖了运行时间系统资源的每个反方面和工作负载的管理,例如计算的同步性,一致性存储,和通讯 的仲裁。所有这些分享了下列类似的特征: !全球覆盖. 一种协调交易典型地是多载或者广播,包含一个子集,或者全部的在芯片上的处理和记忆单元,以及运行时间处理或者多线程。 !潜在重要性. 每一种交易包含一组短的,和带宽不灵敏的信息。可是,这些信息是潜在性重要,由于它们典型地是在系统性能重要性路径。 ********?(图1.示意图)?************ 图1.缓存丢失潜在与和不与广播媒体. 一致性协议延迟(周期)/缓存丢失注入率(每个周期的丢失次数) 电气目录,光学窥探,和电气窥探 为了进一步示范对全球在芯片调节的一种低潜在广播通讯媒体的需求,我们使用在芯片缓存一致性问题做为一个研究学习的案例。 在多芯计算机系统中, 一个缓存协议协调汇流存取和分享数据的修改。本质上协议定位了最新的缓存线程拷贝,当一次缓存丢失发生时,并且进行了写操作。缓存一致性交易是在系统性能重要性路径,并且包含发出短,潜在重要性信息至多或者全部的在芯片缓存块。多芯系统可以进一步进行,仅仅在定位了有效数据之后,和传回,在每次缓存一致性交易的结束。 一种低潜在性广播通讯媒体可以有意义地有益于缓存一致性交易。下一步,我们描述了一个实验,一个16芯的CMP运行一组戏水2(Splash2)平行工作负载。我们评估了三类在芯片通讯媒体: ! 电气窥探,一种电气树网络运行一种窥探一致性协议; ! 电气目录 一种包开关的电气在芯片网状网运行一种分布式目录基缓存一致性协议;并且 ! 光学窥探,我们提议的一种纳米光学广播网络运行一种窥探一致性协议。 与一种窥探协议比较,一种本质的广播基方法,广播目录基协议改善了系统尺度可测性,通过减少多载的要求。如图1所示,目录基缓存一致性协议展示了优越的系统尺度可测性,但是它引入了有效的潜在性比较与纳米光学广播解决方案,在低或者正常的工作之下。这主要是因为目录存取和前向交易,以及下面的电气包开关网络的路由器潜在性。图1还显示了如果提供了一种低潜在性广播媒体,一种窥探协议例如光学窥探提供了一种更加好的潜在性手段。可是,现存的电气解决方案不能测量大数量的芯片芯数。过度的阻容(RC)延迟于全球的金属导线和插入的路由器引入了有意义的潜在性, 甚至是在低交通工作负载之下。我们的实验突现了一种低潜在性,低功率互联解决方案的需求,带有效的广播和多载持。 纳米光学技术 在我们详细地设计我们的开发,对纳米光学技术的概观是有意的。 对于性能,纳米光学技术明显是一种可靠的解决方案,对于解释早先提到的挑战,感谢它的光速在芯片传播速度。另一方面,能耗是另一个关键设计的关注,因为新兴的多芯系统设计是受功率限制的。 现在让我们焦距在纳米光学功率分析上。与电线比较,光学波导具有优秀和尺度可测的能效,主要是由于光在波导中很强地限制了,和灵敏的注锗测光设计。博索雷等显示甚至对于一个保守的40-Gbps通道,光学功率小于2.6微瓦(uW),其可忽略比较与一个现代多芯系统的整体功率规划。另一方面,纳米光学互联的功耗主要是由于光电转换,归咎于硅的低光电系数。有报道一种先进的收发机对每个通道损耗317uW(217uW发和100uW收),带有一个集成的调制解调器和检测器设计。所以覆盖了所有的纳米光学链接功率,主要是电功率,独立于距离。另外,发射机的功率,主要的功率部件,在广播和多载中自然分享,使得建造一个纳米光学广播解决方案有吸引力。 图2使用纳米光学和电气技术评估了在芯片上广播通讯的功效。电气网络是一个N X N网状网络。我们通过假设广播中最少的包复制来估算电气广播中的最小的功率损耗。特别地,在一个N X N网状网络中一个包要求至少触发N**2个路由器和(N-1)(N+1)链接。对于45纳米(nm)(电气;E-45nm)和32纳米(nm)(电气;E-32nm)技术节点的计算基于来至普林斯顿大学的网络在线信息检索(Orion2.0)的计算。对于纳米光学广播,功耗的估算假设光学功率明显地分布于所有的接收器。电流和进一步的部件功率的计算基于最近由陈氏等制造的结果(P-现在),和相应的博索雷等的预测。 *************?(图2.示意图)?***************** 图2.广播的功率损耗(电气;光学) 电气功率(毫瓦)/光学功率(毫瓦),路由器,链接,收发器,光学 芯,纳米,现在,将来 图2显示先进的纳米技术功效是幅度的一个次数高于其电气选项。随着技术的进一步尺度测量,纳米技术的功耗,特别是光学部件,会进一步改善。一种电气互联的功率损耗,另一番方面,会增加。所以对于功率局限的多芯系统,纳米光学互联变得更具吸引力。 这里我们呈现了我们提议的纳米光学广播网络给低潜在性全球在芯片协调于多芯系统。我们是在提议设计的制造过程,使用一种CMOS兼容,硅在绝缘体上(SOI)制造过程。集成了线性波导基的,吞吐量优化的,电路开关网络,这一解决方案使能低潜在性,高吞吐量,和在芯片通讯上的功效对于多芯系统。 物理设计和集成 *********?(图3示意图)?************ 图3.广播天线设计的多芯系统集成:具有,a.片上广播光学网络,b.天线阵列,及 c.制作天线。 芯片和存储体,天线阵列,光学器件(例如环形共振器),和离线激光电源 图3a示范了我们提议的网络的结构和多芯系统集成。纳米光学广播网络制造和优化在一个SOI层上。三维(3D)集成技术使能了垂直集成这种广播层与下层的CMOS层,其包含有处理和记忆部件,以及电气电路支持纳米光学器件的运行。 纳米光学广播网络 纳米光学广播网络,位置于3D堆栈的顶部,包含有光学发射机,接收机,线性波导,和一个光学广播天线阵列。光学天线以纳米尺度印刷在SOI层的中心,如图3b所示广播与接收光学信号。杠杆力波长分区多路转换(WDM)技术,有可能同时广播多信号流通过不同的波长通道。广播天线阵列是我们提议的设计的独特性能之一。天线棒(例如光学波导)延伸的释放来分布纳米光学器件的位置,其中继发射和接收器之间的信息。陈氏等演示了集成的低功率光学链接收发机设计使用微环-共振-增强型硅调制解调器,并集成波导,锗注入硅光学检测器,以G赫兹范围的速度。纳米光学研究的较近期的前沿使能了集成结构的硅光学器件。 大多数光学器件的特征大小是在微米(uM)范围。例如,提议的天线阵列含有64个天线的半径大约是10um。总的来说,头顶上的纳米光学网络并不是一种主要的设计限制。 我们设计并制作了一种新颖的天线结构,其形式类似于微波介电杆天线。为了使能宽带电磁辐射,我们制作天线通过光刻腐蚀槽沿着单模式SOI波导结构(220nm高和450nm高)。波导中传送的信号功率将从天线辐射,并形成一束图形指向一定的角度。光刻过程可以产生一种合理的膜细节复制,除了有些边缘锐度的丢失,其对天线的运作不重要。多天线布置在一起(离开几个微米(uM))来相互通讯,如图3b所示,我们覆盖了350nm厚的光电聚合物在这些结构上,形成一种本质上两维(2D)的平面波导层。因为聚合物场的约束,天线束宽度在垂直方向变化非常少,无论它传播的多么远。这意味着功率传输将主要焦距在SOI 2D屏面层。周氏和菲利波维奇验证了这种2D广播天线阵列的设计使用电磁仿真。图3c显示了起初的制作结果,其中我们初始的评估显示来演示高广播功效。 相对于性能,这一广播网络设计提供了高速传输。通讯带宽等于WDM通道数乘以每WDM通道的位速率。后者假设是4G(位每秒)bps;达到这一位速率在最近的将来是可预见的到的。在芯片上传输工作在18Gbps及接收器工作在40Gbps有独立演示。陈氏等已经有显示了集成的收发机对子制作在CMOS兼容处理过程来达到3Gbps。对于一种64WDM通道的配置,广播网络的宽度是256Gbps。 下面的分析显示我们的纳米光学广播网络是高功效的,并且可以可靠地运作在毫瓦(mW)范围对于64WDM通道和4Gbps每通道。 我们如下估计网络功效。给出一个目标的通讯位出错率(BER)和系统热噪音,我们可以确定最小的由光检测器接收的要求的信号功率。10**-12的BER对于多G位的传输是典型的要求。天线阵列的辐射然后确定评估了要求的输入功率。在目标的多Gbps运行速度范围,热噪音主导了发射噪音。假设纳米光学网络工作在热噪音极限内,我们可以计算要求的输出光学功率给一个纳米光学链接使用高斯模型如下: ******?Poptical=2*Q*PNA**0.5/(R*ZL**0.5)=~-44dBm?******** 这里Q是信噪比,R是光检测器的响应度,而ZL是负载阻抗。另外,?PNA是热噪音功率,有?PNA=4kT(Delta f)?,这里k是波兹曼常数,T是绝对温度,而?Delta f是有效的噪音宽度。BER和Q之间的关系如下: ******?BER=1/2*erfc*(Q/2**0.5)?******** 这里?erfc是互补误差函数。我们假设了-30dBm(1uW)的保守的接收灵敏度。最近沙尼等演示了一种锗光检测器设计在SOI上有200纳瓦(nW)的灵敏度,和仅仅40皮秒(ps)的一个响应时间。甚至,博索雷等预测一个光检测灵敏度小于130nW对于2Gbps的通讯。 下面我们解释如何成型了广播天线的结构,作为一个功率调节器。 在我们的提议设计中,信号分散可以忽略,在目标的多Gbps运行速度范围和cM(厘米)范围传播距离,并且系统部件视为一系列的传输系数。做为基础和主要的微调,功率传输因子(Tran)如下确定: *******?Tran=Pr/Pt=n?/N?********* 这里在天线中的耦合效率,?n,是增强的接收功率百分数对总的传输功率。另外,?Pr是接收功率,?Pt是发射功率,而N是接收天线的数量。电磁分析显示,在提议的设计中,多于70%的传输天线功率由接收天线均匀地收集。假设N=64,?Tran所以大约是19.6分贝(dB)。 这一分析演示要达到要求的BER需要91微瓦每通道,假设一个接收器的灵敏度是-30dBm(91?uM=-10.4dBm=19.6dB-30dBm)。支撑的64WDM通道所以所以大约要求5.8毫瓦。提议的纳米光学广播网络有高的功率效益。要求的激光功率线性正比于芯片的芯数。 结构设计与协调 在协议层次,我们的解决方案提供了低潜在性广播互联介质给一致性协议交易的短,潜在重要性的协调信息。在网络的层次,当集成了吞吐量优化的回路开关网络,我们的广播网络还提供了一种低潜在性控制方案给回路开关通讯路径设立和协调吞吐量约束的在芯片上的数据交通。 协议支持. 提议的纳米光学网络以光速传输了潜在重要性的协议交易信息给所有的在芯片上的节点,通过WDM光学广播通道。这一网络可以有效地支持全球的交易次序,并指导缓存至缓存的传输以利于在芯片数据分享和协调。 窥探协议有三个阶段: ! 缓存丢失请求。 当一个本地缓存丢失发生时,一个请求必须广播到所有的在芯片上的芯。多芯会同时发出请求。在一种广播介质,每个芯见到所有的请求在它们许可的相同的全球次序。有效系列化的请求保证了一个分布式在芯片缓存的一致性。 ! 窥探响应。 多处理器节点可能含有要求的缓存线程。对于一个写丢失,这些节点将会无效它们的本地的旧的拷贝。对于一个读丢失,仅有一个这些节点必须服务于请求(例如缓存至缓存传输)。服务节点的确定是通过第一个节点它可以发送它的窥探响应在广播网络上。因为广播交通在所有的节点可视以相同的全球次序,最快的响应可以服务,而其它的必须废弃它们的试图。 ! 数据响应。为了最小化仲裁和竞争,广播网络可以协调大的缓存线程的传输,通过带宽优化的回路开关网络。 提议的网络执行了首先两个潜在重要性阶段,而吞吐量优化在芯片上光电网络处理了吞吐量饥荒的数据请求。 在一个经典的窥探协议之上,我们的解决方案可以支持不同的缓存一致性协议非常依赖于广播。这一柔性有利于标记一致性通过提供一种有效的途径给广播瞬态请求,并使能一种低潜在性标记传输机制。协议在AMD的一致性超传输和英特尔的快通道互联技术很好地使用了广播信息,其中我们提议的设计也可改善。 通讯资源分配 广播纳米光学网络也提供了一种低潜在性分配机制给在芯片上通讯的管理。两种典型的应用是 !仲裁广播网络本身当多芯必须同时发送信息;和 !设立一个回路开关路径在无缓冲回路开关在芯片网络。 杠杆式网络特性的网络和WDM,我们提议了一种分布式全球仲裁方案,其使能了一个周期的仲裁来解析资源冲突。有这一方案,W处理器节点可以杠杆W广播网络来仲裁一个分享的资源。仲裁方案起始于分派一个独特的动态优先级给每个节点。每个节点广播1的一个信号,在通道上对应于它的动态优先级。同时每个节点也聆听组合的信息广播于整个波长。如果多节点试图存取相同的资源,它们将会见到相同的位向量,反射所有请求节点的动态优先级。每个节点装备有检查逻辑来检验位向量中的任何位,比它自己具有一个更高的优先级。若如此,节点检测它失去了仲裁。每次数据传输之后,每个节点改变了它的动态优先级,使用一个确定性的随机数发生器。因为所有的节点分享相同的随机数种子,它们总是同意在相同的全球优先级。 为了仲裁相同的?K资源(例如多广播通道),?W节点还可以杠杆广播网络的的W WDM通道。唯一的差别是每一个节点将分配一个仲裁中的资源身份(ID)。仲裁方案变成了?K平行?(W/K):1?仲裁。回路开关路径的设立可以认为是一组串行分享链接的仲裁。为此,路径设立可以用类似的方式在广播网络中实现。 例如,在维度次数路由中,路径的设立分解为原子级的仲裁给一个水平和垂直的波导。 实验结果 这里我们评估了我们开发提议的广播纳米光学网络,并且验证了全球在芯片协调的性能和功效给协议支持和资源管理。我们进行了三种实验性研究学习,使用一个64芯的CMP设计。对于这些研究学习,我们建模每个在芯片上的芯为一个2G赫兹(Hz)阿尔法21264类似处理器芯, 带一个64千字节(Kb)芯内L1缓存和一个256Kb芯内L2缓存。 我们还开发了一个轨迹驱动,周期精确的缓存网络仿真器。这个仿真器模拟了记忆体层次的运行操作,和在芯片网络,以及缓存一致性协议交易。 我们收集了记忆体存取轨迹,使用M5全系统仿真器运行在一组多线程基准SPEC OMP,Splash,和ALPBBench:ammp, apsi, equake, fma3d, wupwise, swim, ocean, radix, cholesky, waternsq, lu, fft, 和mpgenc.我们还考虑收集了轨迹来自三个商业服务器的工作负载: TPC-H和TPC-W,从交易处理性能委员会,和SpecJBB(Java 商业基准)。每种基准都大量生产为16个线程。我们统一了四个基准为64芯的芯片,并且同时执行它们模拟虚拟机器运行时间的工作负载管理。 我们基于早先描述的功率分析和近期的纳米光学器件的研究学习,估算了广播网络的性能和功耗。表一,显示了广播网络的布局。性能分析使用先进的硅光学器件显示了大约240ps收发通讯的潜在性。 所以,峰值频率大约是4GHz,是电气同行的速度的两倍,估算基于国际技术路图半导体(ITRS).我们还考虑了一个64WDM通道设置来提供足够的通讯带宽和同时的传输支持。 未来技术进展和正确的排管线方案可以进一步改善纳米光学广播网络的速度。 我们进一步集成了我们的纳米光学广播网络和一个线性波导基的,吞吐量优化的,回路开关网状网络来处理吞吐量饥荒的数据交通。 这一混合的解决方案支持了窥探修改,专用,分享,无效(MERI)协议。(在本章回的结束,我们参照为“提议的解决方案。”) 为了比较的目的,我们还考虑了下列四种先进的光电选择: !S-电气.这个树状基的电气网络工作在一个一致性区域类似于Oracle的太阳火飞机系统互联,其支持了窥探协议。地址总线实现在层次的树状拓扑,带每个节点4的分散。数据总线是一个包开关的电网状网络。 !S-光学. 这个线性波导基光学网洛支持窥探协议。它包含有一组蛇形波导链接所有的在芯片处理单元。光学信号沿每个波导广播。 !D-电气.这一包开关的电气网状网络使用虚拟通道流通控制。支持一个分布的目录基协议,这里原址多节点按8 X 8系统分布有一个均匀的隔离地址空间。它的潜在性通过一个三管线台阶路由器设计。 !D-光学. 这个线性光学波导基,回路开关网状网络支持目录协议。这个网络等同于线性波导基,吞吐量优化的子网络,在提议的解决方案中,但是没有广播媒体。 取而代之,另一个潜在的优化电气网状网络是回路开关路径设立所需要的。 缓存一致性协调 这个实验评估了我们所提议的广播网络。图4.显示了平均的L2缓存丢失潜在性(读和写)。在这个实验中,缓存丢失潜在性分解成下列三种部分: !缓存丢失请求潜在性(标记为“请求”), !响应潜在性定位和回复缓存拷贝(标记为“响应”),和 !记忆体存取潜在性(标记为“记忆体”)。 *********?(表一)?*********** 表一. 广播网络布局 首先的两个部分(请求和响应)测量了缓存一致性协议的性能。如所见,我们提议的设计有效地减少了协议交易潜在性。总体上讲,与D电气和D光学比较,提议的解决方案减少了本地L2缓存丢失潜在性对应的平均值为50.7%和47.5%。另外S电气,虽然支持相同的窥探协议,在目录协议选项上提供了有限的潜在性减少,原因为电气层状树慢。S-电气还会造成网络拥挤在高交通工作负荷之下。S光学提供类似而较少的潜在减少较之于提议的解决方案。这是由于S光学工作在一个较低的频率,由于波导的长度,和传播延时,它的蛇形波导,线性正比于在芯片上的芯数。在提议的解决方案中,另一方面,最长的广播距离是芯片的对角。 总而言之,较之于S电气和S光学,提议的解决方案减少总体平均L2缓存丢失潜在性为28.7%和6.6%,相应地。这一实验演示了我们的广播网络使能了缓存一致性交易的低潜在性协调。 网络资源协调 这个实验使用提议的广播方案评估了网络资源协调的性能。在解决方案中我们提议了线性波导基,吞吐量优化,回路开关网络来处理吞吐量约束的交通(例如缓存线程数据).它的运行时间管理由广播网络处理。 另外,S电气和D电气是包开关的网络;资源管理由每个独立的路由器小心地管理。在D光学中,由一个潜在性优化电气网络来处理光学回路开关路径的设立。 ***********?(图4.示意图)?************** 图4.平均本地L2丢失潜在分解 L2丢失潜在(时钟周期) 请求,响应和记忆,支撑,S-光学,S-电气,D-光学,和D-电气。 ***********?(图5.示意图)?************** 图5.网络潜在分解 数据包潜在(时钟周期),支撑,S-光学,S-电气,竞争,飞行,仲裁,和连载 图5.显示了评估结果。网络潜在性分解为四部分:串行化潜在性,飞行时间,仲裁,和竞争。如图5所示,在提议的解决方案中仲裁和竞争潜在性是34.3%低于D光学,并类似于S电气的,这里低潜在性微小颗粒的仲裁由每一个路由器执行。这个实验指出我们的广播网络给网络资源提供了低的潜在性协调。 功效评估 这个实验评估了提议的功效。图6显示了功耗的失败.我们使用Orion2.0在32nm技术节点计算电气网络的功率。网络的电气功耗是由于路由器和链接电路。纳米光学网络的功耗主要是由于两个部件: !光学功率,它的确定是由接收机的灵敏度和最大可能的功率损失沿着光学信号传播路径(例如天线,波导,耦合器,和收发机);和 !电气功率运行光学器件,包括发射机,接收机,和光学开关。 这个实验显示所提议的解决方案比其它选项具有低的能耗。与D电气和D光学相比,提议的解决方案相应地减少网络功耗60.7%和60.5%.D光学功率特征显示了发射小常常多载信息使用单播线性波导没有功效。没有效率是由于高的收发机功耗,和电气网络的非尺寸可测性的静功耗,用于设立平面波导光学网络的回路开关链接路径的设立。这一结果进一步强调了使用广播光学技术的需求. 与S电气和S光学比较,提议的解答方案的功效更好。在S电气,电气互联引入了有效的功耗在芯片尺度广播中。在S光学,广播的包引入了有效的功耗。这是因为S光学使用了光学分离器,所以每一个节点沿波导吸取了输入光学功率的相同部分。所以,要求的输入激光功率没有随芯数的增加的尺度,是正比于芯数的指数倍。另一方面,在提议的解决方案中,要求的输入激光功率线性地正比于芯数,感谢我们采用的广播天线的技术。与S电气和S光学比较,我们提议的解决方案相应地减少了功耗77.1%和66.5%。 ***********?(图6.示意图)?************** 图6.功率消失分解 功率损耗(瓦),支撑,S-光学,S-电气,路由器,链接,光学,收发器开关 新兴的多芯在芯片系统要求功效,高熊能,在芯片通讯解决方案。特别地,支撑的低潜在性广播和多载通讯对于多芯系统性能和尺度可测能力是本质。本文描述的广播基纳米光学在芯片通讯解决方案达到了这一准则.我们所进行的三项研究学习显示通过杠杆力新颖的光学在芯片天线技术,本解决方案克服了基础的功率尺度可测能力的局限,面对现有的线性波导基设计支撑在线广播时。为此,这一解决方案提供了尺度可测性,超低潜在性,功效在芯片的全球协调。 我们使用ePIXfab制造了提议的广播天线阵列,并且我们现在正在对其进行测试。我们正在从测量的结果开发出详细的纳米光学部件的模型.下一步是把提议的设计集成到多芯芯片系统。 **************************** 附图表如下: |
|
相关推荐 |
|
只有小组成员才能发言,加入小组>>
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-12-22 11:09 , Processed in 0.641713 second(s), Total 54, Slave 41 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号