发帖

【优惠升级】华秋PCB首单最高立减100元，SMT免费贴片！！！

[问答]

浅析内存计算和数据中心网络

2448 内存数据中心

问答对人有帮助，内容完整，我也想知道答案 0 对于数据中心架构师而言，这似乎是一个简单的问题。对于从电子商务平台背后的数据库、搜索引擎中的大数据工具、突然流行的数据分析到科学代码的各种应用而言，应用响应时间的主要限制是存储延迟。与此同时，DRAM 的密度正在变得越来越高，而固态盘 (SSD) 则在变得越来越便宜。存储级内存 (SCM) 是一类新的内存设备，这类设备将在服务器卡中置入大量内存。那么为什么不将这些问题应用的所有数据都存储在内存中，从而完全消除磁盘甚至固态盘的延迟呢？ 0
2019-7-26 07:59:27　　评论淘帖0 邀请回答您可以邀请以下用户，快速回答问题 × wanqing192 该类别下有 6 个回答。邀请回答 zsjjx 该类别下有 5 个回答。邀请回答 xiezhe272 该类别下有 5 个回答。邀请回答 raylue 该类别下有 5 个回答。邀请回答 wyerwwr 该类别下有 5 个回答。邀请回答 Qwang_public 该类别下有 4 个回答。邀请回答 shenzhenqide 该类别下有 4 个回答。邀请回答 sdvjuwwrw 该类别下有 4 个回答。邀请回答 Topcbpcba 该类别下有 4 个回答。邀请回答 60user142 该类别下有 4 个回答。邀请回答 ZQW发烧友该类别下有 4 个回答。邀请回答 60user160 该类别下有 4 个回答。邀请回答 mashiquan123 该类别下有 4 个回答。邀请回答 moxlanlan 该类别下有 4 个回答。邀请回答 tunkanxi8082 该类别下有 4 个回答。邀请回答红粉小Q猪该类别下有 4 个回答。邀请回答 ickey_feng 该类别下有 4 个回答。邀请回答报纸弟弟麦花该类别下有 4 个回答。邀请回答帅帅的欧尼酱该类别下有 4 个回答。邀请回答 hjfjsdgfjdsf 该类别下有 4 个回答。邀请回答举报李英健相关推荐 • 大数据和物联网是如何影响数据中心的？ 1364 • 如何去推进新一代数据中心的发展？ 1827 • 新一代PON以及云数据中心的未来 1409 • PUE指标能准确衡量数据中心能效吗？ 1616 • 透视数据中心中的25G/50G和100G技术看完你就懂了 1847 • 数据中心机房的建设流程是怎样的？ 2228 • 数据中心电能质量检测什么？ 1364 • 为什么25G比40G更适合数据中心市场？ 1461 • 怎么实现eFuse优化服务器和数据中心电源设计？ 1374 • ARM是如何满足数据中心需求的 1232 3个回答

答案对人有帮助，有参考价值 0 这个概念很适合数据中心工作负载的不断变化的需求。许多人对用户级别的响应时间变得越来越敏感，因为用户越来越倾向于在几秒延迟后放弃搜索、在线购物或内容浏览。随着控制系统（特别是自动驾驶汽车）中开始包含机器学习或数据分析功能，实时限制得以产生，这使得延迟问题变得更加紧迫。与此同时，真正庞大的数据集也被纳入了网络角色。英特尔® 高级总工程师 David Cohen 表示：“大数据分析能力使得冷数据得以回暖。新的分析方法正在深入探究庞大的历史数据集，包括事务日志、分类账、遥测或源源不断的物联网 (IoT) 网络流，这些数据集过去只是难以理解的档案。开发人员希望分析在几秒内完成，而无需耗费数天。因此将所有数据放在主内存中是一个好方法，这将可以推动创建出一整代新应用和平台以及一个新的类别名称：内存计算。（请注意，内存计算是指数据完全存储在内存中的应用，而非嵌入到内存子系统中的处理单元。）但强大的技术也会有弊端。若要消除弊端，需要重新思考内存组织和数据中心网络架构（图 1）。这使得内存计算不仅仅是一个编程决策，更是一项工程挑战。图 1.改变数据中心网络的时机已经成熟。首先我们来了解一下它的演变。

2019-7-26 11:41:54 评论举报李敏

答案对人有帮助，有参考价值 0 更靠近内核人们对内存计算的最初反应是纷纷上马此项技术，好方法通常都是如此。争抢挤入扩展的服务器 DRAM 的数据集很快就超出了机架式服务器卡的几百 MB 的 DRAM 容量。这迫使架构师仔细观察工作负载中的数据访问模式。在 map-reduce 工作负载中，每个服务器都有自己的数据块并且服务器没有什么必要访问不在其本地 DRAM 中的数据，这没有什么大问题。这种情况下的内存计算仅仅是指划分数据集，以便每个数据块适合一个服务器卡的 DRAM 并且持久储存在此处。大多数情况下都需要访问存储在 DRAM 中的工作集的其他工作负载也是如此。然而当工作集无法存储在 DRAM 中时，挑战就来了。下一个演进步骤是使固态盘发挥作用。通过 PCIe 连接到 CPU 的服务器卡上的固态盘可以向卡中添加 1 到数 TB 的本地存储（图 2）。固态盘通常拥有用于隐藏其固有延迟的 DRAM 高速缓存，因此可以每秒生成数十万个随机读取操作，可能是写入操作数量的四分之一。通常它们会使用 NVMe 命令协议替代 PCIe，该协议适用于读写命令，而非模拟内存。图 2.如今的服务器卡具有访问内存、存储和卡外资源的三种主要互连方案。因此，当应用需要固态盘中的资源时，必须发出一个发送 NVMe 命令的系统调用，通过 PCIe 将来自固态盘的数据块传输到主内存 DRAM。管理程序可以隐藏这一进程，并使这些设备（其内部高速缓存可能有 30-40 微秒的延迟）在应用面前表现为非常缓慢的内存。依靠本地固态盘并不是真正的内存计算，只是对于应用而言看上去如此。这一现实（特别是 40 微秒的延迟）增加了对下一个演进步骤 SCM的需求。这类内存的密度几乎与 NAND 闪存一样，但速度几乎与 DRAM 一样，可创建一个非常快速的固态盘，或以 DIMM 格式创建并直接插入服务器卡的 DRAM 总线。SCM 的当前备选选项也是非易失性的。这听起来很棒，但问题是这些技术实际上并没有以 DIMM 格式出现，所以目前它们只是另一种构建固态盘的方式。如果我们确实获得 SCM DIMM，那么内存计算将会有很大提升，将 40 微秒的延迟缩短为 4 微秒左右。它们还会将服务器卡 DRAM 总线上的主内存容量从几百 MB 提升到 24 TB。现在我们有一个硬件平台，可以为实际数据集提供真正的内存计算。

2019-7-26 11:42:03 评论举报王瑞

答案对人有帮助，有参考价值 0 扩展但是，每个服务器卡上的大内存容量并不能解决所有问题。Cohen 指出，许多应用必须保存事务日志和检查点，即使在持久内存中运行也不例外。非易失性内存无法防止数据集受到漏洞或恶意攻击。这些可能会导致从服务器卡到存储池的短消息出现高频流量后台，从而给架顶式 (*) 网络带来严峻挑战。同时，这些 10 或 25 Gbps 以太网 (GbE) 网络还面临着来自内存计算的挑战。有些数据中心架构师希望让服务器 CPU 获得比服务器卡中更多的内存。也许他们不想等待 SCM DIMM 出现。或者他们希望其应用的工作集增加到超过 SCM DIMM 所维持的 24 TB 容量。无论如何，他们正在推动对机架中其他服务器卡的固态盘和 DRAM 总线的远程直接内存访问 (RDMA)。事实上，他们希望所有 DIMM 在一个机架内，或许也希望所有固态盘也在一个机架内，以形成一个统一的虚拟内存。用于这种 RDMA 事务的介质是内存区域网络。网络这一对服务器卡之外的内存进行访问和虚拟化的需求对机架内的网络有很大影响。对于内存引用，您希望让缓存缺失触发读取，直接访问另一个服务器卡上的 DRAM 或 SCM 页面。对于存储访问，您希望 NVMe 命令访问另一个卡上的 SCM DIMM 或固态盘，或一个存储卡上的巨大闪存池（仅为一堆闪存或 JBoF）。您可以通过软件和现有 * 网络做到这一点。使用管理程序代码找到所需的程序块，并且传输数据的 10 或 25 GbE 驱动程序将运行，但延迟可能在 50 微秒的范围之内。对许多应用而言，这是不可行的。分析师认为，如果延迟时间大于 10 微秒，CPU 应切换到另一个线程，而不是等待请求。除非应用有很多线程，否则任何长于 10 毫秒的延迟都将是性能问题。除了延迟问题之外，还存在带宽问题：一个高性能固态盘可能会使一个 25 GbE 网络饱和。这些问题的解决方案需要机架内的多个变更层。首先，您需要基于硬件的 RDMA。两端的网络接口都需要硬件 DMA，而不是每个以太网数据包由软件驱动程序进行组装，通过网络发送，由软件解压到缓冲区中，然后由软件移动到另一个位置以供应用使用。因此，数据可以从一个服务器卡上的内存或固态盘移动到另一个卡的内存中，且在移动过程中无需通过 CPU。接下来，您需要确保这些延迟关键型 RDMA 传输不会被堵塞。我们必须将 RDMA 流量分离到自己的专用网络上，或者我们必须为 * 以太网创建优先方案。最好有一个连接服务器卡 PCIe 总线的专用点到点 RDMA 网络。这将使私有网络的全部收发器带宽用于 RDMA 传输，并可以将延迟缩短到 2 微秒的范围之内，几乎接近于将机架上的所有 DRAM 和 SCM 都放置在同一 DRAM 总线中。但出于各种原因，例如本已非常拥挤的机架、额外的成本以及对单一数据源的依赖，大多数数据中心运营商都不喜欢专用网络，甚至在机架内也不喜欢使用。因此，点到点 RDMA 可能仅限于高性能计算机和一些具有特别苛刻工作负载的私有数据中心。这使得 * 网络在大多数云和数据中心配置中承载流量。 * 以太网拥有 RDMA 所需的所有连接。在 25 Gbps 时，它具有足够的带宽来处理适量的 RDMA 活动。现在市面上有些高质量网络芯片的最低延迟约为 5 微秒，基本上可以称得上足够快了。vanilla 25 GbE 不具备良好的延迟上限。这就是融合以太网发挥作用的地方。CE 为以太网流量添加了优先级，允许 * 交换机将 RDMA 流量优先于其他任何内容，包括那些来自内存计算的高频短消息以及关于一些新鲜事物的源源不断的流量。现在我们有了 RDMA over CE (RoCE)，其发音类似于知名的电影拳击手。RoCE 为内存到内存传输以及内存和远程固态盘之间的 NVMe 事务提供了合理的延迟（图 3）。图 3.内存到内存 RoCE 事务。但 RoCE 不是*的。若要实现我们所说的延迟类型，则需要支持 RDMA 和硬件优先级排序的 RoCE 网络适配器，以及能够进行低延迟 CE 切换的 * 交换机，其中可能包括一些非常大的快速缓冲区，因为队列变得非常大。队列溢出导致的丢包在这里行不通。那么路线图是什么样子的呢？如今我们仍在从传统 10 GbE * 网络向 25 GbE 转型，40 GbE 即将变为现实。RoCE 仍然不常见，但有人在专用芯片和高端 FPGA 中实施 RoCE 网络适配器。未来，随着 SCM DIMM 的广泛使用，我们可以设想一下 * 网络中的另一个演进步骤从数据包优先级划分过渡到完全软件定义的配置。在如今的世界中，巨大的数据集将是相对静态的，分散在持久性 DIMM 中，并且在某些情况下，仍搭接在机架内的固态盘上。应用和虚拟连接将根据其数据访问需求进行。用于分割数据集的分区边界从服务器卡移动到机架，前者拥有数 TB 存储，后者可能有 720 TB 的内存容量作为单个虚拟内存池。然后，随着数据集进入 PB 范围，注意力将转移到数据中心脊柱网络上。我们可以重新开始讨论延迟了。来源：Intel－英特尔

2019-7-26 11:42:05 评论举报杨海清

只有小组成员才能发言，加入小组>>

256个成员聚集在这个小组

精选推荐

请问下图大疆lightbridge2遥控器主板电源芯片型号是什么？

4467 浏览 1 评论

最新话题

热门话题

使用常见的二极管、三极管和mos做MCU和模组的电平转换电路，但是模组和MCU无法正常通信，为什么？

342浏览 2评论
为了提高USIM卡电路的可靠性和稳定性，在电路设计中须注意的点有哪些？

344浏览 2评论
信号处理常用术语有哪些？

369浏览 2评论
请问高速系统对晶振相位噪声的要求是什么？

363浏览 2评论
SIM卡无法识别的原因？怎么解决？

407浏览 2评论

创建小组步骤

创建小组创建自己的地盘
个性设置精心打造小组空间
邀请好友邀请好友加入我的小组
小组升级小组积分升级赢得社区推荐

创建属于自己的小组

快速回复 返回顶部 返回列表

关注微信公众号

电子发烧友网

电子发烧友论坛

社区合作: 刘勇; 联系电话：15994832713; 邮箱地址：liuyong@huaqiu.com

社区管理: elecfans短短; 微信：elecfans_666; 邮箱：users@huaqiu.com

【优惠升级】华秋PCB首单最高立减100元，SMT免费贴片！！！

返回综合技术

回复

关闭

站长推荐 /6

快速回复 返回顶部 返回列表

- 技术社区: HarmonyOS技术社区

RISC-V MCU技术社区

FPGA开发者技术社区

- OpenHarmony开源社区: OpenHarmony开源社区

- 嵌入式论坛: ARM技术论坛

STM32/STM8技术论坛

嵌入式技术论坛

单片机/MCU论坛

RISC-V技术论坛

瑞芯微Rockchip开发者社区

FPGA|CPLD|ASIC论坛

DSP论坛

- 电路图及DIY: 电路设计论坛

DIY及创意

电子元器件论坛

专家问答

- 电源技术论坛: 电源技术论坛

无线充电技术

- 综合技术与应用: 机器人论坛

USB论坛

电机控制

模拟技术

音视频技术

综合技术交流

上位机软件（C/Python/Java等）

- 无线通信论坛: WIFI技术

蓝牙技术

天线|RF射频|微波|雷达技术

- EDA设计论坛: PCB设计论坛

DigiPCBA论坛

Protel|AD|DXP论坛

PADS技术论坛

Allegro论坛

multisim论坛

proteus论坛|仿真论坛

KiCad EDA 中文论坛

DFM|可制造性设计论坛

- 测试测量论坛: LabVIEW论坛

Matlab论坛

测试测量技术

传感技术

- 招聘/交友/外包/交易/杂谈: 项目外包

供需及二手交易

工程师杂谈|交友

招聘|求职|工程师职场

- 官方社区: 发烧友官方/活动

华秋商城

华秋电路

time

recommend

hot

post

—
—
—

版
块
导
航