OpenVINO开发小组
直播中

吕珠峰

9年用户 764经验值
擅长:可编程逻辑
私信 关注
[资料]

HLS-GAUD12深度学习服务器数据资料

哈瓦那实验室HLS-Gaudi2系统为数据中心带来了一个新的深度学习性能和可扩展性水平。
该系统包含八个Gaudi2 mezzanine卡、两个第4.0代PCle交换机和一个标准双插槽Xeon lcelake CPu主机子系统,具有NVME存储和主机连接功能。
Gaudi2符合oCP OAM(开放式计算项目加速器模块)1.1规范。每块卡都包含Gaudi HL-2080处理器,该处理器集成了96GB HBM2E内存和24个100GbE RoCE v2 RDMA NIC。
Gaudi2处理器为关键视觉和语言工作负载提供了领先的培训性能(如2022年5月的公告所示),这些工作负载与创新的可编程架构相关联,该架构专门为Al培训和推理而构建,并且能够使用标准接口和fuil软件包、参考模型和操作指南扩展到大量处理器。
8个Gaudi2板卡内部互连,使用从每个Gaudi2到其他7个处理器的21x100GbE RoCE端口实现无阻塞全对所有连接。此外,该系统还提供24x100GbE-RoCE RDMA,通过利用外部现成以太网交换,进一步扩展、扭转和集群基于Gaudi2的节点。可以使用类似的服务器构建各种集群架构,以利用数千个Gaudi2扩展Al训练和推理集群。

更多回帖

发帖
×
20
完善资料,
赚取积分