发 帖  
  • 许多DGX H100服务器又可以组成所谓的SuperPOD,其中各个独立服务器中的加速器仍可使用NVLink传输数据,但耦合程度较低。每个SuperPOD使用以太网和Infiniband连接到另一个SuperPOD。服务...
    0
    336次阅读
    0条评论
  • 以太网是一种广泛使用的网络协议,但其传输速率和延迟无法满足大型模型训练的需求。相比之下,端到端IB(InfiniBand)网络是一种高性能计算网络,能够提供高达 400 Gbps 的传输速率和微秒级别的延迟,远高于以太网...
    0
    4176次阅读
    0条评论
  • 首先,我们强调 500 强中的绝对成交量。当我们在 2018 年开始进行这项分析时,每份新出版物都有超过四分之一的榜单更替。2020 年,业界注意到因疫情导致的系统数量减少。我们现在似乎正处于新的趋势线上,该列表略低于 ...
    0
    451次阅读
    0条评论
  • RISC-V 的诞生于伯克利大学并行计算实验室(Par Lab),是一个无心插柳的 “副产物”。 Par Lab 由大卫·帕特森(David Patterson)和他的学生克斯特·阿萨诺维奇(Krste Asanovic...
    0
    610次阅读
    0条评论
  • Achronix与Myrtle.ai共同推出了超低延迟大并发实时智能语音识别方案,其硬件平台采用基于Achronix Speedster7t FPGA的VectorPath加速卡和x86架构服务器实现,可以同时支持多达4...
    0
    407次阅读
    0条评论
  •   语音活动检测(VAD, Voice Activity Detection, or SAD, Speech Activity Detection)用于从音频信号中检测出有效语音片段的起始时间和结束时间。这一技术常常应用...
    0
    445次阅读
    0条评论
  • 在计算机中,各个部件之间传递信息,是通过总线(公共通信干线,类似于高速公路)进行传输的。根据传递信息的类型可分为数据总线(DB)、地址总线(AB)、控制总线(CB);根据连接设备的类型,又可以分为主存总线、I/O总线。...
    0
    1274次阅读
    0条评论
  • HBM技术是一种基于3D堆叠工艺的高性能DRAM,它可以为高性能计算、人工智能、数据中心等领域提供高带宽、高容量、低延迟和低功耗的存储解决方案。本文将介绍HBM技术的原理、优势、应用和发展趋势。...
    0
    13257次阅读
    0条评论
  • 采用Wormhole芯片,Tenstorrent设计了nebula(星云)服务器,一个4U服务器包含32个Wormhole芯片。...
    0
    346次阅读
    0条评论
  • CXL的目标:解决CPU和设备、设备和设备之间的内存鸿沟。服务器有巨大的内存池和数量庞大的基于PCIe运算加速器,每个上面都有很大的内存。内存的分割已经造成巨大的浪费、不便和性能下降。CXL就是为解决这个问题而诞生。...
    0
    8222次阅读
    0条评论
  • 虽然训练通常基于生成大量数据的 fp32 或 fp64 浮点算法,但它不需要严格的延迟。功耗高,成本承受能力高。 相当不同的是推理过程。推理通常在 fp8 算法上执行,该算法仍会产生大量数据,但需要关键的延迟、低能耗...
    0
    350次阅读
    0条评论
  • 首先,内存请求与闪存内存之间存在颗粒度不匹配。这导致了在闪存上需要存在明显的流量放大,除了已有的闪存间接性需求[23,33]之外:例如,将64B的缓存行刷新到CXL启用的闪存,将导致16KiB的闪存内存页面读取、64B更...
    0
    806次阅读
    0条评论
  • 三星首席工程师Jin Hyun Kim表示:“大部分能源消耗来自移动数据。” 他指出了三种提高效率和提升绩效的解决方案:使用HBM进行内存处理,实现极高的带宽和功耗;使用LPDDR对需要高容量的低功耗设备进行内存处理;使...
    0
    506次阅读
    0条评论
  • CUDA核心(Compute Unified Device Architecture Core)是NVIDIA图形处理器(GPU)上的计算单元,用于执行并行计算任务。每个CUDA核心可以执行单个线程的指令,包括算术运算、...
    0
    7588次阅读
    0条评论
  • 聊聊GPU通信技术

    2023-9-21 10:05
    最近人工智能大火,AI 应用所涉及的技术能力包括语音、图像、视频、NLP 等多方面,而这些都需要强大的计算资源支持。AI 技术对算力的需求是非常庞大的,虽然 GPU 的计算能力在持续提升,但是对于 AI 来说,单卡的计算...
    0
    1026次阅读
    0条评论
ta 的专栏

成就与认可

  • 获得 3 次赞同

    获得 0 次收藏

谁来看过他

关闭

站长推荐 上一条 /6 下一条

返回顶部