sakobpqhz的文章_电子工程师 - 电子技术论坛 - 广受欢迎的专业电子论坛!

sakobpqhz

经验：积分：8

查看完整档案 >>

+关注发私信

他的文章发文章

机器学习硬件性能的最新趋势
2023-12-13 10:20

许多DGX H100服务器又可以组成所谓的SuperPOD，其中各个独立服务器中的加速器仍可使用NVLink传输数据，但耦合程度较低。每个SuperPOD使用以太网和Infiniband连接到另一个SuperPOD。服务...

0

867次阅读

0条评论
英伟达三大AI法宝：CUDA、Nvlink、InfiniBand
2023-12-5 11:02

以太网是一种广泛使用的网络协议，但其传输速率和延迟无法满足大型模型训练的需求。相比之下，端到端IB（InfiniBand）网络是一种高性能计算网络，能够提供高达 400 Gbps 的传输速率和微秒级别的延迟，远高于以太网...

0

8172次阅读

0条评论
Top500新系统CPU架构趋势
2023-12-4 10:02

首先，我们强调 500 强中的绝对成交量。当我们在 2018 年开始进行这项分析时，每份新出版物都有超过四分之一的榜单更替。2020 年，业界注意到因疫情导致的系统数量减少。我们现在似乎正处于新的趋势线上，该列表略低于 ...

0

1062次阅读

0条评论
RISC-V加速进入数百亿美元大市场，RISC-V CPU核出货量分析
2023-11-27 09:46

RISC-V 的诞生于伯克利大学并行计算实验室（Par Lab），是一个无心插柳的 “副产物”。 Par Lab 由大卫·帕特森（David Patterson）和他的学生克斯特·阿萨诺维奇（Krste Asanovic...

0

1308次阅读

0条评论
超低延迟大并发实时语音识别加速方案详解
2023-11-24 12:42

Achronix与Myrtle.ai共同推出了超低延迟大并发实时智能语音识别方案，其硬件平台采用基于Achronix Speedster7t FPGA的VectorPath加速卡和x86架构服务器实现，可以同时支持多达4...

0

1265次阅读

0条评论
全面探讨智能语音关键技术解决方案
2023-11-24 12:29

　　语音活动检测（VAD， Voice Activity Detection， or SAD， Speech Activity Detection）用于从音频信号中检测出有效语音片段的起始时间和结束时间。这一技术常常应用...

0

953次阅读

0条评论
DMA技术如何实现数据直接传输？
2023-11-14 12:39

在计算机中，各个部件之间传递信息，是通过总线（公共通信干线，类似于高速公路）进行传输的。根据传递信息的类型可分为数据总线（DB）、地址总线（AB）、控制总线（CB）；根据连接设备的类型，又可以分为主存总线、I/O总线。...

0

2796次阅读

0条评论
一文解析HBM技术原理及优势
2023-11-9 12:32

HBM技术是一种基于3D堆叠工艺的高性能DRAM，它可以为高性能计算、人工智能、数据中心等领域提供高带宽、高容量、低延迟和低功耗的存储解决方案。本文将介绍HBM技术的原理、优势、应用和发展趋势。...

0

19315次阅读

0条评论
如何定义一款新的AI处理器？AI芯片案例分析
2023-11-2 12:33

采用Wormhole芯片，Tenstorrent设计了nebula（星云）服务器，一个4U服务器包含32个Wormhole芯片。...

0

1698次阅读

0条评论
CXL技术的三种模式 CXL技术与其他技术的对比
2023-10-30 14:30

CXL的目标：解决CPU和设备、设备和设备之间的内存鸿沟。服务器有巨大的内存池和数量庞大的基于PCIe运算加速器，每个上面都有很大的内存。内存的分割已经造成巨大的浪费、不便和性能下降。CXL就是为解决这个问题而诞生。...

0

10117次阅读

0条评论
边缘生成人工智能推理技术面临的挑战有哪些
2023-10-10 09:38

虽然训练通常基于生成大量数据的 fp32 或 fp64 浮点算法，但它不需要严格的延迟。功耗高，成本承受能力高。相当不同的是推理过程。推理通常在 fp8 算法上执行，该算法仍会产生大量数据，但需要关键的延迟、低能耗...

0

871次阅读

0条评论
探索闪存内存如何应对“内存墙”的可行性
2023-10-9 16:46

首先，内存请求与闪存内存之间存在颗粒度不匹配。这导致了在闪存上需要存在明显的流量放大，除了已有的闪存间接性需求[23,33]之外：例如，将64B的缓存行刷新到CXL启用的闪存，将导致16KiB的闪存内存页面读取、64B更...

0

1950次阅读

0条评论
人工智能下如何提升主要CPU处理单元速度？
2023-10-9 12:28

三星首席工程师Jin Hyun Kim表示：“大部分能源消耗来自移动数据。” 他指出了三种提高效率和提升绩效的解决方案：使用HBM进行内存处理，实现极高的带宽和功耗；使用LPDDR对需要高容量的低功耗设备进行内存处理；使...

0

966次阅读

0条评论
CUDA核心是什么？CUDA核心的工作原理
2023-9-27 09:38

CUDA核心（Compute Unified Device Architecture Core）是NVIDIA图形处理器（GPU）上的计算单元，用于执行并行计算任务。每个CUDA核心可以执行单个线程的指令，包括算术运算、...

0

11441次阅读

0条评论
聊聊GPU通信技术
2023-9-21 10:05

最近人工智能大火，AI 应用所涉及的技术能力包括语音、图像、视频、NLP 等多方面，而这些都需要强大的计算资源支持。AI 技术对算力的需求是非常庞大的，虽然 GPU 的计算能力在持续提升，但是对于 AI 来说，单卡的计算...

0

2049次阅读

0条评论