本帖最后由 1653149838.791300 于 2024-10-16 22:19 编辑
感谢平台提供的书籍,厚厚的一本,很有分量,感谢作者的倾力付出成书。
本书主要讲算力芯片CPU、GPU、NPU,给我们剖析了算力芯片的微架构。书中有对芯片方案商处理器的讲解,理论联系实际,使读者能更好理解算力芯片。
全书共11章,由浅入深,较系统全面进行讲解。下面目录对全书内容有一个整体了解与把握。
-----------------------------------------------------------------------------------------------
第1章 从TOP500和MLPerf看算力芯片格局
1.1科学算力最前沿TOP500
1.2 AI算力新标准
第2章 高性能 CPU 流水线概览
2.1什么是指令
2.2 流水线与MIPS
2.3分支预测
2.4 指令缓存体系
2.5 译码单元
2.6 数据缓存
2.7 TLB(旁路快表缓冲)
2.8乱序执行引擎
2.9 超线程技术
第3章 缓存硬件结构
3.1 DRAM与SRAM设计取舍
3.2 DRAM 读/写过程
3.3 SRAM 读/号过程(以6T SRAM 为例)
3.4 Intel对8TSRAM 的探索
3.5 不同规格SRAM 的物理特性
3.6 非一致性缓存架构
第4章 CPU计算单元设计
4.1 计算单元逻辑构成
4.2 数相浮点数的差异
4.3 算术逻辑单元
4.4 浮点数单元
4.5 指令的加载和存储单元
4.6 单指今多数据
4.7 矩阵加速指令集
4.8 ARMSVE指令集
第5章 逻辑拓扑结构
5.1 环形拓扑方式
5.2 Infnity Fabric 拓扑方式
5.3 网格拓扑方式
5.4 片上网络(NoC)
5.5 近存计算拓扑特性
5.6 单芯片UMA与NUMA
第6章 经典算力 CPU 芯片解读
6.1 申威处理器
6.2 富士通A64FX处理器
6.3 苹果M1处理器
6.4 Ampere处理器
6.5 IBMPOWER理器
6.6 EPYC9004处理器
6.7 Sapphire Rapids 微架构Xeon处理器
6.8 Tesla Dojo超级计算机和D处理器
第7章 从图形到计算的 GPU 架构演进
7.1 GPU图形计算发展
7.2 GPGPU指令流水线
第8章 GPGPU 存储体系与线程管理
8.1 GPGPU多级别存储体系
8.2 GPGPU线程管理
8.3 通用矩阵乘法与AI类任务
8.4 VLIW指令结构在 GPU 中的应用历史
第9章 张量处理器设计
9.1 张量的定义
9.2 脉动阵列计算单元
9.3 Volta 架构引入张量核心
9.4 华为异腾Ascend910NPU芯片
第 10 章 经典 GPU 算力芯片解读
10.1 NVIDIAGPU芯片
10.2 AMDGPU芯片
10.3 IntelXeGPU架构
10.3.4 超大芯片Ponte Vecchio
第11章 存储与互连总线技术
11.1 从DDR到HBM
11.2 PCExpress总线概况
11.3扩展技术
11.4 NVLink互连技术与GPU超级计算机
-----------------------------------------------------------------------------------------------
通过目录,可以看到全书讲解还是挺丰富的,翻阅了下,各章节讲解的也很详细。了解算力芯片机制原理、架构组织形式逻辑等,对我们软件开发算力芯片方案能起到很好的促进作用。后面就是进行具体的阅读与学习理解了。