英伟达 Rubin CPX GPU 包含 192 个重复单元,预计采用 512bit 显存位宽
14 小时前 / 阅读约2分钟
来源:IT之家
英伟达发布Rubin CPX GPU,基于Rubin架构,采用单片式设计,配备128GB GDDR7显存,机架系统增加144块GPU,NVFP4算力提升4.4 EFLOPS,显存带宽提升0.3PB/s。

IT之家 9 月 10 日消息,英伟达美国当地时间 9 日发布了面向大规模上下文推理处理和视频生成 AI 应用的 Rubin CPX GPU。该 GPU 基于 "Rubin" 架构构建但与此前已公布的 Rubin Tensor Core GPU 又有不少区别之处。

Rubin CPX GPU 采用经济高效的单片式设计,注重 NVFP4 数据格式计算资源,同时搭载了 NVENC / NVDNC 视频编解码单元,配备 128GB 的 GDDR7 显存

根据英伟达官方提供的 Rubin CPX 渲染图,该 GPU 包含 4×4×3×4=192 组的重复单元(IT之家注:参见下图黄色方框),应该对应着 192 组 SM,这一数量与 GB202 相当。

而在机架系统层面,从 Vera Rubin NVL144 到 Vera Rubin NVL144 CPX,系统增加了 144 块 Rubin CPX GPU,NVFP4 算力提升了 4.4 EFLOPS、显存带宽提升了 0.3PB/s、快速存储增长了 25TB。

从显存带宽角度,每颗 Rubin CPX GPU 大致对应约 2083GB/s 显存带宽。考虑到 512-bit 显存位宽的 GeForce RTX 5090 拥有 1792GB/s 的显存带宽、Rubin CPX GPU 的显存容量为 128GB,Rubin CPX GPU 应同样具备 512-bit 的显存位宽,显存等效速率估算数值约为 32.55Gbps。