Nvidia宣布,其全新Vera Rubin微架构正处于研发阶段,并计划于2026年正式推出。其中,Rubin CPX变体专注于处理海量上下文窗口的人工智能工作负载,特别适用于处理超百万个token的场景。预计在2026年底,Vera Rubin NDL144CPX类GPU将上市,该GPU具备强大的AI性能和内存配置。此外,Nvidia还计划推出千兆规模的数据中心参考设计,以助力AI工厂的建设。此前,在Nvidia公布的MLPerf推理测试中,黑威尔GPU创下了新纪录,其“解耦服务”技术可有效提升硬件性能。
