龙芯中科公布龙芯 9A1000/9A2000 GPU 芯片展望,后者面向中高端显卡
18 小时前 / 阅读约3分钟
来源:IT之家
龙芯中科今日发布9A1000/9A2000 GPU芯片,分别定位入门级和中高端市场,支持AI加速和通用计算。9A1000性能提升5倍,AI算力达40TOPS;9A2000单精度浮点算力5Tflops,INT8算力160TOPS。龙芯强调软件生态建设,兼容主流开源技术。#国产芯片##GPU# #龙芯中科#

IT之家 6 月 26 日消息,今日龙芯中科在北京举办了 2025 龙芯产品发布暨用户大会。在此次大会上,龙芯中科首席工程师、通用 GPU 处理器研发总监苏孟豪介绍了龙芯 GPU 的研发进展及规划。

苏孟豪指出,凡是做 CPU 的企业,都必须要有自己的 GPU。龙芯中科致力于解决龙芯 CPU 的 GPU 配套难题,包括进口低端 GPU 芯片供货不畅和嵌入 GPU 在桌面场景不可用的问题。公司于 2016 年立项,进入一个全新的领域,五年内完成第一代架构,并在产品中迭代两次。

在第一代龙芯图形处理器方面,龙芯中科强调其完全从零开始,没有历史包袱,具有后发优势。架构设计向业界先进水平看齐,直接采用统一渲染架构,图形 API 支持 OpenGL 2.1 / OpenGL ES 2.0,满足现代桌面应用的要求。用量已经达到百万规模,可靠性、兼容性都经受住了市场的检验,并大幅降低了龙芯电脑的成本。

第二代龙芯图形处理器迈向 GPU 发展的第四个阶段,从图形处理器(GPU)扩展成通用图形处理器(GPGPU),实现图形渲染和通用计算的结合。完成功能补课,高版本图形 API(OpenGL 3.2 -> 4.0,Vulkan 1.1)和计算 API(OpenCL 1.1 -> 3.0)。实现性能扩展,图形流水可扩展,计算性能可扩展,提升性能功耗比,性能面积比。采用两步走计划,架构升级,基本功能实现,功能性能扩展,全面调优。

龙芯 9A1000 展望

龙芯 9A1000 是龙芯首款 GPU 芯片,定位为支持 AI 加速的入门级显卡,GPU 核全面升级,功能方面,图形 API OpenGL4.0 / OpenCL ES3.2;性能方面,图形流水线 x2,主频提升 25%;面积方面,流处理器面积减小 20%;功耗方面,轻负载功耗降低 70%。GPU 规模 x4(vs 2K3000),性能提升 5 倍以上,AI 算力达到 40TOPS。

龙芯 9A2000 展望

龙芯 9A2000 是龙芯高性能 GPU 芯片,面向中高端显卡,应用于桌面和服务器,通过优化和堆料,做大做强。GPU 核升级到第三代架构,单位面积算力进一步提升,图形 API 支持 OpenGL4.6,加入虚拟化支持,张量单元支持更多数据类型,GPU 规模 x4(vs 9A1000),单精度浮点算力 5Tflops,INT8 AI 算力 160TOPS,内存带宽 256GB/s,支持双片互联,总体性能再翻一倍,达到同工艺代下国际先进水平。

IT之家注意到,龙芯中科还强调了其软件生态建设原则,兼容主流、拥抱开源、应用牵引、迭代发展。龙芯加速计算平台提供 OpenCL、CUDA 兼容等接口,支持训练、推理等全场景 AI,支持 OpenGL、Vulkan,支持视频编解码加速,支持云、边、端全领域应用。