智谱推出GLM-5.1高速版：400 tokens/s 30秒生存成复杂网页代码

12 小时前 / 阅读约1分钟

来源：凤凰网

5月22日，智谱推出GLM-5.1高速版API，输出速度达400 tokens/s，刷新全球大模型厂商API速度上限。该模型兼顾旗舰级能力与低延迟，适用于AI编程、实时交互等场景，已向部分企业客户开放。

凤凰网科技讯 5月22日，智谱宣布面向部分企业客户推出GLM-5.1高速版API“GLM-5.1-highspeed”，模型输出速度达到400 tokens/s。智谱称，这一速度刷新了当前全球大模型厂商API的速度上限。

该模型基于旗舰级GLM-5.1能力开发，打破了此前“高速模型几乎总是轻量级模型”的行业惯例，首次在国产大模型中实现旗舰级能力与极致低延迟的兼顾。

高速版由智谱GLM团队与TileRT团队联合打造，通过推理引擎、调度系统与底层基础设施的系统级优化实现。据演示，在长程任务中，模型可在30秒内完成复杂网页的代码生成；在Agent Swarm场景下，可瞬间调度50个不同人格并行回答。

该API适用于AI编程、实时交互、商业决策、实时语音等对延迟敏感的场景，目前已向智谱MaaS平台部分企业客户开放。

2 天前

小米汽车：YU7 GT 标配全车四座按摩、智能调光天幕、超静谧座舱

2 天前

2 天前

荣耀WIN Turbo定档5月29日：取消散热风扇

2 天前

三大运营商卖token套餐，这事靠谱吗？

2 天前

4000亿光通信新贵港股上市遇挫，谁在为东山精密买单｜风眼观察

2 天前

宜鼎发布全系列 10GbE 高速 LAN 扩展模块，采用英特尔控制器

2 天前

2 天前

消息称360前公关副总裁加盟小米担任舆情顾问

2 天前

芯片下沉，AI硬件全面开花

2 天前

投资超600亿美元孙正义豪赌OpenAI引发内部质疑：迷信奥特曼如追星