2025年12月11日,智谱正式发布工业级语音合成系统GLM-TTS,并在Hugging Face和ModelScope开放模型权重。该系统已开源,支持仅用3秒语音样本学习说话人音色和习惯,在智能客服、语音助手等场景中实现自然语音交互。GLM-TTS基于GRPO框架,引入多维度奖励和稳定训练机制,在seed-tts-eval测试集上字符错误率(CER)低至0.89%,音色相似度(Sim)达76.4,在CV3-eval-emotion数据集上情感表达和发音准确度均领先商用模型。目前,GLM-TTS已上线智谱开放平台、智谱清言和Z.ai,并开放模型权重、推理代码和在线调用接口,支持开发者快速部署和二次开发。
