通义实验室发布两款支持自然语言指令的语音生成模型 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

通义实验室发布两款支持自然语言指令的语音生成模型

3 天前

2026年3月2日，阿里云通义实验室发布两款语音生成模型Fun-CosyVoice3.5与Fun-AudioGen-VD，支持通过自然语言指令直接控制语音生成效果。Fun-CosyVoice3.5支持多语种复刻与精细化表达控制，新增泰语等4种语言，生僻字读错率从15.2%降至5.3%，长文本朗读更稳定流畅，首包延迟降低35%，实时交互响应更快。Fun-AudioGen-VD支持声音设计与场景化音频生成，可生成目标音色、情绪表达和完整听觉场景，打造沉浸式听觉体验。两款模型均面向开发者开放API调用。

上一篇：全球首个全尺寸重载双轮足机器人开源版RW-02OP正式发布

下一篇：阿里巴巴AI品牌统一为千问

返回列表

热文阅读

2 天前

马斯克谈中国芯片产业：3-5年内没有突破会感到惊讶

18 小时前

又走一个，OpenAI研究VP离职，转投Anthropic做RL研究员

2 天前

2025年国内AI应用排行榜出炉：豆包、DeepSeek、元宝位居前三

2 天前

爱立信下一代芯片将基于英特尔工艺，加速商用 AI 原生 6G 进程