微软 Copilot 新增音频表达式功能,莎士比亚腔、体育解说都能整
7 小时前 / 阅读约2分钟
来源:IT之家
微软为Copilot工具新增“Copilot音频表达式”功能,基于MAI-Voice-1模型,提供三种语音模式,已在Copilot Labs上线。微软正减少在AI领域对OpenAI的依赖。

IT之家 9 月 11 日消息,微软为其 Copilot 工具新增了一个“Copilot 音频表达式”功能,该功能基于微软自研的 MAI-Voice-1 模型,目前用户可从三种不同的语音模式中进行选择。

IT之家注意到,第一种是“有感染力模式(Emotional Mode)”,支持富有表现力的自由式表达,适用于需要传递情感的场景;第二种是“故事模式(Story Mode)”,用户可借助该模式讲述包含多个人物角色的故事,带来沉浸式听觉体验;第三种是“脚本模式(Script Mode)”,能够实现逐字精准播放,非常适合需要准确传递信息的场景。

微软还为每种模式提供了多种语音类型与风格,涵盖经典的莎士比亚作品朗读风格以及富有激情的体育解说风格等。

目前,这项新功能已在 Copilot Labs(Copilot 实验室)上线,用户可在其中直接体验。值得关注的是,微软近期推出的 MAI-1 是其首款大型语言模型,同时该公司还与 Anthropic 达成协议,计划将 Anthropic 的模型集成至 Office 应用中。这些举措表明,微软正致力于在人工智能领域减少对 OpenAI 的依赖。