DeepSeek正式发布DeepSeek-V3.1版本,该版本采用了UE8M0 FP8 Scale参数精度。相较于DeepSeek-V3,V3.1对分词器及chat template进行了重大调整,呈现出明显差异。DeepSeek官方在置顶留言中透露,UE8M0 FP8是专为即将发布的下一代国产芯片而设计的。此外,DeepSeek-V3.1还引入了混合推理架构,提升了思考效率,并增强了Agent能力。同时,官方App与网页端模型已同步升级为DeepSeek-V3.1,用户可通过“深度思考”按钮自由切换思考模式与非思考模式。