DeepSeek小更新,多步推理表现提高43%
2 天前

DeepSeek近日发布了其模型V3.1版本,该版本在推理能力、上下文处理能力和多语言支持方面进行了升级。新版本模型拥有5600亿参数,能更有效地处理复杂任务,多步推理性能提升了43%。其上下文处理能力也得到增强,可处理长度达128k的文本,相当于一部完整的中长篇小说,涵盖10万到13万汉字。此外,V3.1版本在信息准确性方面有所提升,减少了不实信息的产生,并支持超过100种语言。值得注意的是,备受瞩目的DeepSeek R2版本因训练问题,发布日期被迫推迟。