DeepSeek 公开模型原理与训练方法说明
2025-09-02

DeepSeek发布了大模型训练原理,该模型采用预训练和优化训练两阶段流程。预训练阶段使用公开的互联网数据,而优化训练数据则由自建问答对和匿名化用户数据构成。最终,模型以自回归方式生成文本。