谷歌新发现:DeepSeek 推理分裂出多重人格,左右脑互搏越来越聪明
1 周前

谷歌最新研究揭示,DeepSeek-R1等顶尖推理模型在解题时,内部会自发形成多种性格的虚拟人格,其推理过程犹如一场社交辩论会,且这种“内部争论”越激烈,模型表现越聪明。面对高难度任务时,模型内部的观点冲突会显著增强,而简单任务则相对较少。这些虚拟人格性格各异,覆盖多个解题角度,通过交流碰撞促使模型更全面地审视问题。值得注意的是,这种多角色互动并非人为设计,而是模型在追求推理准确率过程中自发形成的。研究团队利用稀疏自编码器(SAE)成功解码了AI的“脑内群聊”,发现推理模型的对话式行为频率显著高于普通指令模型。实验表明,通过强化话语标记(如“哦”)或采用对话式思考训练,能大幅提升模型的推理准确率。例如,在Countdown算术推理任务中,强化对话特征后模型准确率从27.1%翻倍至54.8%。此外,强化学习训练也证明,对话微调模型在推理任务中的进步速度远超独白微调模型。这一发现与社会脑假说相呼应,表明AI要变得更聪明,需先学会与不同“人格”进行社交互动。论文详见:https://arxiv.org/abs/2601.10825。