谷歌研究:DeepSeek推理模型通过“脑内群聊”提升智能
创始人
2026-01-21 10:20:40
0

据量子位,谷歌最新研究发现,DeepSeek-R1等顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,如外向、严谨、多疑等。这些人格在模型解题过程中展开激烈的社交与辩论,类似“左右脑互搏”,从而让模型越吵越聪明。研究显示,在面对高难度任务时,这种内部冲突会更加激烈,而在简单任务时则明显减少。

团队通过分析DeepSeek-R1和QwQ-32B等模型的思维轨迹发现,这些模型的推理过程充满对话感,内部分裂出的虚拟角色性格迥异且覆盖更多解题角度。例如,创意型角色提出新颖思路,批判型角色挑错补漏,执行型角色负责落地验证。这种多角色互动并非开发人员刻意设计,而是模型在追求推理准确率过程中自发形成的。

研究人员借助稀疏自编码器SAE,成功“监听”到AI的脑内群聊。通过提取模型隐藏层神经元的激活数值,并利用SAE的稀疏约束机制,将复杂信号拆解为独立的对话语义特征,进而识别出不同的内部逻辑实体,并打上虚拟角色标签,解码了AI内部的多角色对话行为。

实验发现,推理模型的对话式行为出现频率显著高于普通指令模型。有趣的是,当强化模型的对话特征,放大“哦!”这类表达惊讶或转折的话语标记时,模型在算术推理任务中的准确率显著提升。此外,在强化学习训练中,模型会自发学会用对话式思考,且先经过多智能体对话数据微调的模型,在推理训练中的进步速度远快于直接训练或用独白式推理数据微调的模型。

这一发现呼应了人类演化生物学中的社会脑假说,即大脑的进化是为了应对复杂的社交关系和群体互动需求。如今,AI也通过与不同“人格”的社交互动来提升智能。

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
原创 麒... 为了普及原生鸿蒙(鸿蒙5.0),抢占更多的中端手机市场份额,华为nova系列今年开始计划一年两更,n...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
原创 直... #热点周际赛# 随着科技的进步,儿童智能穿戴设备逐渐成为了家庭中的新宠。华为作为智能穿戴领域的领军者...