位置：从对话环境中获得的内省经验作为更好学习的途径

对话学习内省机制社会互动认知发展 AI训练

摘要

当前的人工智能训练方法将推理视为规模增长的副产品。本文认为，稳健的推理能力源于语言自我反思，而这种反思本身是通过高质量的社会互动内化的。基于维果茨基的发展心理学理论，本文提出了三个核心观点：首先，私人思维的社会起源表明，从对话环境中学习成为理解世界的新方式；与另一个智能体（无论是否为内部）对齐时产生的摩擦，有助于完善和固化推理过程。其次，通过对话构建的内省体验使智能体能够脱离即时数据流进行意义建构，将原始环境数据转化为丰富的、可学习的叙述。最后，对话质量即新的数据质量：智能体私密推理的深度及其测试时计算效率，取决于其掌握的对话多样性与严谨性。结论指出，优化这些对话框架是下一代通用智能的关键杠杆。

AI 推荐理由

论文探讨了对话环境中的自我反思对学习的影响，与Agent Memory中通过交互优化推理过程相关。

论文信息

作者 Claudiu Cristian Musat, Jackson Tolins, Diego Antognini, Jingling Li, Martin Klissarov et al.

发布日期 2026-02-16

arXiv ID 2602.14910