适合（少量令牌）的不会过拟合：机器学习研究代理中的压缩与泛化

LLM Agents Compression Generalization Overfitting Self-Improvement

摘要

本文探讨了基准驱动的机器学习中缺乏过拟合的现象，提出成功策略具有高度可压缩性的假设。通过在 LLM 驱动的研究代理中设置输出和输入两种信息瓶颈进行验证：前者测试仅凭极短提示复现高性能模型的能力，后者限制代理仅接收单比特反馈。实验涵盖八个数据集，结果表明压缩并未显著影响性能，支持了成功策略占据低复杂度区域的观点，为理解基准驱动 ML 的泛化提供了描述长度解释。

AI 推荐理由

研究 LLM 代理通过压缩反馈自适应搜索策略，体现自我改进与进化机制。

研究机构

Amazon Responsible AI University of Pennsylvania Carnegie Mellon University

论文信息

作者 Martin Andres Bertran, Aaron Roth, Zhiwei Steven Wu

发布日期 2026-06-09

arXiv ID 2606.11045