昊梵体育网

[AI]《Uneven Evolution of Cognition Acros

[AI]《Uneven Evolution of Cognition Across Generations of Generative AI Models》I Galatzer-Levy, D McDuff, X Liu, J McGiffin [Google DeepMind & Google Research] (2026)

在 AGI 评估中,单一分数掩盖了能力裂缝。过去基准只看任务表现,本质原因是缺少能分解认知结构、并追踪代际变化的心理测量框架。

本文的核心洞见是:把生成模型重新看作不均衡认知系统。由此,WAIS 改编测试暴露“语言强、知觉弱”,AIQ 基准再放大难度,刻画不同能力的成长轨迹。

这项工作真正留下的遗产是把模型进步画成认知剖面。它为后来者打开的新门是按能力模块诊断 AGI 瓶颈,但尚未跨过的门槛是人类心理测验与机器机制并不同构。

arxiv.org/abs/2605.06815 机器学习 人工智能 论文 AI创造营