智元获得WorldArena世界模型总分冠军,引发了业内对于GE-Sim 2.0技术能力的关注。
根据最新发布的评测结果,GE-Sim 2.0在WorldArena Track1世界模型感知与动作响应赛道中位列第一。该赛道重点关注机器人对环境信息的获取、理解以及动作响应能力,因此被视为具身智能的重要评价平台。
与一些针对评测任务进行深度定制的方案相比,智元团队此次采用的是原生GE-Sim 2.0模型,仅基于榜单数据完成基础微调。能够在这样的情况下取得冠军成绩,也体现出模型较强的适配能力。
技术报告显示,GE-Sim 2.0已经逐渐构建起完整世界模拟器框架。机器人能够在虚拟环境中进行自主试验、经验积累和持续优化,并将成果迁移到现实世界。
功能体系方面,GE-Sim 2.0已实现长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别等核心能力布局。
长时序推演能力是本次报告中的重要内容之一。数据显示,在40至50秒连续推演过程中,模型依然保持较好的生成质量,其表现优于行业基线方案。
同时,团队还进行了大量闭环评测工作。结果表明,GE-Sim 2.0在多个任务中的反馈结果与真实世界具有较强相关性。结合逐案例分析以及混淆矩阵验证,进一步增强了评测结果的说服力。
奖励模型则帮助GE-Sim 2.0形成数据回流机制。通过自动筛选高质量数据并反馈给策略模型,实现模型能力的持续优化。
从榜单表现到技术验证,GE-Sim 2.0展示出较为完整的能力体系,也展现出智元持续推进世界模型技术发展的成果。


