资讯
该基金会于本周一在其博客上宣布推出一个名为 ARC-AGI-2 的全新测试,旨在衡量领先人工智能模型的通用智能水平。这项测试的难度极高,截至目前,大多数 AI 模型都在该测试中表现不佳。 根据 Arc Prize 排行榜的数据显示,以推理能力著称的 AI 模型,如 OpenAI 的 ...
今天,我在网上浏览时,发现了一则激动人心的消息,简直让我差点将手机掉落在地!ARCPrize发布了全新的AGI测试基准ARC-AGI-2,而当前行业顶尖的AI模型成绩居然不足5%。想想在去年的ARC-AGI-1测试中,OpenAI的o3系统,经过不断努力,终于拿到了87.5分,似乎要轻松解决这一挑战,但现在ARCPrize给出了全新的考题,令人咋舌!
在人工智能领域,持续的技术革新和评估方式的变革始终处于行业焦点之中。近期,ArcPrize基金会推出了一个名为ARC-AGI-2的全新测试,旨在为评估当前最顶尖的人工智能模型的通用智能水平提供一个新的标准。此举不仅标志着AI评估工具的进步,也暗示着在技术革新方面迫在眉睫的需求。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果