谷歌DeepMind AI系统展现超强几何解题能力
创始人
2025-02-08 09:40:50

IT之家 2 月 8 日消息,谷歌旗下人工智能研究实验室 DeepMind 开发的人工智能系统 AlphaGeometry2 在解决国际数学奥林匹克竞赛(IMO)几何问题方面取得了突破性进展,其表现甚至超过了平均金牌得主。

AlphaGeometry2 是 DeepMind 在今年 1 月发布的 AlphaGeometry 系统的改进版本。根据 DeepMind 研究人员最新发表的论文,该 AI 系统能够解决过去 25 年国际数学奥林匹克竞赛中 84% 的几何问题。国际数学奥林匹克竞赛是一项面向高中生的数学竞赛,而 DeepMind 认为,发现解决复杂几何问题(特别是欧几里得几何问题)的新方法可能是实现更强大人工智能的关键。

证明数学定理或逻辑解释定理(例如勾股定理)为何成立,需要推理能力以及从多种可能的步骤中选择解决方案的能力。如果 DeepMind 的观点正确,这些解决问题的技能将成为未来通用人工智能模型的重要组成部分。

IT之家注意到,去年夏天,DeepMind 展示了一个将 AlphaGeometry2 与 AlphaProof(一种用于形式化数学推理的 AI 模型)相结合的系统,成功解决了 2024 年国际数学奥林匹克竞赛中的 6 个问题中的 4 个。除了几何问题,类似的方法还可以扩展到数学和科学的其他领域,例如辅助复杂的工程计算。

AlphaGeometry2 包含几个核心要素,其中包括谷歌 Gemini 系列 AI 模型中的语言模型和一个“符号引擎”。Gemini 模型协助符号引擎,后者利用数学规则推导问题的解决方案,并为给定的几何定理提供可行的证明。

由于将证明转化为 AI 可理解的格式存在复杂性,可用的几何训练数据匮乏。因此,DeepMind 为 AlphaGeometry2 的语言模型创建了自己的合成数据,生成了超过 3 亿个不同复杂度的定理和证明。

研究团队从过去 25 年(2000 年至 2024 年)的国际数学奥林匹克竞赛中挑选了 45 个几何问题,包括线性方程和需要在平面上移动几何对象的方程,并将其“翻译”成一个更大的 50 个问题的集合(由于技术原因,某些问题需要拆分为两个)。根据论文,AlphaGeometry2 解决了其中的 42 个问题,超过了平均金牌得主 40.9 的得分。

不过,该系统也存在局限性。一个技术问题导致 AlphaGeometry2 无法解决涉及可变数量点、非线性方程和不等式的问题。此外,尽管 AlphaGeometry2 不是第一个达到几何问题金牌水平表现的 AI 系统,但它是在如此规模的问题集上实现这一目标的首个系统。

在另一组更具挑战性的国际数学奥林匹克竞赛问题上,AlphaGeometry2 的表现也不尽如人意。DeepMind 团队额外挑选了 29 个由数学专家为竞赛提名但尚未出现在比赛中的问题,AlphaGeometry2 只能解决其中的 20 个。

相关内容

热门资讯

“老小孩”玩具如何征服“银发族...   新华网记者 潘子荻   老年大学“一课难求”、银发旅游列车穿越山海、养老机器人正加速走进现实生活...
和讯投顾华飞凡:可回收航天器成... 为什么说商业航天可回收这一概念或将继续演绎? 就在2月7号,酒泉卫星发射中心长征二号f运载火箭一飞冲...
“深圳市先进数据要素研究院”揭... 深圳商报·读创客户端记者 刘娥 2月7日,由深圳市先进数据要素研究院主办的“2026深圳跨境数据流通...
北方国际获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示北方国际(000065)新获得一项实用新型专利授权,专利名为“...
Workday首席执行官埃申巴... 来源:环球市场播报 核心要点 Workday 首席执行官卡尔・埃申巴赫即刻卸任。 公司联合创始...