谷歌DeepMind AI系统展现超强几何解题能力
创始人
2025-02-08 09:40:50
0

IT之家 2 月 8 日消息,谷歌旗下人工智能研究实验室 DeepMind 开发的人工智能系统 AlphaGeometry2 在解决国际数学奥林匹克竞赛(IMO)几何问题方面取得了突破性进展,其表现甚至超过了平均金牌得主。

AlphaGeometry2 是 DeepMind 在今年 1 月发布的 AlphaGeometry 系统的改进版本。根据 DeepMind 研究人员最新发表的论文,该 AI 系统能够解决过去 25 年国际数学奥林匹克竞赛中 84% 的几何问题。国际数学奥林匹克竞赛是一项面向高中生的数学竞赛,而 DeepMind 认为,发现解决复杂几何问题(特别是欧几里得几何问题)的新方法可能是实现更强大人工智能的关键。

证明数学定理或逻辑解释定理(例如勾股定理)为何成立,需要推理能力以及从多种可能的步骤中选择解决方案的能力。如果 DeepMind 的观点正确,这些解决问题的技能将成为未来通用人工智能模型的重要组成部分。

IT之家注意到,去年夏天,DeepMind 展示了一个将 AlphaGeometry2 与 AlphaProof(一种用于形式化数学推理的 AI 模型)相结合的系统,成功解决了 2024 年国际数学奥林匹克竞赛中的 6 个问题中的 4 个。除了几何问题,类似的方法还可以扩展到数学和科学的其他领域,例如辅助复杂的工程计算。

AlphaGeometry2 包含几个核心要素,其中包括谷歌 Gemini 系列 AI 模型中的语言模型和一个“符号引擎”。Gemini 模型协助符号引擎,后者利用数学规则推导问题的解决方案,并为给定的几何定理提供可行的证明。

由于将证明转化为 AI 可理解的格式存在复杂性,可用的几何训练数据匮乏。因此,DeepMind 为 AlphaGeometry2 的语言模型创建了自己的合成数据,生成了超过 3 亿个不同复杂度的定理和证明。

研究团队从过去 25 年(2000 年至 2024 年)的国际数学奥林匹克竞赛中挑选了 45 个几何问题,包括线性方程和需要在平面上移动几何对象的方程,并将其“翻译”成一个更大的 50 个问题的集合(由于技术原因,某些问题需要拆分为两个)。根据论文,AlphaGeometry2 解决了其中的 42 个问题,超过了平均金牌得主 40.9 的得分。

不过,该系统也存在局限性。一个技术问题导致 AlphaGeometry2 无法解决涉及可变数量点、非线性方程和不等式的问题。此外,尽管 AlphaGeometry2 不是第一个达到几何问题金牌水平表现的 AI 系统,但它是在如此规模的问题集上实现这一目标的首个系统。

在另一组更具挑战性的国际数学奥林匹克竞赛问题上,AlphaGeometry2 的表现也不尽如人意。DeepMind 团队额外挑选了 29 个由数学专家为竞赛提名但尚未出现在比赛中的问题,AlphaGeometry2 只能解决其中的 20 个。

相关内容

热门资讯

游戏指南!牛牛可以建房间吗,微... m9bSQ2此次iPhone 14系列共有四款机型,iPhone 14、iPhone 14 Max、...
汉王科技:2月4日进行路演,国... 证券之星消息,2025年2月6日汉王科技(002362)发布公告称公司于2025年2月4日进行路演,...
连雷军都在劝你学AI,但这课我... 昨天,# 雷军劝年轻人尽快学会 AI # 的话题词冲上热搜,狂揽 1.5 亿的阅读量。 在那一次的采...
游戏指南!牛牛房卡游戏平台加盟... h2iPhone 15 Pro系列相比于之前的机型在内存上增加到了6 GB,因此比之前多了100美元...
评测!金花房卡购买联系方式,牛... UmkmsOPPO原来的系统确实做得一般,但是近几年已经有了很大的改善,流畅了很多,比如OPPO R...
ios系统:便宜的云手机哪个行... **一、比价逻辑** 在云手机市场中,用户往往被“低价”标签吸引,但真正实惠的产品需同时满足性能稳定...
原创 民... 高科技时代,很多民用设备也更加新奇,家用风力发电机就是新出现的民用装备,它值得普通家庭安装吗?每天大...
游戏介绍!正版房卡批发,斗牛房... WVTgkiPhone16Pro的单打孔和安卓手机的打孔屏完全不同,因为苹果保留了FaceID,所以...
游戏知识!牛牛可以建房间吗,牛... vrixRI此次iPhone 14系列共有四款机型,iPhone 14、iPhone 14 Max、...
评测!正版房卡批发大厅,正规房... OfAkhZcm苹果旗舰手机在全球手机市场,都占据重要的市场份额,所以苹果的热度也就可想而知了。在i...
警惕 | 小行星将撞击地球?联... 近日,一条消息在科学界引起了轩然大波。据外媒报道,有一颗直径约100米,名字为2024YR4的小行星...
DeepSeek重塑机器人!不... 如果说 2023、2024 开年科技行业最重要的新闻分别是 ChatGPT 和 Sora,那 202...
GitHub Copilot ... IT之家 2 月 8 日消息,GitHub 宣布了其 AI 编程助手 Copilot 的一系列重大更...
钱塘征信正式成立,蚂蚁集团持股... 钱塘征信称,后续将按照市场化原则设立股东会、董事会、监事会和高级管理层 文|《财经》记者 唐郡 编辑...
游戏知识!斗牛房卡价格,房卡牛... b对于预算不算充足或者说对14系列不满意的朋友来说,如今正在打折促销的苹果手机产品都是值得入手的。尤...
游戏介绍!金花房卡怎么买游戏,... RruuAA苹果手机虽然备受消费者的欢迎,同时也搭载的是自研的iOS系统,但是在很多方面,苹果也借鉴...
为智能制造注入新的活力,深圳虚... 在全球制造业转型升级的背景下,智能制造正成为推动产业变革的核心动力。作为智能制造的重要组成部分,工业...
DeepSeek持续扩大生态圈 DeepSeek(深度求索)成为继ChatGPT之后的又一现象级AI产品。据国内AI产品榜统计数据,...
锐奇股份获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示锐奇股份(300126)新获得一项实用新型专利授权,专利名为“...
万亿小米“扫大家兴”,AI眼镜... (文/观察者网 吕栋) 小米AI眼镜要来了? 昨天晚上(2月6日),小米眼镜官方微博“悄悄上线”...