新闻频道 > 热点 >正文

AI盯上奥数!谷歌DeepMind:能以人类金牌水平解决几何题

来源:澎湃新闻2024年01月19日

AlphaGeometry团队成员:(左起)Yuhuai Wu、Trieu H. Trinh、Quoc V. Le和Thang Luong。



  当地时间1月17日,人工智能开发机构谷歌DeepMind推出了名为AlphaGeometry(阿尔法几何)的AI系统,称该系统可以以国际数学奥林匹克竞赛金牌得主的平均水平解决几何问题。

  有关该研究的论文表示,这“代表了人类水平自动化推理的一个显著里程碑”。科学家认为,证明数学定理的方法有一天可能会在通用人工智能系统中发挥作用。

  此外,AlphaGeometry是一个“神经符号”系统。它将“擅长直觉”的神经网络语言模型(如ChatGPT)与“擅长推理”的符号引擎(如逻辑计算器)结合,可能会再次引发长期以来的争论,即人工智能系统应建立在符号操作基础上还是看起来更像人脑的神经网络上。

  为什么要关注几何?

  有关这一研究的论文17日发表在《自然》杂志上。AlphaGeometry的代码也在当天开源。

  根据谷歌DeepMind人工智能科学家Trieu Trinh的展示,从2000年至2022年奥数比赛中抽取的30道几何题中,AlphaGeometry解决了25道题。从历史上看,在相同时间内,人类金牌得主平均解决了25.9道题。Trinh还将问题交给了20世纪70年代开发的一个系统,该系统被认为是最强的几何定理证明器:只解决了10道题。

  AlphaGeometry最复杂的合成证明的长度令人印象深刻,为247个步骤。最简单的证明只有一步。

  加州大学洛杉矶分校数学家陶哲轩 (Terence Tao)是有史以来最年轻的奥数金牌获得者,获奖时只有12岁。他认为AlphaGeometry是“出色的工作”,并且取得了“令人惊讶的强劲结果”。

  Trinh与另一位谷歌DeepMind的人工智能科学家Thang Luong在一篇博客文章中写道:“解决奥数级别的几何问题是发展深度数学推理、迈向更先进和通用人工智能系统的一个重要里程碑。”“(我们)希望……AlphaGeometry有助于在数学、科学和人工智能领域开辟新的可能性。”

  为什么要关注几何?谷歌DeepMind表示,证明数学定理,或者从逻辑上解释为什么一个定理(例如毕达哥拉斯定理)是正确的,需要推理和从一系列可能的解决方案中进行选择的能力。这种解决问题的方法有一天可能会在通用人工智能系统中发挥作用。

  “证明某个特定猜想的真假,可以扩展即使是当今最先进人工智能系统的能力。”谷歌DeepMind在新闻稿中写道 。

  Trinh表示,他将尝试将该系统推广到数学领域及其他领域,考虑所有类型推理的“共同的基本原则”。

  不过,人工智能研究机构xAI的联合创始人、曾在谷歌工作的克里斯蒂安·塞格迪(Christian Szegedy)对《纽约时报》表示,“这是一个非常有趣的概念证明”,但它“留下了很多悬而未决的问题”,并且“不容易推广到其他领域和其他数学领域”。

  陶哲轩认为,微调人工智能系统来解决奥数问题可能不会提高其深度研究的技能,但在这种情况下,旅程可能比目的地更有价值。

  神经网络与符号系统的结合

  训练人工智能系统来解决几何问题面临着独特的挑战。由于将证明转换为机器可以理解的格式十分复杂,因此缺乏可用的几何训练数据。当今许多尖端的生成式人工智能模型虽然在识别数据模式和关系方面表现出色,但缺乏通过定理进行逻辑推理的能力。

  谷歌DeepMind的解决方法有两重。在设计AlphaGeometry时,实验室将“神经语言”模型(在架构上类似于ChatGPT)与“符号演绎引擎”配对,该引擎利用规则(如数学规则)来推断问题的解决方案。符号引擎可能不灵活且缓慢,尤其是在处理大型或复杂的数据集时。但谷歌DeepMind通过让神经模型“引导”推演引擎找到给定几何问题的可能答案,从而缓解了这些问题。

  谷歌DeepMind还创建了自己的合成数据来代替训练数据,生成1亿个“合成定理”和不同复杂性的证明。然后,实验室利用合成数据从头开始训练AlphaGeometry,并针对奥数几何问题对其进行评估。奥数几何问题基于需要添加“结构”才能解决的图表,例如点、线或圆。应用于这些问题时,AlphaGeometry的神经模型会预测哪些结构可能对添加有用,AlphaGeometry的符号引擎使用这些预测来对图表进行推论,以识别类似的解决方案。

AlphaGeometry生成的一些合成证明数据的视觉表示。



  “有了这么多关于这些构造如何产生证明的例子,AlphaGeometry的语言模型能够在遇到奥数几何问题时为新构造提出很好的建议。”Trinh和 Luong写道,“一个系统提供快速、‘直观’的想法,而另一个系统则提供更加深思熟虑、理性的决策。”

  更通俗点解释,一旦AlphaGeometry遇到一个问题,符号引擎就开始尝试解决;如果遇到困难,神经网络会提出增强证明论证的方法,继续循环直到解决方案实现或时间耗尽。用数学术语来说,这种增强过程被称为“辅助构造”,添加一条线、平分一个角、画一个圆——这就是数学家修补问题并寻找答案的方式。在这个系统中,神经网络学会了以类似人类的方式进行辅助构建。Trinh将其比作将橡皮筋缠绕在难打开的罐子盖上,以帮助手更好地抓握。

  这项研究可能会再次引发神经网络和符号系统孰优孰劣的争论。符号系统通过定义专用于特定工作的符号操作规则集(例如在文字处理软件中编辑一行字)来解决任务,而神经网络则尝试通过统计近似值和从示例中学习来解决任务。

  神经网络的支持者认为,智能行为(从语音识别到图像生成)只能从大量数据和计算中产生。神经网络是OpenAI的DALL·E 3和GPT-4等强大人工智能系统的基石。

  但是,符号人工智能的支持者称,神经网络并不是最终解决方案。符号人工智能可能更适合有效地编码世界知识,通过复杂的场景进行推理,并“解释”如何得出答案。

  作为类似于DeepMind开发的AlphaFold 2和AlphaGo的混合符号神经网络系统,AlphaGeometry或许证明了符号操作和神经网络这两种方法的结合是寻找通用人工智能的最佳路径。

【责任编辑:胡庆章】

故宫音乐剧《甪端》驻演北京欢乐谷华侨城大剧院

中国青年报客户端2024-01-16 15:41:49

氛围感拉满的英歌舞一直都很“火”

中国青年报客户端2024-01-16 12:58:24

陕北民歌唱响中国工美馆中国非遗馆

中国青年报客户端2024-01-15 13:12:38

“君生我未生”无关爱情,唐人无惧相忘江湖

中国青年报客户端2024-01-12 10:50:07

《繁花》落幕:小说“二度创作”如何大放异彩

中国青年报客户端2024-01-12 10:32:51

杨军:拉开海昏侯墓的历史大幕

中国青年报客户端2024-01-12 10:50:17

文运启国运 大业见华章

中国青年报客户端2024-01-12 10:50:04

如果与李白面对面

中国青年报客户端2024-01-12 10:50:03

刘震云:从来没人给我种过“文学的种子”

中国青年报客户端2024-01-12 10:32:50

杨军:拉开海昏侯墓的历史大幕

中国青年报2024-01-12 06:29:45

哆哆女性网壮阳最快最猛的中药s3皇族呼兰河传主要内容李姓马年男宝宝起名nba凯尔特人队牛宝宝起名怎么起重生药王追虎擒龙粤语在线观看公司起名 缺水饺子馆起名子新闻联播大结局变废为宝项目bipt低头不见抬头见烁的意思 起名澳客网手机版建筑劳务公司起甚么名字好巴西热身赛女装服装店起名蒸六福农产品公司起名大全快速起名器东方卫视直播在线观看科技公司起名3字乾坤剑神崔字起名男孩取名大全姓顾婴儿起名重庆鸡公煲加盟疯狂的石头在线观看乒乓球混双比赛规则淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻不负春光新的一天从800个哈欠开始有个姐真把千机伞做出来了国产伟哥去年销售近13亿充个话费竟沦为间接洗钱工具重庆警方辟谣“男子杀人焚尸”男子给前妻转账 现任妻子起诉要回春分繁花正当时呼北高速交通事故已致14人死亡杨洋拄拐现身医院月嫂回应掌掴婴儿是在赶虫子男孩疑遭霸凌 家长讨说法被踢出群因自嘲式简历走红的教授更新简介网友建议重庆地铁不准乘客携带菜筐清明节放假3天调休1天郑州一火锅店爆改成麻辣烫店19岁小伙救下5人后溺亡 多方发声两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#青海通报栏杆断裂小学生跌落住进ICU代拍被何赛飞拿着魔杖追着打315晚会后胖东来又人满为患了当地回应沈阳致3死车祸车主疑毒驾武汉大学樱花即将进入盛花期张立群任西安交通大学校长为江西彩礼“减负”的“试婚人”网友洛杉矶偶遇贾玲倪萍分享减重40斤方法男孩8年未见母亲被告知被遗忘小米汽车超级工厂正式揭幕周杰伦一审败诉网易特朗普谈“凯特王妃P图照”考生莫言也上北大硕士复试名单了妈妈回应孩子在校撞护栏坠楼恒大被罚41.75亿到底怎么缴男子持台球杆殴打2名女店员被抓校方回应护栏损坏小学生课间坠楼外国人感慨凌晨的中国很安全火箭最近9战8胜1负王树国3次鞠躬告别西交大师生房客欠租失踪 房东直发愁萧美琴窜访捷克 外交部回应山西省委原副书记商黎光被逮捕阿根廷将发行1万与2万面值的纸币英国王室又一合照被质疑P图男子被猫抓伤后确诊“猫抓病”

哆哆女性网 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化