DeepMind人工智能的数学网格插图,灰色和绿色配白色数字。

AlphaTensor被设计用来执行矩阵乘法,但同样的方法也可以用来解决其他数学挑战。信贷:DeepMind

伦敦DeepMind的研究人员已经证明,人工智能(AI)可以在一种基本类型的数学计算中找到捷径,方法是将问题转化为一个游戏,然后利用该公司另一种人工智能曾经使用过的机器学习技术在围棋等游戏中击败人类玩家和象棋。

人工智能发现的算法打破了几十年来的计算效率记录,团队的发现,于十月五日出版自然1这可能会为某些领域的更快计算开辟新的途径。

“这非常令人印象深刻,”奥地利林茨约翰内斯开普勒大学的计算机科学家玛蒂娜·塞德尔说。“这项工作展示了利用机器学习解决数学难题的潜力。”

算法跟踪算法

机器学习的进步使研究人员能够开发出这样的人工智能生成语言预测蛋白质的形状2检测黑客.科学家们越来越多地让这项技术回归自身,利用机器学习来改进其自身的底层算法。

DeepMind开发的人工智能名为AlphaTensor,旨在执行一种名为矩阵乘法的计算。这涉及到将排列在网格(或矩阵)中的数字相乘,这些网格或矩阵可能代表图像中的像素集、天气模型中的空气条件或人工神经网络的内部工作。为了将两个矩阵相乘,数学家必须将单独的数相乘,并以特定的方式将它们相加,以生成一个新的矩阵。1969年,数学家沃尔克·斯特拉森(Volker Strassen)发现了一种方法,只需7次乘法就可以将一对2 × 2矩阵相乘3.这促使其他研究人员寻找更多类似的技巧。

DeepMind的方法使用了一种被称为强化学习的机器学习形式,其中人工智能“代理”(通常是神经网络)学习与环境互动,以实现一个多步骤目标,比如赢得一场棋盘游戏。如果它做得好,代理就会得到加强——它的内部参数会被更新,以使未来的成功更有可能。

AlphaTensor还包含了一种名为树搜索的游戏方法,即人工智能在计划下一步行动的同时探索分支可能性的结果。在树搜索中选择优先路径时,它要求神经网络预测每一步最有希望的行动。当智能体仍在学习时,它会使用游戏结果作为反馈来磨练神经网络,这进一步改善了树搜索,提供更多的成功案例来学习。

每个游戏都是一个单人谜题,以一个正确填写的3D张量(一个数字网格)开始。alphaatensor的目标是从允许的移动集合中选择,在最少的步骤中将所有数字归零。每一步移动都表示一个计算,当反转时,将前两个矩阵的项组合在一起,在输出矩阵中创建一个项。这个游戏很困难,因为在每一步中,智能体可能需要从数万亿步中进行选择。研究报告的合著者、DeepMind的计算机科学家侯赛因•法齐(Hussein Fawzi)在一次新闻发布会上表示:“制定算法发现的空间非常复杂,但更困难的是,我们如何在这个空间中导航。”

为了让AlphaTensor在训练过程中有所帮助,研究人员向它展示了一些成功的游戏例子,这样它就不用从头开始了。因为动作的顺序并不重要,当它发现一系列成功的动作时,他们也会将这些动作的重新排序作为例子,供它学习。

高效的计算

研究人员在高达5 × 5的输入矩阵上测试了该系统。在许多情况下,alphaatensor重新发现了斯特拉森和其他数学家设计的捷径,但在其他情况下,它开辟了新的领域。例如,当一个4 × 5矩阵乘以一个5 × 5矩阵时,以前最好的算法需要80次单独的乘法。alphaatensor发现了一种算法,只需要76个。

“通过玩这些游戏,它获得了惊人的直觉,”DeepMind的计算机科学家Pushmeet Kohli在新闻发布会上说。法瓦兹。告诉自然“AlphaTensor没有嵌入关于矩阵乘法的人类直觉”,所以“在某种意义上,智能体需要从头开始构建自己的关于问题的知识”。

研究人员通过创建一种元算法来解决更大的矩阵乘法问题,该算法首先将问题分解为更小的问题。当交叉11 × 12和12 × 12矩阵时,他们的方法将所需的乘法次数从1022次减少到990次。

AlphaTensor还可以优化特定硬件的矩阵乘法。该团队在两个不同的处理器上训练代理,不仅在它采取更少的动作时加强它,而且在它减少运行时间时也加强它。在许多情况下,与之前的算法相比,人工智能将矩阵乘法的速度提高了几个百分点。有时一个处理器上最快的算法在另一个处理器上却不是最快的。

研究人员说,同样的一般方法也可以应用于其他类型的数学运算,比如将复杂的波或其他数学对象分解成更简单的波。麻省理工学院剑桥分校的计算机科学家Virginia Vassilevska Williams说:“如果能在实践中应用,这一发展将非常令人兴奋。”“性能的提升将改善许多应用程序。”

北卡罗来纳州温斯顿-塞勒姆市维克森林大学的计算机科学家格雷·巴拉德看到了未来人机合作的潜力。他说:“虽然我们可以用这种计算方法把边界推得更远一点,但我很高兴理论研究人员开始分析他们发现的新算法,以找到寻找下一个突破的线索。”