科学家们第一次用人工智能(AI)来生成复杂的三维宇宙模拟,结果是相当的准确、稳定、和快速。该研究的合著者雪莉·何(Shirley Ho)说:我们可以在几毫秒内运行这些模拟,而其他‘快速’模拟需要几分钟,不仅如此,而且更准确。这项名为“深层密度位移模型”(Deep Density Displacement Model,简称D3M)的工程速度和准确性,并不是研究人员最惊讶的地方。
真正令人震惊的是,D3M能够准确地模拟出如果某些参数被调整后宇宙的样子(比如宇宙中有多少是暗物质)即使该模型从未收到任何这些参数变化的训练数据。这就像教图像识别软件,里面有很多猫和狗的图片,然后它就能识别大象了,没有人知道它是如何做到这一点的,这是一个有待解决的巨大谜团,其研究发表在《美国国家科学院院刊》上。Shirley Ho和加州大学伯克利分校伯克利宇宙物理中心的Yin Li和东京Kavli宇宙物理和数学研究所合作
伯克利宇宙物理中心的余峰,熨斗研究所的魏晨,温哥华不列颠哥伦比亚大学的Siamak Ravanbakhsh和Carnegie Mellon大学的BarnabásPóczos。像D3M所做的计算机模拟已经成为理论天体物理学的基础,科学家们想知道宇宙在不同的情况下可能如何演化,比导致宇宙膨胀的暗能量是否会随着时间而变化。这样的研究需要运行数千次模拟,使闪电般快速和高度精确的计算机模型成为现代天体物理学的主要目标之一,D3M模拟重力如何塑造宇宙,研究人员选择只关注引力。
因为到目前为止,当涉及到宇宙的大规模演化时,引力是最重要的力量。最精确的宇宙模拟计算了引力如何在整个宇宙年龄范围内改变数十亿个单个粒子。这种精度需要时间,一次模拟需要大约300个小时的计算时间。更快的方法可以在大约两分钟内完成相同模拟,但是所需的快捷方式会导致较低的精度,研究人员对D3M的深层神经网络进行了磨练。给D3M提供了8000种不同的模拟,这些模拟来自于可用的最精确模型之一。
神经网络获取训练数据并对其进行计算,然后研究人员将结果与预期结果进行比较。随着进一步的训练,神经网络会随着时间的推移而适应,从而产生更快、更准确的结果。在训练了D3M之后,研究人员对一个直径6亿光年的盒子状宇宙进行了模拟
并将结果与慢速模型和快速模型进行了比较,虽然慢但准确的方法每次模拟需要数百小时的计算时间。而现有的快速方法只需几分钟,但D3M可以在30毫秒内完成模拟。D3M也得出了准确的结果。与高精度模型相比,D3M的相对误差为2.8%。
使用相同的比较,现有快速模型的相对误差为9.3%,D3M处理训练数据中没有发现参数变化的非凡能力使其成为一个特别有用和灵活的工具。除了对其他力进行建模,比如流体动力学,研究团队希望更多地了解模型在引擎盖下是如何工作的。这样做可以为人工智能和机器学习的进步带来好处,对于机器学习者来说,可以成为一个有趣的游乐场,来看看为什么这个模型可以推断得这么好,为什么它可以推断大象,而不仅仅是识别猫和狗,这是科学和深度学习之间的双向道路。