人工智能可能是探索宇宙的完美工具


在努力理解宇宙的过程中,我们变得贪婪,做出了比我们知道该怎么做更多的观察 。卫星每年发射的信息量达数百兆字节,而智利正在建造的一架望远镜每晚将产生15 TB的太空图片 。对于人类来说,这是不可能的 。正如天文学家Carlo Enrico Petrillo告诉The Verge:“看星系的图像是我们工作中最浪漫的部分 。问题一直在集中 。”这就是Petrillo训练AI程序来寻找他的原因 。
Petrillo和他的同事正在寻找一种基本上是太空望远镜的现象 。当一个巨大的物体(一个星系或一个黑洞)进入遥远的光源和地球上的观察者之间时,它会弯曲空间和周围的光线,从而形成一个透镜,使天文学家能够更近距离地观察到地球上难以置信的古老而遥远的部分 。应当被屏蔽的宇宙 。这称为重力透镜,这些透镜对于理解宇宙的构成至关重要 。但是,到目前为止,找到它们是一项缓慢而乏味的工作 。
那就是人工智能的源头-寻找引力透镜只是一个开始 。就像斯坦福大学教授吴安德(Andrew Ng)所说的那样,人工智能的能力能够使任何事情“自动化,一个典型的人只需不到一秒钟的思想就可以完成 。”不到一秒钟听起来似乎没有太多思考的余地,但是在筛选当代天文学所创建的大量数据时,这真是天赐之物 。
这波AI天文学家不仅在考虑这项技术如何对数据进行分类 。他们正在探索一种全新的科学发现模式,其中人工智能可以绘制出我们从未见过的宇宙部分 。
但首先:重力透镜 。爱因斯坦的广义相对论在1930年代就一直预言这种现象,但直到1979年才发现第一个例子 。为什么?好吧,空间非常非常大,人类需要花费很长时间才能看到它,尤其是在没有今天的望远镜的情况下 。到目前为止,寻求重力透镜的事情是零星的 。
【人工智能可能是探索宇宙的完美工具】明尼苏达大学天体物理学教授莉莉亚·威廉姆斯(Liliya Williams)告诉《边缘报》:“我们现在已经通过各种方式找到了这些透镜 。”寻找某些完全不同的东西是偶然发现的 。通过两三个调查,有人在寻找它们 。但是其余都是偶然发现的 。”
看着图像正是AI擅长的事情 。因此,波恩,那不勒斯和格罗宁根大学的Petrillo及其同事转向了硅谷钟爱的AI工具:一种由数字“神经元”组成的计算机程序,以大脑中的神经元为模型,响应输入而激发 。向这些程序(称为神经网络)提供大量数据,它们将开始识别模式 。它们特别擅长处理视觉信息,并用于为各种机器视觉系统提供动力-从自动驾驶汽车的摄像头到Facebook的图片标记面部识别 。
如上个月发表的一篇论文所述,将这项技术应用于寻找重力透镜非常简单 。首先,科学家们建立了一个数据集来训练神经网络,这意味着生成600万张虚假图像,显示出引力透镜的功能和外观 。然后,他们使神经网络失去了对数据的支持,使其缓慢地识别模式 。稍后进行了一些微调,他们有了一个程序,可以在眨眼之间识别引力透镜 。
AI在短短20分钟内检查了21,789张图片
Petrillo说:“一个非常优秀的人类分类器可以以每小时约一千的速度对图像进行分类 。”根据他的团队使用的那种数据,他估计每30,000个星系中都会发现一个透镜 。因此,一个不经过睡眠或休息一周工作的人类分类器将只能找到五到六个镜片 。相比之下,神经网络在短短20分钟内浏览了21789张图像的数据库 。Petrillo说,那是一个单一的古老计算机处理器 。他说:“这段时间可以大大缩短 。”
神经网络不如计算机精确 。为了避免俯视任何镜头,其参数非常宽大 。它产生了761种可能的候选物,人类对其进行了审查,并缩减为56种 。需要进一步观察以确认这些是合法发现,但Petrillo猜测大约三分之一将成为真正的发现 。与过去几十年来整个科学界发现的数百个镜头相比,这大约每分钟可找到一个镜头 。这是令人难以置信的加速,也是AI如何帮助天文学的完美范例 。
找到这些透镜对于理解天文学的一个大奥秘至关重要:宇宙实际上是由什么组成的?我们所熟悉的物质(行星,恒星,小行星等)被认为仅占所有物理物质的5%,而其他怪异的物质构成了另外95% 。其中包括一种称为暗物质的假设物质,我们从未直接观察到 。相反,我们用重力透镜作为关键指标之一,研究了它对宇宙其余部分的引力影响 。
那么AI还能做什么呢?研究人员正在研究许多新工具 。有些像Petrillo一样,正在从事鉴定工作:例如,对星系进行分类 。其他公司则正在帮助梳理数据流中的有趣信号,例如一个神经网络,该网络消除了射电望远镜的人为干扰,以帮助科学家发现潜在的令人兴奋的信号 。还有更多的方法被用于识别脉冲星,定位异常的系外行星或增强低分辨率望远镜的图像 。简而言之,存在大量潜在的应用程序 。
“总的来说,与机器相比,人类更加偏见,效率低下并且更容易犯错误 。”
爆炸的部分原因是更大的硬件趋势使AI的应用领域更加广泛,例如大量廉价的计算能力 。但这也是由于天文学性质的变化 。天文学家不再在无云的夜晚保持寂寞的守夜,跟踪各个行星的运动 。取而代之的是,他们使用复杂的机器,吞噬了早期科学家无法想象的大量数据,吞噬了天空的一部分 。威廉姆斯说,更好的望远镜和更好的数据存储意味着比以往更多的分析 。
数据的分析伟大的大片正是人工智能是很大的 。我们可以教它识别模式,然后将其设置为像不倦的助手一样工作:从不眨眼,始终保持一致 。
它是否使天文学家担心他们信任一台可能缺乏发现敏锐事物所需的人类洞察力的机器上的信任?彼得里洛(Petrilo)说,他没有打扰 。“总的来说,与机器相比,人类更加偏见,效率低下并且更容易犯错误 。”威廉姆斯同意:“计算机可能会遗漏某些事物,但是他们会系统地怀念它们 。”只要我们知道他们不知道什么,我们就可以部署自动化系统而不会带来太大风险 。
对于某些天文学家来说,人工智能的潜力已不仅仅是单纯的数据分类 。他们认为人工智能可以用来创造信息,填补我们对宇宙的观察中的盲点 。
天文学家凯文·舍温斯基(Kevin Schawinski)和他的团队专门研究银河系和黑洞天体物理学,他们使用AI来增强模糊望远镜图像的分辨率 。为此,他们部署了一种神经网络,这种神经网络擅长于生成所研究数据的变化,例如可以模仿著名画家风格的训练有素的伪造者 。这些被称为生成对抗网络(GAN)的网络已被用来根据名人的照片制作假脸 。模仿个人声音的虚假音频对话;以及其他一系列数据类型 。它们是当代AI研究中最丰富的接缝之一,对于Schawinski来说,它们意味着获得以前所没有的信息 。
Schawinski和他的团队在今年早些时候发表的论文展示了如何使用GAN来改善空间图片的质量 。他们降低了一堆星系图片的图像质量,增加了噪点和模糊,然后使用经过望远镜图像训练的GAN来提高其分辨率,并将其与原始图像进行比较 。结果非常准确:足以说服沙文斯基相信人工智能有潜力改善天文学中的各种数据集 。他说,他和他的团队“正在取得很多不错的结果”,但是他们在发布之前无法透露任何信息 。
沙温斯基对此项目持谨慎态度 。毕竟,这听起来似乎违反了科学的核心原理:您只能通过直接观察宇宙来了解宇宙 。他说:“正是出于这个原因,这是一种危险的工具 。”只有在我们a)拥有足够且准确的训练数据并且b)可以检查结果的情况下,才应使用该工具 。因此,您可以训练GAN来生成有关黑洞的数据,然后将其放宽到以前从未详细观察到的天空部分 。然后,如果它暗示那里存在黑洞,那么天文学家将第一手证实这一发现,就像引力透镜一样 。Schawinski说,与所有科学工具一样,需要进行严格的耐心测试,以确保获得的结果不会“误入歧途” 。
如果这些方法卓有成效,那么它们将成为Schawinski的一个全新的探索方法,与经典计算机模拟和良好的老式观察一起应运而生 。现在还很早,但是回报可能是巨大的 。Schawinski说:“如果拥有此工具,则可以访问存档中的所有现有数据,也许可以对其进行一些改进,并获得更多的科学价值 。”以前没有的价值 。人工智能将执行某种科学的炼金术,帮助我们将旧知识转化为新知识 。而且我们甚至可以在不离开地球的情况下探索前所未有的太空 。

    推荐阅读