如果外星人向我们发送信号,这就是他们的样子

六十多年来,科学家们一直在宇宙中寻找可能表明存在外星智慧(ETI)的无线电传输迹象。 在那个时候,技术和方法已经相当成熟,但最大的挑战仍然存在。 除了从未检测到来自外星的无线电信号外,这种广播还可能采取多种可能的形式。

简而言之,SETI 研究人员必须假设信号会是什么样子,但没有任何已知示例的好处。 最近,由加州大学伯克利分校和 SETI 研究所领导的国际团队开发了一个 新的机器学习工具 它模拟了来自外星智能 (ETI) 的信息的样子。 它被称为 塞蒂根,一个开源库,可能会改变未来 SETI 研究的游戏规则!

研究小组由 布莱恩·布兹基,加州大学伯克利分校的天文学研究生。 他加入了 安德鲁·西米恩主任 伯克利 SETI 研究中心和研究人员 SETI研究所, 突破性聆听, 这 邓拉普天文与天体物理研究所, 这 空间科学与天文学研究所, 国际射电天文学研究中心 (ICRAR) 和 格尔根数据科学研究所.

NRAO 的 85 英尺(26 m)Howard E. Tatel 射电望远镜用于 Ozma 项目。 学分:Z22/维基百科共享

自 1960 年代以来,SETI 最常用的方法是在宇宙中搜索源自人造的无线电信号。 第一个这样的实验是 奥兹玛计划 (1960 年 4 月至 7 月),由著名的康奈尔天体物理学家弗兰克·德雷克(德雷克方程的创造者)领导。 这项调查依赖于 25 米的圆盘 国家射电天文台 在西弗吉尼亚州的格林班克,监测 厄普西隆波江头鲸鱼 频率约为 400 kHz,频率约为 1.42 GHz。

此后,这些搜索已经扩展到覆盖更大的夜空区域、更宽的频率范围和更大的信号多样性。 正如 Brzycki 通过电子邮件向今日宇宙解释的那样:

“在 1960 年代,这个想法是集中在一个众所周知的频率附近的区域,中性氢在星际空间中发射辐射,频率为 1.42 GHz。 由于这种自然辐射在整个银河系中普遍存在,因此任何智能文明都会知道它,并可能以该频率为目标进行传输,以最大限度地提高检测机会。 从那时起,特别是随着技术的迅速发展,SETI 无线电已沿所有测量轴扩展。

“我们现在可以立即在多个 GHz 的带宽上进行测量。 随着存储的改进,我们可以收集大量数据,从而在时间和频率方向上进行更高分辨率的观测。 出于同样的原因,我们已经对附近的恒星和银河系中的其他方向进行了调查,以最大限度地接触天空中可能有趣的方向。”

从 Setigen 帧创建的无线电频谱图。 信用:Brzycki 等人。

另一个重大变化是引入了基于机器学习的算法,旨在发现宇宙无线电背景噪声中的传输并纠正射频干扰 (RFI)。 SETI调查中使用的算法分为两类之一:测量电压时间序列数据的算法和测量时间频率谱图数据的算法。

“无线电天线收集的原始数据是电压测量值; 无线电波在天线中感应出电流,该电流被读出并记录为电压,”Brzycki 说。 “射电望远镜实际上只是一个由抛物面碟形天线增强的天线,用于聚焦更大区域的光,从而提高分辨率和亮度。 事实证明,强度与电压的平方成正比。 此外,我们关心作为频率和时间函数的强度(潜在信号的时间和地点)。”

Brzycki 说,为了得到这个,天文学家首先使用算法来计算每个频率对输入时间序列数据观察到的功率。 换句话说,该算法将无线电信号数据从空间和/或时间的函数转换为依赖于空间频率或时间频率的函数——也就是。 一种 傅里叶变换 (英尺)。 通过平方,天文学家可以测量数据收集期间每个频率的强度。

“为了获得完整的频谱图,作为时间和频率函数的强度阵列,我们取一部分电压时间序列,得到 FT,然后在整个观察过程中重复这个过程,这样我们就可以有效地堆叠一系列FT 数据阵列在时间方向上相互叠加,”Brzycki 补充道。 “[O]一旦您决定了时间分辨率,我们就会计算出所需的时间样本数量并计算 FT 以查看每个频率仓中有多少功率。”

艺术家对 Breakthrough Listen 及其依赖的乐器的印象。 学分:突破听力/大学。 马切斯特/Daniëlle Futselaar

SETI 研究人员使用的主要搜索算法被称为“非相干树去多普勒”算法,它移动无线电波的频谱以校正 频率漂移 并最大化信号的信噪比。 有史以来最全面的 SETI 搜索程序, 突破性聆听使用该算法的开源版本,称为 涡轮SETI,它已成为许多“技术签名”搜索(又名技术活动的迹象)的支柱。 正如 Brzycki 解释的那样,这种方法有一些缺点:

“该算法假设潜在的 SETI 信号以高占空比连续(这意味着它几乎总是‘开启’)。 寻找连续的正弦波信号是很好的第一步,因为人类产生和传输此类信号相对容易且功率低廉。

“由于 TurboSETI 的目标是始终处于“开启”状态的直线信号,因此它可能难以拾取替代形态,例如宽带和脉冲信号。 正在开发其他算法以尝试检测这些其他类型的信号,但与往常一样,我们的算法仅与我们对它们所针对的信号所做的假设一样有效。”

对于 SETI 研究人员来说,机器学习是一种识别原始射频数据中的传输并对多种类型的信号进行分类的方法。 Brzycki 说,主要问题是天文学界没有 ET 信号数据集,这使得传统意义上的监督训练变得困难。 为此,Brzycki 和他的同事开发了一个名为 Setigen 的基于 Python 的开源库,以促进合成射电观测的产生。

Brzycki 说:“Setigen 所做的是促进合成 SETI 信号的产生,这些信号可用于完全合成数据,或添加到真实观测数据之上,以提供更真实的噪声和 RFI 背景。” “通过这种方式,我们可以生成大量合成信号数据集,以分析现有算法的敏感性或作为机器学习训练的基础!”

SKA 的合成图像结合了南非和澳大利亚的所有元素。 学分:SKAO

该库标准化了搜索算法分析的综合方法,特别是对于现有的无线电观测数据产品,例如 Breakthrough Listen 使用的那些。 “这些都有频谱图和复杂电压(时间序列)格式,因此拥有一种生成模拟数据的方法对于测试生产代码和开发新程序非常有用,”Brzycki 补充道。

目前,正在使用 Setigen 开发多波束观测算法以产生模拟信号。 随着 SETI 研究的进展,图书馆也在不断更新和改进。 Brzycki 和他的同事还希望增加对宽带信号合成的支持,以帮助针对非窄带信号的搜索算法。 随着下一代射电望远镜的投入使用,在不久的将来将有可能进行更强大的 SETI 调查。

这包括 Breakthrough Listen,它将整合来自 猫鼬 阵列在南非。 还有 平方公里阵列 (SKA),一个大型射电望远镜项目,将结合来自南非和澳大利亚天文台的数据。 其中包括 MeerKAT 和 再电离阵列的氢时代 (HERA) 在南非和 澳大利亚SKA探路者 (ASKAP)和 默奇森宽场阵列 (MWA) 在澳大利亚。

唉,SETI 仍然存在最大的限制因素,这是我们极其有限的参考框架。 归根结底,天文学家不知道外星信号会是什么样子,因为我们以前从未见过。 矛盾的是,这使得在宇宙的背景噪音中梳理出技术签名的证据变得更加困难。 因此,天文学家被迫采取“唾手可得”的方法,这意味着寻找我们所知道的技术活动。

艾伦望远镜阵列中的 42 个天线之一,用于搜索来自太空的信号。 图片来源:Seth Shostak / SETI 研究所。

然而,通过建立基于理论上可能的参数,科学家们可以缩小搜索范围并增加他们有一天会找到某些东西的几率。 正如 Brzycki 总结的:

“唯一可能的解决方案是某种无监督的机器学习调查,可以最大限度地减少我们的假设; 正在这方面开展工作。 Setigen 当然依赖于这个假设——一个人可以产生的合成信号本质上是启发式的,因为用户决定它们应该是什么样子。

“归根结底,该库提供了一种评估我们现有算法并创建潜在信号数据集以开发新搜索方法的方法,但是关于何时何地的基本问题将永远存在——我们能做的最好的事情就是保持正在寻找!”

在这种时候,提醒自己费米悖论只需要解决一次是件好事。 当我们在宇宙中检测到无线电传输的那一刻,我们将确定我们在宇宙中并不孤单,智能生命可以而且确实存在于地球之外,并且正在使用我们可以检测到的技术进行通信!

延伸阅读: arXiv