大海捞针!“中国天眼”搜索脉冲星到底有多难呢?

随着昔日“射电之王”阿雷西博射电望远镜的坍塌,全世界只剩下一只射向宇宙的“大眼睛”——“中国天眼”500米口径球面射电望远镜FAST。

作为世界最大单口径的射电望远镜,FAST自2016年竣工以来,就表现出“极强的灵敏度”,截至目前,基于FAST数据发现的脉冲星超过240颗,在同一时间段位居世界第一。

鲜为人知的是,这些脉冲星发现的历程,如大海捞针一般困难。中科院国家天文台FAST工程总工程师姜鹏给出这样一组数据:FAST在2018年观测时,峰值数据率每秒就可以达到38G。其产生的海量数据,给FAST团队带来了巨大挑战。

1月8日,全球范围内规模最大、参与人数最多的大学生超算赛事——2020-2021 ASC世界大学生超算竞赛初赛结束,来自全球各大高校的参赛队伍在过去两个月的时间内,所做的就是利用超级计算机向FAST的海量数据发起“进攻”,完成了一项尖端科学的挑战——脉冲星搜索。

中国科学院国家天文台博士牛佳瑞说,脉冲星是近现代天文学、物理学领域的前沿研究课题。诺贝尔物理学奖曾两度授予脉冲星相关发现,而近两年关于引力波发现、黑洞证实等荣获诺贝尔物理学奖的重大突破,也与脉冲星研究有着直接或间接的关系。脉冲星的研究,因此备受瞩目。

脉冲星搜索,是开启脉冲星研究的第一步。据牛佳瑞介绍,目前人类已经发现3000余颗脉冲星,但这仅仅是全部脉冲星的一小部分。脉冲星遥远而致密,人们无法像夜晚看星星那样看到脉冲星,需要借助天文望远镜。而天文望远镜探测脉冲星,本质上是探测脉冲星发出的辐射信号。

牛佳瑞说,脉冲星搜索非常困难,背后有两大原因:一是在地球和周围的环境中,存在大量的射频干扰,这些干扰比脉冲星信号强得多,如何识别消除它们是脉冲星搜寻的大问题;二是观测数据量庞大,FAST观测脉冲星每秒会产生3GB数据,月数据量达到了PB量级,这样大量的数据既难于处理,又难以储存。为了能够及时分析FAST产生的庞大数据,科学家需要使用性能强大的超级计算机对观测数据进行处理。

此外,软件的优化也尤为必要。脉冲星搜索开源软件PRESTO,就是当前科学家主要使用的核心工具软件之一,其主要设计目的是从对球状星团的长距离观测中,有效地搜索毫秒脉冲星。据统计,在过去的几十年里,利用望远镜发现的3000多颗脉冲星中,有700多颗是借助PRESTO发现的。

在ASC20-21初赛中,年轻大学生要做的,就是在功耗3000瓦约束的超算平台上,从FAST真实的观测数据中,准确寻找到脉冲星候选体,并且要对PRESTO运行过程进行分析和优化,尽可能地降低计算时间和所需资源。

“这将是对大学生从理论到实践的全方位挑战。”牛佳瑞说,一方面,PRESTO赛题的比赛数据全部来自FAST真实的天文观测数据,这将让大学生们接触到现实中脉冲星研究的科研数据与软件算法;另一方面,如果这些学生想在PRESTO赛题中取得好成绩,就必须要深入学习和了解脉冲星搜索的相关知识,这将有助于大学生拓展天文学理论知识,激励他们探索宇宙奥秘。

事实上,近年来的超算应用,越来越需要复合型的人才,这正是ASC大赛的初衷——培养新一代超算人才。以利用FAST数据搜索脉冲星为例,年轻的大学生既要懂天文学的专业知识,也要理解计算机程序的应用原理,这样才能明确科研需求的种种计算难点,从而让应用程序贴合科研目标。

来自中科院国家天文台的最新消息显示,“中国天眼FAST将于2021年4月1日正式对全球科学界开放。”5月8日-12日,ASC20-21总决赛将在位于深圳的南方科技大学举行,经初赛选拔的20强将展开比拼,而脉冲星搜索这项挑战也将继续出现在决赛中,难度进一步升级。

那时,FAST有望收获更多的海量数据,而中国人能否从中更快更精准地搜索到脉冲星,乃至更有科学价值的物质或现象,就要看我们能否培养出足够多既掌握超算手段、又拥有探索宇宙热情的年轻人。