中国科研信息化蓝皮书2020
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

暗物质粒子探测卫星在轨数据处理的信息化应用

常进 藏京京 刘梁

中国科学院紫金山天文台

摘要

暗物质粒子探测卫星“悟空号”是我国首颗天文观测卫星。目前已在轨运行3年多,采集并处理了超过60亿个高能宇宙线粒子,获取了几百TB的各类科学数据。如此海量的天文观测数据,为高能宇宙线电子、质子及伽马射线的研究提供了可靠的数据保障。本文以“悟空号”卫星为例,首先介绍其科学数据处理软件DAMPESW的架构及特点,进而从数据处理的性能需求出发,说明目前已经完成的硬件基础设施建设情况,最后综述此类科学卫星在数据处理过程中的信息化应用,以期为后续同类卫星项目提供参考依据。

关键词

暗物质粒子探测卫星;在轨运行;宇宙射线;DAMPESW

Abstract

DAMPE is the first satellite-based observatory of China targeting on astronomical objects.During its on-orbit observation,over 6 billion of high energy cosmic rays (CRs) have been detected and analyzed,providing several hundred of terabyte (TB) of date for various scientific purposes.Such rich observations have largely benefited the research of electrons (positrons),protons and gammas within the high energy CRs.In this paper,we would take a deep insight into DAMPE.Firstly,the structure and features of its data processing software DAMPESW is introduced.Then constructions of DAMPE infrastructures is explained that are built on the demand of high data processing performance.Finally,in hope of providing reference for other similar projects in the future,we summarize the informationized application of data processing on DAMPE.

Keywords

DAMPE;On Orbit Operation;Cosmic Rays;DAMPESW

1 概述

1.1 卫星总体概述

暗物质粒子探测卫星(Dark Matter Particle Explorer,DAMPE)是一颗空间天基的高能宇宙线粒子探测卫星,总的来说,暗物质粒子探测卫星的科学目标如下。

(1)寻找暗物质粒子是本卫星项目的首要科学目标:通过在空间高分辨、宽能段观测高能电子和伽马射线寻找和研究暗物质粒子,间接测定或高精度限制其质量、湮灭截面或衰变寿命等重要物理参量,并限定暗物质粒子的空间分布,在暗物质研究这一前沿科学领域取得重大突破。

(2)通过观测TeV以上的高能电子及原子核在宇宙射线起源方面取得突破。

(3)通过观测高能伽马射线在伽马天文方面取得重要成果。

1.2 卫星有效载荷概述

为了实现以上科学目标,暗物质粒子探测卫星的有效载荷由4个探测器组成,如图1所示,上部是塑料闪烁体阵列探测器(以下简称塑闪阵列探测器)和硅阵列探测器,中部是BGO量能器,下部是以塑料闪烁体板为主要探测元件的中子探测器。

图1 暗物质粒子探测卫星塔状分布

1.塑闪阵列探测器

塑闪阵列探测器的主要科学任务是:确定入射粒子方向并区分伽马射线和电子鉴别入射高能重离子(Z=1~20)的种类。塑闪阵列探测器分系统有效探测面积为820mm×820mm,整个分系统由两层共82个XY方向相互垂直放置的塑闪单元模块组成,其中78个塑闪单元模块的尺寸为884mm×28mm×10mm,另外4个塑闪单元模块的尺寸为884mm×25mm×10mm。塑闪阵列探测器探测单元的两端采用光电倍增管将光信号转换为电信号再进一步处理。

2.硅阵列探测器

硅阵列探测器采用了高位置分辨的硅微条探测器,其主要科学任务是:测量入射粒子的方向,区分电子(带电粒子)和伽马(非带电粒子),同时也用于测量高能核素(Z=1~26)。硅阵列探测器由六大层硅微条探测器构成,每大层由XY两小层组成,每层实现空间上XY的定位。硅阵列探测器面积为80cm×80cm。硅阵列探测器配置要求放置三层钨板作为伽马光子的转换介质。为实现粒子电荷的区分,特别是区分伽马和电子,第一大层硅微条探测器顶部不布置钨板,而在第1/2层之间、第2/3层之间、第3/4层之间放置钨板。硅微条探测器输出的信号为电荷信号。

3.BGO量能器

BGO量能器为全吸收型电磁量能器,其主要科学任务是:测量宇宙线粒子,尤其是高能电子和伽马射线的能量(5GeV~10TeV),同时暗物质粒子探测器根据强子簇射和电磁簇射在量能器中的横向展开和纵向发展的不同,进行粒子鉴别,以剔除高能强子(主要是质子)本底。BGO量能器主要由308根BGO晶体构成,其探测面积约为60 cm×60 cm。BGO量能器共分为七大层,每大层由XY两小层构成,形成一个XY坐标的测量。每小层有22个探测器单元,每个探测单元(BGO晶体)大小为2.5 cm×2.5 cm×60 cm。BGO量能器探测单元的两端采用光电倍增管将光信号转换为电信号。

4.中子探测器

中子探测器是集中子慢化与探测于一体的探测器,其主要科学任务是:测量宇宙线中的强子(主要为质子)与中子探测器上方的物质发生作用产生的次级中子,根据这些中子在探测器内的能量沉积,可以判断入射粒子的类型,配合BGO量能器来进一步区分质子和电子。中子探测器采用厚度为1cm的掺硼(B)的塑闪阵列探测器(Saint Gobain公司生产的BC454)。中子探测器采用693cm×693cm×1cm的掺硼(B)塑料闪烁体板作为有效探测介质。探测器中,塑料闪烁体板被分割成4个独立的正方形,装配在探测器的4个象限。每个象限中,切除塑料闪烁体板的一个角,并在角上耦合一个光电倍增管(PMT),用于读出闪烁光信号。

在卫星运行期间,有效载荷有标定与观测两种运行模式。按照暗物质粒子探测器的设计,探测器的标定模式主要分为3种工作设置:探测器基线的标定、电子学的线性标定、探测器的能量定标(MIPs)。观测模式的目的是测试高能电子、伽马射线、核素等宇宙线粒子。观测模式需要利用不同的触发设置来选择所需测量的宇宙线粒子,尽可能地排除本底事例(主要是质子)。探测器在整个飞行过程中一直重复着以下过程:标定→优化参数(高压、触发延迟、触发阈值等)→飞行观测→标定。

1.3 卫星在轨运行概述

目前,卫星的在轨运行任务由中国科学院国家空间科学中心的地面支撑系统和中国科学院紫金山天文台的科学应用系统及卫星测控的相关单位共同完成。自2015年12月20日接收到第一帧科学数据至2019年8月5日,DAMPE累计接收数据20208轨,在轨飞行1324天,完成了全天区的第7遍扫描,共探测并处理了约66.7亿个高能粒子,处理生成了1B级数据19.92TB,1F级数据12.53TB,2A级数据112.43TB。DAMPE数据获取累计如图2所示,DAMPE数据获取每天事例率分布如图3所示。在4年多的在轨运行中,卫星出现过载荷数管复位、数管的Flash存储坏块(簇)、高压供电机箱单粒子效应等问题,均得到了妥善处置。与刚发射时相比,载荷共7万

多路电子学通道中未出现新坏道,探测器整体仍保持在100分的状态,充分体现出卫星平台及有效载荷在设计上具有十分优秀的可靠性。

图2 DAMPE数据获取累计

图3 DAMPE数据获取每天事例率分布

当前,卫星最重要的任务是持续积累大统计量的原始数据并提供给科学团队研究,以取得更重大的科学成果。

1.4 国内外研究现状

国际上,在轨运行的宇宙线粒子探测卫星主要有费米伽马射线太空望远镜(Fermi-LAT)、国际空间站的阿尔法磁谱仪(AMS02)和量能器型电子望远镜(CALET)等,所有此类科学卫星项目均针对各自卫星的特点与科学目标的不同开发了一整套复杂的科学数据分析软件[1]。例如,Ferimi-LAT针对科学数据开发了FermiTools软件(https://github.com/fermi-lat/Fermitools-conda/),并根据新需求持续保持更新,如今已更新至v11r5p3。AMS02也开发了自己的离线分析软件AMSsoft,由于AMS实验软件没有公开发布,目前尚不知道其版本更新情况。因此,开发一套针对DAMPE卫星的科学数据处理软件是科学目标实现的重要保障。

1.5 DAMPESW先进性

根据国际上类似卫星数据分析的经验,科学数据处理软件(DAMPE Software)引入Kernel、Algorithm、Service、Event的概念,它不仅实现了数据处理的基本功能,更重要的意义在于其为众多的科学家用户提供统一的数据分析平台,用户之间协同开发,互不干扰,使得科学数据分析软件的持续更新成为可能。

DAMPESW利用C++进行软件核心与主体部分的开发,利用Boost.Python链接C++和Python,使得两种不同的编程语言可以相互识别,利用Python语言对用户算法进行自由配置使其协同运行,利用Bash脚本语言实现软件运行环境的配置。

DAMPESW集合了C++、Python、Bash 3种编程语言,完美融合了粒子物理数据分析常用软件ROOT,使新用户可以方便、快速地进行科学数据的分析。

DAMPE将彻底统一暗物质粒子探测卫星的物理数据分析方式,促进物理分析技术的相互交流,方便不同人员的相互检查,对物理结果的产出及结果的可靠性提供最原初的保障。同时,该方案的实现有望提高物理结果的产出效率。

2 科学数据处理

2.1 DAMPE科学应用系统

在工程上,DAMPE的运行取数及科学数据的处理由科学应用系统负责完成。

科学应用系统负责暗物质粒子探测卫星工程科学观测计划的制订、有效载荷运行情况的检测、高级数据产品的生成、有效载荷的标定及科学研究的组织。

为了保证科学目标的实现,顺利完成科学应用系统的总体任务,在对科学应用系统功能和流程进行分析的基础上,将科学应用系统分为科学运行、科学数据管理与用户和高级数据产品处理3个分系统。其中,科学运行分系统主要负责建立有效的卫星运行管理机制,制订有效载荷的短期和中长期探测计划,监视载荷运行状态;确定卫星上行参数。科学数据管理与用户分系统负责确保数据接收完整、数据转换、数据分类,海量数据存储、调用和长期保存,完成科学数据时间统一、数据存档、备份和发布,组织进行科学研究等工作。高级数据产品处理分系统负责完成高级数据产品生成、本底分析、粒子鉴别、建立数据库等工作。

3个分系统的内部接口关系以及与地面支撑系统的接口关系如图4所示。

图4 3个分系统的内部接口关系以及与地面支撑系统的接口关系

2.2 科学数据处理软件DAMPESW

2.2.1 DAMPE科学数据面临的挑战

暗物质粒子探测卫星是一个多功能、多组件的高能粒子探测器,由4个子探测器组成,每个子探测器系统均包括大量的探测灵敏单元。每个探测单元都记录了同一个入射粒子在探测器中各种相互作用的信息,科学数据中一个入射粒子在所有探测单元中读出信息的集合组成了数据层面上的一个事例(Event)。用户数据分析的过程就是结合这些读出信息,利用合理的计算方法逐个挑选出用户感兴趣的事例的过程。这种循环所有事例,依次对粒子信息进行同一操作的方法称为算法(Algorithm)。入射粒子某一物理属性的获得通常需要多个算法来实现,在数据处理的不同阶段同样需要根据分析的深入和细化而创建不同的算法。这样为了实现同一个目标,需要将不同算法按照特定的顺序串接,算法与算法之间往往需要数据的交互。例如,粒子的径迹主要由硅微条探测器中的Cluster经过卡尔曼滤波获得,而卡尔曼滤波需要BGO重建的簇射轴作为径迹的种子,要计算簇射轴需要首先得到每层BGO晶体中的簇射重心,簇射重心的计算又需要首先计算每根晶体的能量。如此,各种不同的算法串接才可以重建粒子的径迹。

物理算法负责对事例的处理,其由大量科学家团队的成员按不同需求开发。在数据处理分析过程中,通常需要各种功能来辅助算法的运行,这类功能可能需要被同算法所公用。这种辅助算法运行的功能模块称为服务(Service),如每种算法都需要读入数据和输出保存数据的功能,这一功能只负责程序对文件的输入/输出操作(I/O服务)。服务与算法唯一的区别在于,服务不分析、处理事例数据的具体值。服务为算法提供支持,减小算法开发的压力。

DAMPESW就是为了适应这个要求而设计研发的,其具有如下功能。

1.提供了统一的开发平台

首先,DAMPESW的内核为开发人员提供了接口(一些虚函数)。开发人员只需要集中精力完成这些函数的具体功能,软件的驱动顺序、管理及数据交流、存储等问题由内核负责。

其次,所有的数据分析人员都在同一个软件框架下工作,既可以享受别人的成果,也可以分享自己的成果,便于软件开发的分工与合作。

2.提供了统一的运行机制

任何一种算法的执行都通过定制一个Python脚本(一个文本文件)来控制流程。用户将所需的算法、服务加载到内核之后,软件便会按如下逻辑执行。

Step 0:配置作业(制定算法、输入文件和输出文件等)。

Step 1:初始化(DmpCore::Initialize(),如定制柱状图,对变量赋初始值等)。

Step 2:执行(DmpCore::Run(),对所有事例做循环)。

Step 3:清理及退出工作(DmpCore::Finalize(),如向文件中写数据)。

3.有灵活的可扩展性

用户可以根据具体的需要创建自己的算法(Algorithm)、数据类(Event Class)和服务(Service)。

2.2.2 DAMPESW组成

DAMPESW由5个主功能模块和5个驱动辅助模块组成。5个主功能模块为:原始数据格式转化(RawDataConversion)、物理事例重建(Reconstruction)、刻度(Calibration)、物理模拟(Simulation)和物理事例显示(Visualization)。5个驱动辅助模块为:内核(Kernel)、用户分析(Analysis)、事例类(Event)、轨道模拟(EventOrbitSimulation与OrbitSimulation)、探测器几何(Geometry),如图5所示。

图5 DAMPSW软件系统架构

DAMPESW主功能模块的功能如下:

原始数据格式转化模块——负责将二级制的原始数据转化为可以被ROOT识别的TTree格式数据,即将1A/1B级科学数据产品转化为1E/1F级数据产品。

物理事例重建模块——通过复杂的标定算法,将1E/1F级数据产品中电子学读出通道数值转化为具有物理意义的物理对象(能量、方向、粒子种类等),即将1E/1F级数据产品转化为2Q/2A级数据产品。

刻度模块——负责分析1E/1F级数据产品中的刻度数据,生成标定系数。

物理模拟模块——主要用于模拟在太空辐射环境下粒子进入探测器后,探测器各个探测灵敏单元的响应。

物理事例显示模块——读入2Q/2A级科学数据产品,将探测器各单元能量直观地显示在探测器3D几何模型中,以颜色表征能量大小。

DAMPESW驱动辅助模块的功能如下:

内核模块——为DAMPESW的核心,负责所有软件模块的运行驱动,为所有软件模块提供统一I/O格式以及模块与模块之间的数据交互机制,为服务和算法的拓展提供基类。

用户分析模块——为科学家用户个人算法集成模块。

事例类模块——为物理事例数据格式定义模块。

轨道模拟模块——为卫星轨道环境模拟模块。

探测器几何模块——为探测器几何尺寸参数数据存储模块。

2.2.3 DAMPESW控制流程

软件控制流程如图 6所示。运行软件首先需要对程序进行服务和算法等的设置,之后程序内核初始化,并先后引发服务和算法的初始化。在服务和算法初始化完毕后,程序内核启动事例处理过程。首先启动算法分析处理一个事例,完毕后做判断,如果处理成功,则将这个事例保存,再向下执行;如果不成功,则直接向下执行而不保存这个事例。接下来再做一次判断,如果发现已经处理完毕全部事例或者达到了手动终止条件,则事例处理过程终止,进入下一阶段,否则程序返回算法处理事例之前的阶段,让算法准备处理下一个事例,进入循环。如果事例处理过程结束,则程序内核将终止,并先后让算法和服务终止,并且在服务终止的时候会将数据写到硬盘之中。当全部算法和服务都成功终止后,程序内核释放内存,软件运行结束,退出软件。

2.2.4 DAMPESW版本控制

DAMPESW采用自主研发的形式。作为对科学数据进行分析的软件,参与开发人员多,软件版本更新多,从实际需要上分析不适合采用工程化管理模式,但为了保证软件开发质量及进度,我们也采取了一系列措施。首先,软件开发采用国际合作组的形式,每周召开视频讨论会,分配开发任务,讨论开发进展,安排开发进度;其次,在系统建设依托单位紫金山天文台的计算机平台上搭建了DAMPESW的SVN版本控制库,如图7所示,合作组中国内外所有软件开发人员的开发代码都提交到这个版本控制库中,SVN会自动管理其中所有代码的版本更新信息,解决软件版本控制问题,保障软件开发质量。

图6 软件控制流程

图7 DAMPESW发布软件的SVN版本控制库

2.3 卫星数据处理流程

卫星数据处理流程如图8所示。

图8 卫星数据处理流程

DAMPESW接收到数据处理指令之后,在原始数据格式转化模块读入指令参数中1A/1B级科学数据产品文件,对数据进行解包校验,去除FITS包头与包尾,分离出数据包中观测科学数据、基线标定数据、电子学线性刻度(DAC)数据、MIPs标定数据与基线更新数据,并将全部数据转化为ROOT软件可以识别的TTree格式数据(1E/1F级科学数据)。对于观测科学数据包则调用物理事例重建模块,将TTree格式的科学数据重建为物理对象;对于其他数据则调用刻度模块,经过一系列复杂的刻度运算转化为标定系数文件。

2.3.1 原始数据格式转化流程

原始数据格式转化流程如图9所示,首先读入1A/1B级科学数据,剔除FITs格式的包头和包尾,进行数据的分割,将一个事例的数据包分别读出BGO、PSD、STK、NUD、TRG的数据缓存,判读STK的事例是否完整,如果事例完整则将事例填入TTree中,如果事例不完整则继续读入下一个事例。在事例填入TTree后,判读文件是否结束,不结束则继续读入下一个事例,结束则保存文件退出。

2.3.2 物理事例重建流程

重建过程的输入是以ROOT格式存储的1E/1F级数据。重建过程利用标定参数,将观测信号转化为物理信号。其具体流程如图10所示。

首先进行电子学线性刻度修正,然后扣除电子学基线,继而选择合适的打拿极读出级次,通过打拿极比率的转换,单个探测单元的测量值被转化成对应第八打拿极的ADC道数,最后通过MIP峰值的归一化得到能量值。在单个探测单元能量重建完成的基础上,进行高级能量、角度、电荷重建。

图9 原始数据格式转化流程

图10 物理事例重建流程

2.3.3 刻度流程

量能器是一种使入射粒子在其中发生相互作用,吸收其能量的装置。入射粒子的部分能量以可记录的信号的方式释放。观测到的信号与入射粒子能量之间的转换因子是理解量能器性能的极其重要的一个方面。取得相关转换因子的过程即是标定。标定主要分为基线标定、MIPs标定、打拿极相对系数标定和电子学线性标定。以上4种标定的输入均为ROOT格式的1E/1F级数据产品,输出为标定参数。

1)基线标定

电子学前端芯片无信号输入时,输出端测得的ADC道数值。其值服从正态分布,分布的均值和方差即为标定参数。

2)MIPs标定

探测器工作在MIPs采样模式下,触发设置为MIPs模式。探测器取得MIPs响应ADC谱,使用高斯卷积朗道函数拟合该谱,所得最可几峰位和宽度即为标定参数。

3)打拿极相对系数标定

探测器信号由光电倍增管的第2、5、8打拿极输出,经过电子学处理后得到的ADC道值满足线性关系。用线性函数拟合,拟合所得斜率和截距即为标定参数。

4)电子学线性标定

地面发出的输入指令经DA变换后,转化为模拟信号作为电子学前端输入。输出端测得的ADC道数与输入模拟信号幅度存在近似线性关系。对这种线性关系的偏离反映了电子学的非线性。使用二次幂函数拟合输入-输出曲线,拟合所得各阶系数即为标定参数。

2.3.4 模拟数据产生流程

物理模拟的过程就是用计算机计算探测器在不同环境下,与入射粒子发生相互作用产生信号的过程。物理模拟的目标是产生与卫星数据完全相同的模拟数据,使DAMPESW能够以与卫星数据完全相同的处理方法来分析模拟数据。

模拟数据产生流程如图11所示。

图11 模拟数据产生流程

DAMPESW中Geometry、Simulation、OrbitSimulation、EventOrbitSimulation模块负责模拟数据的产生。

Simulation模块集成了物理模拟和电子学模拟。对于BGO、PSD和NUD 3个子探测器(STK子探测器的电子学模拟将在下面单独介绍),物理模拟和电子学模拟是同步进行的,即在模拟粒子与物质相互作用产生能量沉积的同时,根据电子学响应函数把能量沉积转化为电子学的ADC道数。Simulation模块产生的ROOT数据(以下称为DmpSimu)与2级数据格式完全相同。

卫星轨道环境模拟分两个步骤来实现:①OrbitSimulation部分根据卫星的星历表计算卫星的轨道;②读取卫星所在位置的磁场分布,产生ROOT数据文件(OrbitSimu)。

图12是卫星高度(500km)处地磁场的绝对值和横向地磁截断的分布。图13是卫星1天内的轨道和所经历的地磁场强度。

图12 卫星高度(500km)处地磁场的绝对值和横向地磁截断的分布

EventOrbitSimulation模块以DmpSimu和OrbitSimu为输入文件,使用“向后追踪法”判断入射粒子是否来自外太空,并且赋予每个来自外太空的粒子一个时间,产生新的ROOT文件(EventOrbitSimu)。该文件可用于估计卫星在任意一个位置的事例率和各种观测模式的触发率。所谓“向后追踪法”就是把入射粒子的电荷极性取反,并把粒子运动的方向反转,此时粒子在地磁场中将沿着入射的路径反向运行,数值求解粒子在磁场中的运动方程,判断粒子在太空中的位置。来自外太空的粒子是实际需要的粒子,在统计事例率时要考虑,来自地球的粒子不参与统计。

下面介绍STK子探测器的电子学模拟。由于STK子探测器的工作方式与BGO、PSD和NUD不同,STK的电子学模拟需要单独考虑。首先,通过物理模拟把每个事例在硅微条上的能量沉积记录下来。一个事例结束后首先根据有能量沉积的硅微条的编号判断它是读出条还是悬浮条。其次,按照一定的比例把能量重新分配给周围相邻的读出条,计算出该能量所能产生的电子-空穴对的数目。最后,根据监测硅微条的VA芯片的响应曲线(见图14)把能量转化为ADC读数。

图13 卫星1天内的轨道和所经历的地磁场强度

图14 VA芯片的响应曲线

2.4 DAMPESW工作流程

高级数据产品处理分系统处理1A/1B数据,生成1E/1F和2A/2Q高级科学数据产品的整个工作流程都是在数据处理服务器上完成的。具体的数据处理算法通过一系列Python脚本来驱动运行,所以整个数据处理的工作流程就是连续调用相应的Python脚本,其工作流程如图15所示。

图15 高级数据产品处理分系统工作流程

(1)FITS文件转换。将需要处理的1A/1B数据文件名作为运行参数,运行JobOpt_Fits2Frd.py脚本,读取数据的FITs头信息,并将数据转换为frd格式的数据文件保存在临时目录中。

(2)RawDataSplit。由于一个遥测源包的数据文件包含了多种观测模式的数据,不同观测模式下的数据需要不同的数据处理过程,根据触发逻辑和采样频率将上一步转换好的frd文件拆分成各个时间段内单一观测模式的文件,并以相应的科学数据包标识(OBS:观测科学数据包;PED:基线标定科学数据包;DAC:电子学线性标定科学数据包;MIP:MIPs标定科学数据包)命名文件。

(3)RDC。对每种观测模式的遥测源包解码转换,生成1E/1F级科学数据文件。运行过程中,首先要对源数据包进行CRC校验、长度校验、包序列号连续校验、包触发号连续校验等,将包的错误信息以.err后缀名形式的同名文件保存在相同目录下。其次将每个事例的触发数据包和各子探测器的数据包读出并写入相应的数据类中,保存为按照命名规范规定的文件名格式的ROOT文件。最后自动将生产数据过程中的关键信息保存在高级数据产品描述文件中,以备科学数据管理与用户分系统解析入库。

(4)刻度。对各标定数据文件(MIP、DAC、PED)经过一系列复杂运算,得出此次标定的标定系数并以指定格式保存在相应目录下。

(5)物理事例重建。对于RDC后的观测数据,还需重建所有事例和进行后续的科学分析,对于上一步生成科学数据包标识为OBS的1E/1F数据文件,加载最近一次的标定系数,重建粒子事例在探测器每个单元的能量和径迹。以数据类保存为ROOT文件,并按2Q/2A的命名格式规范保存在服务器相应的目录内。将生产数据过程中的关键信息保存在2Q/2A高级数据产品描述文件中,以备科学数据管理与用户分系统解析入库。

以上工作流程通过shell脚本自动控制执行,包括系统运行需要的环境变量的加载,按照各级文件的命名规范生成文件名,各临时文件和标定系数文件的存储目录,数据观测模式的自动判别,以及输出运行过程中的错误信息等。只需在数据处理服务器上运行shell脚本,输入相应的参数,便可自动执行上述所有工作流程。

3 硬件组成与网络结构

为满足卫星科学数据的处理,DAMPE科学应用系统建设了卫星科学数据处理平台。该平台分为计算区、主存储区、热数据存储区、用户数据存储区、数据库区、数据备份区、数据交互与网络安全区、监控大厅区,如图16所示。其中,计算区采用128台高密度刀片服务器,具有3000余个CPU核心的计算资源;主存储区采用EMC X410高性能并行存储,共7个存储节点,存储容量为450TB,最高数据吞吐量可达40Gbps,存储卫星相关的全部科学数据产品;热数据存储区采用全闪存存储,存储用户访问频繁的2A级科学数据产品,存储容量为175TB;用户数据存储区采用大容量磁盘阵列存储器,存储用户在数据分析过程中产生的个人中间数据,存储容量为130TB;数据备份区与用户数据存储区类似,采用大容量磁盘阵列存储,用于原始数据、高级数据、模拟仿真数据的备份,存储容量为200TB。数据交互与网络安全区通过100Mbps的VPN专网与怀柔空间中心连接,同时通过100Mbps的科技网带宽与欧洲合作单位连接。同时,有防火墙、WAF、网闸等网络安全设备,保证网络安全与内外网隔离。监控大厅由一系列运控终端组成,负责科学数据处理业务的运行与监控。

图16 暗物质卫星科学数据处理平台业务分布

4 总结与展望

暗物质粒子探测卫星是我国首科天文观测卫星。卫星科学数据的处理在国内尚无先例可循。国际上,同类科学卫星底层原始科学数据的处理方案均未公开,同时由于科学任务及探测器结构的不同,其他卫星的科学数据软件也很难直接应用于暗物质粒子探测卫星科学数据的处理。因此,本文从软件需求出发,详细介绍了暗物质粒子探测卫星科学数据处理流程、方法、软件设计、硬件组成等,以期为我国后续同类科学卫星提供技术参考。

作者简介

常进,1966年7月生,1992年6月毕业于中国科学技术大学并获得硕士学位,2006年7月获博士学位。现任紫金山天文台台长、国家天文台副台长(兼)、中国科学院暗物质与空间天文重点实验室主任、中国科学技术大学天文与空间科学学院院长、紫金山天文台暗物质和空间天文研究部主任。2019年当选为中国科学院院士。

常进长期从事空间伽马射线、高能带电粒子尤其是电子的探测技术方法及科学实验研究,是中国空间天文学领域的主要学术带头人之一。常进创新发展了一种高能宇宙线电子探测的新技术方法,并成功应用于美国南极长周期气球探测ATIC实验。基于该技术方法,常进提出并作为首席科学家领导实施了“悟空号”暗物质粒子探测卫星(中国科学院战略性先导科技专项——空间科学专项的首发星)项目。“悟空号”于2015年12月17日成功发射,实现了中国天文卫星零的突破,一些关键性能指标世界领先,已在电子宇宙线与质子宇宙线的能谱测量方面取得突破性进展。常进还率领团队积极服务于国家重大战略需求,先后为神舟二号、嫦娥一号、嫦娥二号等成功研制了伽马射线谱仪,先后荣获2004年国家科技进步二等奖(第4完成人)、2012年国家自然科学二等奖(独立完成人)、2012年国家科技进步特等奖(第40完成人)、2017年全国创新争先奖、2018年何梁何利科学与技术进步奖(天文学奖)、2018年中国天文学会张钰哲奖、2018年中国科学院杰出科技成就奖、2018年中国科学十大进展、2019年(首届)中国空间科学学会科技奖等奖励。


[1] http://fermi.gsfc.nasa.gov/ssc/data/analysis/software/.