中国科研信息化蓝皮书2020
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

我国高性能计算进展及国际高性能计算发展趋势

陈左宁

中国工程院

摘要

高性能计算发展水平体现了一个国家的科技综合实力,是国家创新体系的重要组成部分。我国通过部署多种国家级科技项目和资助计划来推动高性能计算发展,逐步形成了具有一定规模的国家级高性能计算服务环境。本文基于近两年国际TOP500来分析我国高性能计算最新进展;审视我国高性能计算研发的主要不足;阐释“神威·太湖之光”高性能计算机系统的技术突破与应用;探讨国际百亿亿次(E级)计算机研发热潮;最后,预测高性能计算技术未来发展趋势。

关键词

高性能计算;“神威·太湖之光”计算机;“戈登·贝尔奖”;百亿亿次计算

Abstract

The development of high-performance computing reflects the comprehensive strength of science and technology in a country,and is an important part of the national innovation system.China has promoted the development of high-performance computing by deploying a variety of national science and technology projects and funding plans,and gradually formed a national high-performance computing service environment with a certain scale.Based on the international TOP500 in the past two years,this paper analyzes the latest progress of high performance computing in China;reviews the main shortcomings of HPC R&D in China;explains the technological breakthrough and application of Sunway TaihuLight supercomputer;and discusses the R&D upsurge of exascale computers in the world.Finally,it predicts the future development trend of high-performance computing technologies.

Keywords

High-Performance Computing;Sunway TaihuLight Computer;Gordon Bell Prize;Exascale Computing

1 引言

高性能计算机(High Performance Computer,HPC)位于计算系统的金字塔顶端,是国家战略高科技技术,是解决国家安全、经济建设、社会发展等一系列重大挑战性问题的重要手段,被誉为引领科技创新发展的“国之重器”,已成为信息时代世界高科技竞争和大国博弈的技术主战场。

多年来,我国通过部署多种国家级科技项目和资助计划来推动高性能计算发展,成功研制出多台尖端高性能计算机,逐步形成了具有一定规模的国家级高性能计算服务环境。例如,国家“863计划”支持的“神威”“天河”“曙光”等系列高性能计算机迈入了世界领先行列[1]

伴随着大数据与人工智能(Artificial Intelligence,AI)时代的到来,各行业、各领域对计算能力提出了新的需求,牵引高性能计算技术持续向前发展。美国、日本、欧洲等发达国家和地区都已制定了在2021年左右实现百亿亿次(Exascale,E级)计算能力的发展计划,相关研发工作也已启动,国际高性能计算机正在进入新的发展阶段。

2 我国高性能计算最新发展

我国在高性能计算机研制上坚持走中国特色自主创新之路,经过长期努力,在体系结构、系统软件、核心芯片及应用软件等方面取得了长足进步。近年来,我国先后研制部署了具有世界领先水平的“天河二号”和“神威·太湖之光”高性能计算机,标志着我国高性能计算事业进入了快速发展时期。

2.1 从近期TOP500看我国HPC成就

每年发布两次的国际高性能计算机500强排行榜(TOP500)从多个方面反映了全球高性能计算机的最高水平和总体发展态势[2]。通过分析近两年的TOP500,可以看出我国高性能计算最新发展状况。

1.中国顶尖系统跨入世界领先行列

中国国家并行计算机工程技术研究中心研制的“神威·太湖之光”高性能计算机自2016年投入运行后,以93.01Pflops的Linpack测试性能连续四次排名TOP500第一,并引领全球高性能计算迈入十亿亿次时代。直到2018年6月,美国IBM公司研制的“顶点”(Summit)以122.3Pflops的测试性能获得TOP500冠军。表1列出了2017年6月、2018年6月和2019年6月三次TOP500的前五台最快高性能计算机。由此可见,我国研制的顶尖高性能计算机系统已跨入世界领先行列。

表1 2017年6月、2018年6月和2019年6月三次TOP500的前五台最快高性能计算机(性能:峰值/实测)

2.中国高性能计算机保有量世界第一

TOP500机器保有量(装机台数)可反映一个国家高性能计算机系统的使用广度。长期以来,美国的TOP500计算机安装使用量一直稳居世界第一。2017年6月,中国高性能计算机保有量以160台逼近美国的169台,随后就大幅度攀升并超越了美国,居世界各国之首。这表明我国在创新战略驱动下各行业对高性能计算能力的需求旺盛,投入加大。表2列出了2017年6月、2018年6月和2019年6月三次TOP500高性能计算机保有量排名前五的国家。

表2 2017年6月、2018年6月和2019年6月三次TOP500高性能计算机保有量排名前五的国家

3.中国高性能计算机研制厂商实力强劲

长期以来,美国IBM、Cray、HP等公司在高性能计算机生产制造领域一直处于垄断地位,但是近年来我国除在顶尖系统上不断取得突破外,联想、浪潮、曙光等制造的高性能计算机数量迅猛增加。2018年6月,联想首次超越HP成为TOP500中研制机器台数最多的公司;2019年6月,联想、浪潮和曙光位列国际高性能计算机制造商前三名。在最新的TOP500中,中国公司制造的高性能计算机总数达320台,占比为64%。表3显示了2017年6月、2018年6月和2019年6月三次TOP500研制机器台数排名前五的厂商。

表3 2017年6月、2018年6月和2019年6月三次TOP500研制机器台数排名前五的厂商

2.2 我国高性能计算发展存在的主要不足

尽管我国高性能计算机近年来发展很快、进步很大,但是从更深层次考虑,我国高性能计算机研发与应用仍存在一些短板和不足之处。

第一,我国高端芯片制造的工业基础较薄弱,部分核心工艺、器件和设备仍然受制于人。目前,我国研制的绝大多数高性能计算机都采用国外进口芯片制造,因此美国禁运高端芯片会对我国未来高性能计算机研制造成一定影响,特别是在研制周期和研发成本上影响较大。另外,我国自主设计的高端处理器芯片,在国内尚无法制造,还不掌握相关的先进工艺技术。

第二,在关键核心技术方面集成创新多、原始创新少。主要原因是我国在高性能计算机的基础研究与教育上落后于美国、日本等发达国家,体系结构、并行算法、高性能计算等相关专业教学水平不高,缺乏创新型人才,从而导致我国在高性能计算核心技术方面原始创新能力不强。虽然中国高性能计算机在TOP500中数量遥遥领先,但进入TOP100、TOP50的机器并不多,尚未形成质量上的优势。

第三,在引领高性能计算机发展的计算科学方面仍然滞后。计算科学涉及众多应用领域,针对应用模型和物理模型,研究建立数学模型和算法模型以形成相应的算法,之后才能利用高性能计算机来解决现实复杂问题。尽管我国TOP500计算机保有量已超越美国,依托“神威·太湖之光”也已获得两次“戈登·贝尔奖”,但在更广泛的应用建模、算法等方面,我国与美国、日本、欧洲还存在较大差距,影响了我国高性能计算机整体应用深度。

第四,高性能计算软件和生态发展相对落后。与美国、日本等国软、硬件几十年相对平衡的发展和积累不同,我国高性能计算软件的发展落后于硬件发展,尚未建立较为成熟的软件生态环境。作为连接硬件和拥护的桥梁,高性能计算软件和生态发展的滞后,成为限制我国高性能计算机应用的重要因素,也是亟待解决的重要问题,需要加大面向自主研发芯片体系结构特点的并行中间件软件的研发力度,建立完善的国产高性能计算机软件生态。

3 “神威·太湖之光”的技术突破与应用

“神威·太湖之光”高性能计算机由国家“863计划”支持,国家并行计算机工程技术研究中心承研,部署于国家超级计算无锡中心。“神威·太湖之光”是世界上首台峰值速度超过十亿亿次的高性能计算机,是我国第一台全部采用国产处理器构建且排名世界第一的高性能计算机[3]

3.1 系统概述

“神威·太湖之光”是一台超大规模并行处理计算机,采用基于高密度弹性超节点和高流量复合网络架构、面向多目标优化的高效能体系结构。该机器由高速计算系统、辅助计算系统、高速计算互连网络、辅助计算互连网络、高速计算存储系统、辅助计算存储系统和相应的软件系统等组成(见图1)。高速计算系统和辅助计算系统通过云管理环境进行统一管理,为用户提供统一的系统视图。

图1 “神威·太湖之光”计算机总体架构图

“神威·太湖之光”采用的“申威26010”异构众核处理器由上海高性能集成电路设计中心通过自主技术研制,采用64位自主申威指令集,全芯片260个核心,芯片标准工作频率为1.5GHz,峰值运算速度为3.168Tflops。

“神威·太湖之光”的高速计算系统峰值速度为125.44Pflops,内存总容量为1024TB,访存总带宽为4473.16TB/s,高速互连网络对分带宽为70TB/s,I/O聚合带宽为341GB/s,Linpack测试速度为93.015Pflops,系统总功耗为15.37MW,性能功耗比为6.05Gflops/W;辅助计算系统峰值运算速度为1.09Pflops,内存总容量为154.5TB;磁盘总容量为20PB。

3.2 主要技术突破

1.首次全部采用国产处理器构建世界顶尖高性能计算机

基于国产处理器采用自主研发的高效可扩展体系结构,设计并实现了高密度运算紧耦合弹性超节点结构,超节点内实现256个CPU无电缆全交叉互连,超节点间通过资源池热备份技术实现了全系统规模下的超节点弹性可扩展,支持大规模运算核心的高效并行运行,可适应计算密集、通信密集和I/O密集型课题需求。提出了一种由超节点网络、共享资源网络和中央交换网络组成的高流量可扩展复合网络结构,实现了全机40960个运算节点和240个I/O节点的高带宽低延迟通信。

2.首次自主设计实现世界领先的众核处理器

自主设计实现1.5GHz申威众核处理器,创新点包括:提出片上计算阵列集群、分布式共享存储相结合的异构众核体系结构,提高运算能力与数据共享效率;提出定点浮点复用、逻辑操作重构技术,实现高效、精简核心结构设计,提升处理器能效比;采用寄存器级数据通信、多模式异步数据流传输和运算阵列快速同步等技术提高运算核心协同执行效率;采用片上数据全路径纠检错、存储接口保护技术、片上热点噪声抑制与隔离的物理设计技术,提升处理器的基础可靠性。

3.实现了世界先进水平的低功耗设计与控制体系

采用了芯片级和部件级的低功耗设计技术、软硬件结合的系统级功耗管理技术和编译器指导的应用层功耗优化技术等多层次降耗措施。在国产CPU、运算系统、网络系统、供电与冷却、高密度组装等多层次进行低功耗基础支撑设计;建立细粒度功耗检测系统、系统状态感知系统、外部任务驱动的多层次低功耗控制系统;建立层次协同的系统级功耗控制管理体系,在不影响系统性能和使用模式的前提下,有效降低运行能耗,实现高效绿色计算。

4.建立了面向千万量级核心的高并发度软件系统

采用多层多粒度并行作业控制、异构环境下多策略资源调度技术,支撑千万量级核心高效管理;采用异构融合高效基础编译支撑框架、多级自适应数据布局、数据驱动多模式访存优化等编译优化技术,提高程序运行性能;采用面向消息模型的运行时感知与程序异常诊断技术,降低大规模调试开销;提出基于众核阵列直接通信的数据重用方法,提升访存和通信密集型课题适应性;提出非规则类矩形静态负载平衡算法、多粒度动态任务评估映射算法,解决一批重大应用难题。

5.首次入围并获得国际高性能计算应用最高奖

“戈登·贝尔奖”旨在表彰国际并行计算重大应用成就,被誉为“高性能计算诺贝尔奖”。“神威·太湖之光”投入使用当年,就有大气、海洋和材料领域的三个应用入围2016年度“戈登·贝尔奖”,这是中国团队近30年来首次入围该奖项;最终,“千万核可扩展全球大气动力学全隐式模拟”应用获奖,实现了我国在此奖项上零的突破,打破了西方发达国家的垄断。2017年,“非线性地震模拟”应用再次获得“戈登·贝尔奖”。这些成果标志着“神威·太湖之光”的速度优势已转化为应用优势。

3.3 系统应用情况

“神威·太湖之光”自投入使用以来,已完成数百家用户单位应用课题的计算,涉及天气气候、航空航天、海洋环境、生物医药、船舶工程等20个应用领域,实现了数百万核超大规模并行计算,其中整机应用22个(千万核),半机以上规模应用12个,百万核以上应用40余个[4]

根据国际上对科学与工程计算应用的通行分类标准,我们对各应用进行归类:①稠密线性代数问题,如LINPACK、大规模流固耦合和流声耦合计算、潜艇收发分置全向声散射特性等;②稀疏线性代数问题,如高超声速飞行器数值模拟、C919大型客机失速特性模拟等;③谱方法,如基于FFT的湍流直接数值模拟、BNU_ESM地球系统模式等;④多体问题,如分子动力学GROMACS、微孔道扩散过程MD模拟等;⑤结构网格,如飞行器数值模拟、可压缩边界层湍流直接数值模拟、地球系统模式、地震模拟等;⑥非结构网格,如高超声速飞行器数值模拟、污染排放模拟等;⑦MapReduce,如蒙特卡罗模拟期权定价、BLAST基因序列比对、托卡马克装置逃逸电子行为模拟等;⑧组合逻辑,如AES、MD5等;⑨图的遍历,如社交网络分析等;⑩动态规划,如精确基因序列比对分析等;⑪回溯和分支限界,如SAT代数攻击等;⑫图的模型,如深度神经网络、隐马尔可夫模型等;⑬有限状态机,如网络协议分析等。以上13类应用全部在“神威·太湖之光”上完成大规模并行计算,并且都取得了良好的应用效益。

我们通过与国内各领域国家级研究机构建立联合实验室,为科学与工程计算领域人才提供协同工作的开放环境与平台,鼓励不同学科、不同单位和不同人员交叉合作的积极性,提高我国高性能计算应用的深度和广度;通过优质计算服务和价格优惠政策鼓励国内企业使用国产高性能计算机,为企业创新发展和转型升级提供技术支撑,促进“中国制造”向“中国创造”转变;建设完善的国产高性能计算机软件生态,研发高效的并行行业应用软件、智能制造云服务平台和行业应用计算服务App,充分发挥国产高性能计算机的超高计算能力;通过加强对人工智能、量子计算、类脑计算等前沿技术领域的支持,实现了部分前沿计算方法的“颠覆式创新”。可以看出,高性能计算机正在中国科研信息化方面发挥着决定性作用。

4 国际上掀起E级计算机研发热潮

E级计算机是国际高性能计算发展的下一个里程碑节点。目前,美国、日本、欧洲都已制定E级计算机计划并加速推进研发工作。E级计算机研发之所以如此火热,主要受以下应用需求变化的驱动:

一是传统科学计算应用。当前的实际复杂应用系统向着多时空尺度、强非线性耦合和三维真实构型的方向发展,包含着大量多尺度、多模型的计算问题,存在多粒度、多维度、多层次的并行性,面临着全系统、全物理过程、真三维、自然尺度的计算模拟,迫切需要E级以上计算性能的支持。

二是大数据应用。大数据研究的突飞猛进,扩展了高性能计算机的应用领域,出现了“大计算”与“大数据”融合的趋势。传统的科学计算在大数据条件下有了新的切入点,部分应用正经历着从计算密集型到数据密集型或混合密集型的变化,这离不开更强大高性能计算能力的支持。

三是人工智能应用。新一代人工智能技术的兴起,为高性能计算机发展带来了新的契机。以张量运算为主的深度学习应用仍属计算密集型,但是在算法原理上并不追求高精度计算,其对高性能计算机的单处理器性能、访存性能及网络性能都提出了更高的要求,因而需要超强的计算能力支撑。

4.1 美国E级计算机

目前,美国明确研制的E级计算机有3台:“极光”(Aurora)、“前线”(Frontier)和“酋长岩”(El Captain)。

1.“极光”(Aurora)

“极光”将由Intel和Cray联合研发,投资超过5亿美元,目标性能超过1Eflops,定于2021年交付,部署于美国能源部阿贡国家实验室,它将是美国第一台E量级高性能计算机。“极光”拟使用Intel下一代至强可扩展处理器、Xe GPU、Optane DC存储器及One API软件,采用Cray面向E级计算的“沙斯塔”(Shasta)体系架构和“弹弓”(Slingshot)互连系统。“极光”将传统HPC与AI深度结合,应用领域包括宇宙模拟、新药研发、气候建模、医疗健康等[5]。图2显示了“极光”系统的研制进程与预期应用。

图2 “极光”系统的研制进程与预期应用

2.“前线”(Frontier)

“前线”将由Cray与AMD联合研发,投资超过6亿美元,目标性能1.5 Eflops以上,计划2021年年底完成研制,部署于美国能源部橡树岭国家实验室。该系统将基于Cray“沙斯塔”架构和“弹弓”互连,采用AMD下一代EPYC CPU和Radeon GPU,CPU和GPU之间通过高带宽、低延迟的Coherent Infinity Fabric连接,系统功耗低于40MW。“前线”将用于核能系统、聚变反应堆和精密药物的应用模拟等。表4列出了“前线”E级计算机的系统规格[6]

表4 “前线”E级计算机的系统规格

3.“酋长岩”(El Captain)

“酋长岩”也将由Cray与AMD联合研制,投资6亿美元以上,峰值性能约为2 Eflops,计划于2023年投入运行,部署于美国能源部劳伦斯利弗莫尔国家实验室,主要任务是核武模拟。该系统也将基于Cray“沙斯塔”架构和“弹弓”互连技术,功耗预计在30~40MW。“酋长岩”将使用含有4个节点的“沙斯塔”计算刀片,每个节点配备4个AMD Radeon GPU和1个EPYC CPU。Cray公司正在探索把光学技术集成到互连上,以更高效地传输数据,并提高系统能效和可靠性。

4.2 日本E级计算机

日本正在研发中的E级计算机是“富岳”(Fugaku)系统,由富士通公司负责研制,受日本文部省“旗舰2020”计划支持,投资约10亿美元,目标性能1Eflops,将部署于日本理化研究所[7]。“富岳”将采用富士通自主研发的ARMv8 SVE(代号A64FX)处理器,集成48个专用计算核心+4个辅助核心,使用7nm工艺生产,包含87.86亿个晶体管,配备高性能HBM2内存,含有16条PCIe 3.0通道;采用6D Mesh/Torus互连网络;系统功耗预期为30~40MW。“富岳”原计划2020年完成(见图3),但由于工艺制造问题,将延期至2021年部署应用。

图3 日本“富岳”E级计算机研发进度

4.3 欧洲E级计算机

2017年,欧洲先后共有20个国家联合签署了“EuroHPC宣言”,共同推进欧洲HPC研制与应用[8]。依据“EuroHPC宣言”,欧洲计划研制2台预E级计算机和2台E级计算机。每台E级计算机的总成本预计为5亿欧元。2017年9月,欧盟正式启动了面向E级计算的EuroEXA项目。按计划,EuroEXA项目将开发高性能ARM和Xilinx FPGA芯片,2020年研制完成具有全新存储器和冷却系统的原型机,2023年左右部署E级计算机。德国于立希研究中心2018年4月已安装完成了由BULL公司制造的JUWELS高性能计算机首个模块,为未来的E级计算机研制奠定了基础。图4显示了欧洲E级计算机部署路线。

图4 欧洲E级计算机部署路线

4.4 中国E级计算机

我国于2016年启动“十三五”高性能计算重点研发专项,实施周期为5年,按E级高性能计算机研制、高性能计算应用软件研发、高性能计算环境研发3个创新链,共部署20余项重点研究任务。在该专项的支持下,国家并行计算机工程技术研究中心、国防科技大学和中科曙光公司同时获批进行E级原型机研制,以探索实现E级系统可能的技术路线。截至2018年10月,神威E级原型机、天河三号E级原型机和曙光E级原型机均已按计划研制完成并投入使用。“十四五”期间,科技部将继续支持E级高性能计算机的研发与应用。

5 国际高性能计算发展趋势

随着摩尔定律逐步减缓,工艺进步不能达到预期,当前高性能计算发展不断遇到“能耗墙”“编程墙”“可靠性墙”等阻碍,传统的高性能计算技术已面临“天花板”问题。近期,需要通过创新计算形态和计算模式,继续提升高性能计算机解决问题的能力;远期,需要探索颠覆性替代计算技术,推动后摩尔时代高性能计算机的发展。

xPU+高性能计算机是指将大量定制化芯片和CPU、GPU等较为通用的芯片融合在一个异构计算系统中,以满足不同领域的应用需求。这种定制化的特殊规格集成电路包括NPU(神经网络处理器)、DPU(深度学习处理器)等。例如,TPU(张量处理器)是谷歌专门为加速深度神经网络运算能力而研发的一款NPU芯片,采用8bit或者16bit的低精度运算,在芯片上放置了巨大的内存,紧密适配深度学习算法,在效能与功耗上相比于通用芯片有重大提升。

大数据+高性能计算机是指高性能计算机从单纯追求计算速度变成同时还注重系统吞吐率,促使设计理念从传统的单纯“以计算为中心”转向兼顾“以数据为中心”,提高“计算密集型+数据密集型”类问题的大规模计算效率。高性能计算与大数据在产业生态链上的紧密衔接可以更好地推进信息资源组织模式的变革与发展[9]。美国“国家战略计算计划”已提出“高性能计算与大数据融合”思想,认为其将影响未来科学发明、国家安全和经济竞争力[10]。Cray公司宣布了“统一平台战略”,将高性能计算机看成大数据基础设施,确立了“分析/大数据/高性能计算”三位一体的技术路线。

AI+高性能计算机是指高性能计算与人工智能深度融合发展。一方面,高性能计算机可为人工智能应用提供强大的算力支持,以深度学习为标志的第三次人工智能浪潮需要极强的计算能力,高性能计算机系统已大量用于深度学习领域研究和工程实践,国际TOP500中深度学习高性能计算机的比例快速增长;另一方面,人工智能技术也有助于解决高性能计算机发展面临的诸多挑战,在系统故障处理、调度资源使用、在线优化决策等方面具有良好的应用前景。未来人工智能应用将向更高维度和更复杂模型方向发展,需要设计开发新型体系结构和核心芯片,探索应对大规模复杂人工智能应用的新途径。此外,业界正在研发Deep500测试基准,以衡量高性能计算机的深度学习性能[11]

类脑计算是基于神经形态学原理,借鉴人脑信息处理方式,打破冯·诺依曼架构束缚,能够实时处理非结构化信息并具有学习能力的超低功耗新型计算技术。IBM和Intel已分别开发出具有完整功能的TrueNorth和Loihi类脑芯片,并分别研制了基于64个TrueNorth和64个Loihi芯片的高性能计算原型系统。Intel表示将在2020年推出一个更大的类脑计算系统,其拥有超过1亿个神经元、1万亿个突触,包含768个芯片、1.5万亿个晶体管,可提供前所未有的能效。类脑计算技术未来十年将可能取得突破,进入快速发展期。

模拟计算可以突破物理系统信息与二进制信息形式之间的转换瓶颈,具有很大的优势和应用潜力。美国国防部很早就对以概率计算为代表的模拟计算机开展了理论研究和实践,探索从算法设计、运算结构到专用芯片的超高速、超低功耗、高精度、低复杂度计算技术。在相同工艺条件下,概率计算处理器与X86处理器相比,可实现1000倍的能效提升。美国国防部高级研究计划局已宣布了一项“高效科学仿真加速计算”(ACCESS)计划[12],目标是开发新的数模混合计算架构,通过可扩展方式来模拟极端复杂系统。

着眼长远,随着传统计算技术的物理极限将至,发达国家都试图在超越硅基CMOS方向上寻找超常态计算方法,包括量子计算、生物计算、超导计算、光计算等。目前,国际上在这些非传统计算领域不断取得重要进展和突破,尤其是量子计算研究发展很快,甚至部分技术已走出实验室向工程领域转移,如IBM已推出53量子比特的IBM Q System One量子计算系统,支持云端在线访问;Google公司利用其53量子比特的量子计算机在随机线路采样问题上实现了“量子霸权”。但是,总体而言,距离开发出全尺寸、全功能的实用量子计算机还有很长的路要走。将新概念技术与传统架构有效结合,形成混合计算模型,发挥各自优势,实现解决复杂问题的整体性能超线性增长,是未来十年高性能计算机的重要发展趋势。

6 结束语

通过长期努力,我国在高性能计算的研究和工程方面都取得了很大进步,已经具备了世界一流水平,但是也应当看到这个高科技领域的竞争非常激烈,我们还存在许多短板和不足之处,需要持续不断的长期投入和研究。在即将到来的E级计算时代,除要研制开发先进高性能计算机系统之外,还应努力构建一个涵盖系统硬件(尤其是高端CPU)、系统软件、开发工具、应用软件甚至包括人才队伍的高性能计算生态链,使各方面研究成果及时得以过渡转化和集成利用,确保我国高性能计算事业可持续发展。

参考文献

[1] 谢向辉,胡苏太.中国“863计划”高性能计算的发展[J].科研信息化技术与应用,2015,6(4):3-10.[2] TOP500 Organization.TOP500 Lists[EB/OL].[2019-08-18].http://www.top500.org/.

[3] 漆锋滨.“神威·太湖之光”超级计算机[J].中国计算机学会通讯,2017,13(10):16-22.

[4] 刘鑫,郭恒,孙茹君,陈左宁.“神威·太湖之光”计算机系统大规模应用特征分析与E级可扩展性研究[J].计算机学报,2018,41(10):2209-2220.

[5] US Department of Energy.US Department of Energy and Intel to Build First Exascale Supercomputer[EB/OL].[2019-08-20].http://www.energy.gov/articles/us-department-energy-and-intel-build-first-exascale-supercomputer.

[6] Oak Ridge Leadership Computing Facility.Frontier Spec Sheet[EB/OL].[2019-08-20].http://www.olcf.ornl.gov/wp-content/uploads/2019/05/frontier_specsheet_pdf.

[7] RIKEN Center for Computational Science.About the Project[EB/OL].[2019-08-22].http://www.r-ccs.riken.jp/en/postk/project.

[8] EuroHPC Web Site.EuroHPC Declaration Sgned[EB/OL].[2019-08-22].http://eurohpc.eu/declaration.[9] 陈国良,毛睿,蔡晔.高性能计算及其相关新兴技术[J].深圳大学学报,2015,32(1):25-31.

[10] The White House.National Strategic Computing Initiative Strategic Plan[EB/OL].[2019-08-22].https://www.whitehouse.gov/sites/whitehouse.gov/files/images/NSCI%20Strategic%20Plan.pdf.

[11] Deep500.Deep500:An HPC Deep Learning Benchmark and Competition[EB/OL].[2019-08-22].http://www.deep500.org/.

[12] DARPA.Accelerated Computation for Efficient Scientific Simulation(ACCESS)[EB/OL].[2019-08-22].https://www.darpa.mil/program/accelerated-computation-for-efficient-scientific-simulation.

作者简介

陈左宁,女,1957年生,浙江大学计算机应用技术专业硕士研究生毕业,现为中国工程院副院长,2001年当选中国工程院院士。我国信息领域系统软件和体系结构方向学科带头人,主持或参与主持了多项国家和军队重大科技专项工程,为国产计算机系统研制赶超世界先进水平及核心软硬件国产化做出了重大贡献。目前是国家重点研发计划“云计算和大数据”重点专项的负责人,带领团队构建自主云应用生态体系,引领我国云计算应用与产业走向国际前列。先后两次获国家科技进步特等奖,两次获国家科技进步一等奖,曾获中国科协“求是奖”和“中国青年科学家奖”。