#111723#11月15日,北京,中国超算“放榜日”。
跟着第二届中国超等算力大会的举办,2020中国高机能盘算机机能排行榜TOP100发表。
榜单的前2位曾经五年没有产生更迭,仍是熟习的两个“前寰球第一超算”——“神威·太湖之光”和“河汉二号A”,它们分辨安排在国度超等盘算无锡核心和国度超等盘算广州核心(注!5年间呆板有进级)。
榜单的第3、4位是新面貌。
此中,排在第3位的是北京超等云盘算核心(A分区)。其装备供给方为戴尔科技团体,Linpack测试机能达3.743PFlops,峰值机能达7.035PFlops,采取AMD最新的霄龙处置器“罗马”为其供给磅礴算力。北京超等云盘算核心由中国迷信院与北京市当局共建,位于北京市怀柔迷信城。
榜单第4位是安排在内蒙古和林格尔新区的“内蒙古高机能盘算大众效劳平台”,建立方为清华同方;5~10位由遐想深腾8800系列盘踞。排在榜最后一名的呆板机能为1.869PFlops,较客岁最后一名机能晋升33.2%。
此次榜单看起来固然变更不大,但综合剖析来看,仍有很多亮点。
1.国度超算的大国重器位置不摇动
榜单前两位无锡超算和广州超算,是国度超算的出色代表。
众所周知,两台装备都曾在寰球超算TOP500排行榜上排名第一。此中,河汉二号(含进级后的河汉二号A)在2013年6月~2015年11月,持续六次在TOP500排名第一;神威·太湖之光在2016年6月~2017年12月,持续四次在TOP500排名第一。
固然,两大国度级超算的奉献毫不止于TOP500的排名,两者对于推进我国超大范围盘算机的研制、安排、软件开辟、利用等方面一样居功甚伟。
以神威·太湖之光为例。
自2016年该呆板夺得寰球第一超算的桂冠后,昔时,我国迷信家杨超级人就凭仗运转在其上的万万核级利用,初次摘得“高机能盘算范畴的诺贝尔奖”——戈登贝尔奖。这一最高奖项在此前的近30年中,始终被美国和日本把持。
尔后的2017年,青年迷信家付昊桓等人再次凭仗基于神威·太湖之光的利用“非线性地动摹拟”辅助中国连任“戈登贝尔奖”。
持续两年将“戈登贝尔奖”收入囊中,对于推进我国超算利用开展、进步我国超算软气力,乃至提振中国超算士气方面都有侧重要意思。
固然,作为国之重器,国度超算在承当减速学科穿插和信息化开展、减速工业转型与融会进级、培育复合型人材等国度任务方面也表演侧重要的脚色。
就拿“河汉二号A”来讲,多年来始终向大气—大陆情况摹拟、地理地球物理、产业计划制作、生物医药安康等方面赐与算力和盘算利用支持。
2.通用和行业超算是主要弥补
国度级超算都是各人伙、重兵器,可能负载万核、十万核乃至万万核以上利用。然而,在“公民经济主疆场”,更多的利用是没法企及国之重器如许的高度的,这也请求超算不能只是“望族堂前燕”,还要“飞入平常庶民家”。
简略来讲,国度超算是国度策略盘算设备,不但要有,还要只管“大”,和天下一流程度同频共振;而用于各行各业、作为出产东西的通用超算、行业超算,也等同主要,但这类装备寻求的不是“大”,而是要寻求通用、易用、好用。
此次Top100榜单排在第三位的北京超等云盘算核心(A分区),别看它排名靠前,但它是不折不扣的、效劳千行百业的通用超算,是国度超算主要的算力弥补。
鉴于这一集群体系的代表性,加上此前该集群十分低调,只有很少的公然信息,今次本文以绝对长的篇幅做一些先容和剖析。
北京超等云盘算核心(不要被名字困惑,它不是咱们常说的云盘算,而是以云效劳情势供给超算算力的平台)于 2011 年依靠中科院盘算机收集信息核心建立,北京北龙超等云盘算无限义务公司担任经营,位于怀柔迷信城。
本次上榜的是北京超等云盘算核心的A分区(对于为何“分区”,后文胪陈),算力范围为3.743PFlops,全体为通用X86超算。
通用X86超算在圈内又被称作“纯CPU通用算力”,这类算力资本,因为生态完美、代码可移植性强等缘由,用户友爱度十分高。
更值得一提的是北京超等云盘算核心供给算力的形式。正如其名,该核心以随需供给的“超等云盘算效劳”的形式向用户供给算力,这是其最大的特色。
后面说超算要从“旧时望族堂前燕”“飞入平常庶民家”,怎样飞?北京超等云盘算核心的实际证实,“超等云盘算效劳形式”就是一种行之无效的方法。
来看几个例子。
3.“超等云盘算”的几个案例
建立于1998年的“金风科技”,是我国风电奇迹开展的亲历者和推进者。金风科技打造的仿真软件“风匠”体系,是一款“更合适中国风资本特点的仿真软件”。依靠北京超等云盘算核心支撑,金风科技以北京超等云盘算核心A分区为主资本,停止风资本评价相干的营业出产和产物研发。
为了满意金风科技差别营业部分需要,在盘算资本方面,北京超等云盘算核心为其供给了独有、包核时等应用方法,同时供给数目和范例丰盛的设置资本,这保证其可能通过弹性扩大,无效支持顶峰—平峰应用需要。
“经在A分区的测试和平常出产应用,整体盘算机能和速率,有显明晋升。”
金风科技相干担任人在用户试用讲演中写道:“在技巧支撑和资本效力方面,基于我方体系需要,供给了多种接入方法和技巧支撑,并供给了专属的技巧支撑职员供给资本。在应用A分区资本盘算进程中,体系未呈现成绩。”
供给以独有、包核时的机动应用形式来满意盘算资本需要,除金风科技以外的受益者,另有一长串名字。
这此中就有天然资本部大陆情况迷信与数值摹拟重点试验室。其首席迷信家宋振亚说,A分区盘算速率快、节点数目多、通讯机能高、并行可扩大性好,并且可通过量种方法应用,高效、便捷。
同时,该试验室以万核范围经由一周以上的不中断运转,体系也没有呈现成绩,盘算数据经由验证,成果准确,“阐明该体系运转稳固牢靠”。宋振亚说,他们有打算下一步将自立研发的短期气象猜测体系也移植到北京超等云盘算核心A分区展开营业运转。
中科院院士、中科院物理所研讨员向涛团队课题组,是我国在凝集态物理研讨方面的主要气力,他们课题组临时努力于“张量重正化群方式”的开展和利用。而要开展和利用这类方式所需的算力,不但须满意多中心并行,还要有大的内存支持。
北京超等云盘算核心A分区的盘算资本,单节点64中心、内存高达256G,恰能满意向涛院士课题组对盘算资本的请求。很快,A分区就成了该课题组迷信研讨的无力东西。
“咱们领会到了省时省力。”
向涛院士课题组研讨职员评估说,A分区的存在,简化了盘算资本的保护、下降了调试本钱,攻破了他们一开端对盘算资本运维的“心思胆怯”。
上边这3个案例,都是本次榜单上北京超等云盘算核心A分区的“光彩业绩”。
后面也有提到,A分区只是北京超等云盘算核心的一个主力分区,除A分区外,北京超等云盘算核心另有T分区、M分区、IO分区,另有科技云9分区、12分区、15分区、17分区、19分区等等。
为甚么要分别这么多分区?
对于超算的需要方而言,他们对超算的需要是多种多样的——有的须要更燃的盘算,有的须要更多内存,有的须要更快的数据传输。而全部这些分区,都是因向对盘算资本有差别需要的用户供给更便捷高效的效劳而存在的。
北京超等云盘算核心还在一直静态扩容、一直“分蘖”,也表现了其以用户效劳为中心,“将超等云盘算效劳形式停止究竟”的信心。
4.中国超算既要“捅破天” 还要“接地气”
超算是主要的基本东西。没有“神威·太湖之光”、“河汉二号”、“曙光星云”等这些大国重器,咱们就没法实现尖端科技的冲破,没法一直向迷信技巧广度和深度进军。
但同时也应看到,我国经济社会的提高、各行各业进级开展的需要日趋急切,也在召唤可能更接地气的海量盘算利用,召唤北京超等云盘算核心、阿里云、华为云等一系列可能供给超等算力、供给盘算效劳、供给大数据处置才能的行业奉献者。
还应指出的是,“盘算”作为一种支持和东西,它还只是进步出产力链条中的一个环节。在盘算以外,数据的收集与处置、软件的计划与调优、模子形式的开辟等等,须要行业表里更多人的参加。
明天榜单上的全部集群,都只是超算作为硬件状态的一集体现。这一个个的“各人伙”要酿成真正的出产力,须要逾越超算硬件与利用之间的“死谷”。
北京超等云盘算核心在处理这个成绩上想到和实际的方式是“超等云盘算效劳形式”,但这就够了吗?
美国在超算安排上始终有制订详实的打算。从国度策略盘算打算(有名的NSCI打算),到美国动力部制订实行的百亿亿次盘算研发名目(ECP打算),都夸大多部分协同、更器重利用。
特殊是ECP打算,美国打算5年投入“18亿美元+18亿美元”,一半用于E级盘算机研制,一半用于研发利用。
超算行业专家、中山大学数据迷信与盘算机学院院长钱德沛曾总结中国超算利用上的缺点:缺少利用软件、缺少人材、缺少无效配合。说究竟,咱们更须要一个完美的“超算用起来”的情况。
不管国度超算、通用超算、行业超算、贸易超算,存在状态真的无大所谓,能够兼容并收,但要用起来。只无形成了一个安康的利用生态,中国超算,才算真的顶天登时。 xj
更多内容阅读推荐:
为什么空调风叶不转