计算机技术论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

  • 欢迎访问 计算机技术论坛-电脑迷与初学者的家园!由于论坛管理严格,新注册会员可能遇到各种问题,无法解决的请发邮件 admin@jsjbbs.cn
查看: 1045|回复: 0

超算芯片霸主之争,终于有了新变数

[复制链接]
发表于 2021-4-12 06:16:59 | 显示全部楼层 |阅读模式
#111723#2020年4月,以近70亿美元被英伟达终究收购的以色列顶级数据核心收集技巧公司Mellanox,在长达半年多的“缄默”后,在11月迎来了两件足以引发业内惊动的大事。起首,陪Mellanox走了21年,并一手促进这笔买卖的开创人兼首席履行官Eyal Waldman发布离任,并留下了一句很是萧洒的话:
“在告竣这笔买卖时,我就晓得我要分开了。你晓得我用几十年创立一家公司并做出全部决议,不是用来做第二名的。”
其次,就在明天,Mellanox作为英伟达GPU家属的一部份,被英伟达融入了新的收集衔接架构产物——NVIDIA Mellanox 400G InfiniBand。
尔后,它将以“GPU朋友”的身份,率先打入数据核心市场的最精锐军队——超等盘算机市场。
NVIDIA Mellanox 400G InfiniBand产物的架构构成。简略来讲,就是一个用以衔接其余效劳器与英伟达产物的组件
英伟达在明天的寰球超等盘算大会上,再次革新了本人最强盛GPU产物线——企业级减速器A100的 机能记录。
新一代的A100 GPU将高带宽内存晋升至80GB,比上一代扩展一倍。这象征着,每秒超越2TB的内存带宽,会让数据在内存与GPU之间流畅得愈加敏捷,以便“蒙受”研讨职员树立更大范围人工智能模子和数据集带来的压力。
“当初要在AI和高机能盘算(HPC)的研讨结果上持续冲破下限,迷信家们必需要构建更大更庞杂的模子,那末便须要比以往更大的内存容量与更高的带宽。” 英伟达利用深度进修研讨副总裁Bryan Catanzaro指出。
英伟达在英国剑桥的超算核心安排了由多少块A10080GB构成的DGX体系
现实上,除了转变芯片产物的架构,把成百上千块芯片用最高效的情势“连”起来,固然也能处理迷信家们每秒/百亿亿次的超大盘算需要,而收购的Mellanox的意图便在于此。
假如你见过位于无锡的中国超等盘算机“太湖之光”,就会发明“这台盘算机”实在是一个由成百上千台玄色机柜构成的盘算机集群,能够填满一间约1000平米的房子。
它既能够被称为“高机能盘算机群”,也能够被看作是一个不小范围的数据核心。
固然,这些玄色机柜的机能,要比一般效劳器强盛太多,由4万多块差别品种的国产芯片构成,仅集成它们就是一项极其艰难的义务,用时两年,总投入超越了18亿国民币。
位于无锡超算核心的太湖之光
而NVIDIA Mellanox 400G InfiniBand的感化,就是将超等盘算机中上万块CPU、GPU以及其余品种芯片“衔接”在一同。在施展机能最大化的同时,每块芯片的数据传输效力也不能有太多消耗。
“之前CPU与GPU之间的互联,都是通过英伟达的NVlinks(一种总线及其通讯协定),但这个货色互联的效力没有特殊好,不能简略扩大到上千块芯片互联的超算场景。”参加研发过TPU,芯英科技结合开创人杨龚轶凡告知虎嗅,Mellanox善于的就是此前英伟达最大的短板之一,
“一台超等盘算机,各品牌芯片之间的高效共同,极其主要。之前英伟达的NVlinks只能和IBM的CPU互联。而收购Mellanox后,英伟达加强了用芯片构建超算体系的可扩大性,能够让GPU与其余品牌和品种的芯片停止衔接。”
换句话说,英伟达找到了“让本人产物轻松插进包含英特尔在内,全部效劳器芯片接口”的方式。
超算市场,弗成疏忽的芯片掘金地
英伟达的此次全系列产物,无一破例面向的都是“烧钱魔窟”——超等盘算机市场。
举个例子,在2020年6月公布的寰球超等盘算机Top500榜单上,排名第二的美国橡树岭国度试验室超等盘算机Summit,在每个节点装备了2个IBM的 Power9 CPU和 6个英伟达的Tesla V100。如许的节点有4356个,总耗资2亿美元。
而在2019年3月,美国动力部阿贡试验室公然发布,将耗资5亿美元搭建新一代超等盘算机 Aurora 。这台将在2021年实现交付的超等盘算机,并非寻求一味寻求盘算速率,而是须要针对人工智能等新技巧利用采取新的计划思绪。
那末这笔巨额当局条约的重要受益者是谁?外界猜想是美国最大的CPU出产商英特尔与有名超算体系集成商Cray。
但弗成疏忽的是,跟着超算体系被用在人工智能研讨范畴的次数越来越多,额定装载的减速芯片GPU,逐步成为搭建超等盘算机的必选品。
因而,英伟达也在寰球很多超算名目中取得了很是丰富的收益,包含美国技巧最强盛的国度试验室——橡树岭试验室、阿贡试验室,都是英伟达最好机能产物的首批尝鲜者。
美国迄今最强的超等盘算机Summit(顶峰),在最新的Top500榜单中排名第2。
超等盘算机之间的竞争,历来都被看做是国度之间技巧气力的竞争。
虽然这是一个狭窄的权衡尺度,但这些超等盘算机群确实在良多军事与迷信义务中施展着极其主要的感化,比方兵器计划与暗码破译,再比方摹拟气象变更,研讨与诊断新冠病毒。
良多前所未有的资料与化学试验,不太可能在云端履行,因而安排高机能效劳器便显得分外主要。
“没有人乐意烧良多钱去做一些几十年没结果的新技巧研讨,然而这些研讨却很有须要,那末这些新技巧的运算就须要超等盘算机来支撑。”一名业内子士告知虎嗅。
而这场竞争中,中国与美国理所固然是最为微弱的参赛选手,也是最乐意砸钱做超算体系的两个科技大国。
2020年6月,虽然Top500的榜首之位,被日本神户理研盘算核心耗资10亿美元的超算体系Fugaku夺走,但在这500个超等盘算机中,中国具有此中226个体系,而美国则盘踞114个。

2020年6月最新榜单的前10名。在2016年~2017年连任4次冠军的中国超等盘算机太湖之光位于第四名,河汉二号第五名。
因而,假如依照每台超等盘算机单价上亿美元来盘算,这是一个使人垂涎的市场。而当局一次又一次创下记载的巨额定单,对贸易公司发生着越来越大的吸引力;
另外,毫无疑难,因为超等盘算机运转的都是难度最高的技巧研发义务,它们的存在,是将来技巧下沉到产业和花费级市场的源能源。
国度之间的超等盘算机之战从几十年前就已打响。一开端,大少数超等盘算机应用的微处置器都是从英特尔和AMD的PC芯片演化而来,但是,就是在从前5年里,数据量开端如爆炸般增加,新技巧利用层出不穷,因而最强盛的超等盘算机曾经开端加大专业芯片的应用力度,而英伟达,就是最大的受益者之一。

从图中能够看出,2020年~2025年发生的数据量,是2010~2020年纪据量的三倍。图片来自英伟达。
不外成心思的是,日本Fugaku战胜中国和美国最强盘算机的“源能源”,居然是富士通的48核 A64FX SoC,这应当是榜单上第一个由ARM处置器供给能源的超算体系(固然不想把英伟达和ARM的收购接洽起来,但这好歹是个开端)。
“将来超算市场,现在当初的共鸣是HPC+AI。也就是说,将来AI是超算的典范利用,并且量级很大。以是英伟达,想要作为将来霸主,坚持在这个市场的当先位置。固然,高机能盘算市场,所有都没那末轻易。”

更多内容阅读推荐:冰箱保鲜室结冰要维修吗
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

无图版|手机版|计算机技术论坛 JSJBBS.CN @ 2008-2024 ( 鲁ICP备17021708号 )

技术支持 : 北京康盛新创科技有限责任公司

快速回复 返回顶部 返回列表