计算机技术论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

  • 欢迎访问 计算机技术论坛-电脑迷与初学者的家园!由于论坛管理严格,新注册会员可能遇到各种问题,无法解决的请发邮件 admin@jsjbbs.cn
查看: 1351|回复: 0

晶圆级芯片将引领行业将入新时代-

[复制链接]
发表于 2021-4-10 08:47:58 | 显示全部楼层 |阅读模式
#111723#盘算机芯片的汗青是是一段冲动民气的微型化的汗青。
众所周知,数字天下催生了一种趋向,范围越小越好。那末,为甚么在地球上有些人想逆转航向,并应用大芯片呢?固然,咱们没有特殊充足的来由在一个iPad顶用一个iPad巨细的芯片,不外如许的大芯片可能被证实是存在更详细的用处,如人工智能和物理天下的摹拟。
最少,这就是天下上最大的盘算机芯片制作商Cerebras所盼望的。
Cerebras晶圆级引擎不管以何种方法停止切割都十分宏大。该芯片的是8.5英寸,并装有1.2万亿个晶体管。而排名第二大的芯片是NVIDIA的GPU A100,只有一英寸,晶体管数目也只有540亿个。前者是新的芯片范例,基础上未经测试,到现在为止,他们推出的芯片也是独一的一款。后者广受爱好,已大批出产,并在从前十年中接收了AI和超等盘算的天下。
新芯片会引领一个新时期吗?让咱们来细看一下。
超出人工智能的大芯片
客岁,当 Cerebras的芯片初次脱颖而出时 ,该公司表现其将大大放慢深度进修模子的练习速率。

从当时起,WSE进入了多数超等盘算试验室,该公司的客户正在一直尽力。此中一个试验室,即国度动力技巧试验室,正在寻觅它在人工智能以外还能做甚么。
因而,在近来的一项实验中,研讨职员将芯片与流体能源学摹拟中的超等盘算机相提并论,该芯片位于一个称为CS-1的一体式体系中。摹拟流体的活动是一种通用的超等盘算机利用顺序,可用于处理诸如气象预告和飞机机翼计划之类的庞杂成绩。
该实验由Cerebras的Michael James和NETL的Dirk Van Essendelft引导的团队停止,在他们撰写的预印本论文作了描写,并在本周的 SC20 超等盘算集会上宣布。研讨小组说,CS-1实现了电厂的焚烧摹拟,义务的速率比Joule 2.0超等盘算机快200倍。
CS-1现实上比及时更快。正如 Cerebrus在博客文章中写道: “它能够告知您将来将产生甚么,而物理定律不会发生雷同的成果。”
研讨职员说,CS-1的机能是任何数目的CPU和GPU都没法比较的。该布告首席履行官兼结合开创人 Andrew Feldman 告知 VentureBeat ,“不管超等盘算机有多大,该实践都是准确的”。在某种水平上,对像Joule如许的超等盘算机停止扩大在这类成绩上不再发生更好的成果。因而, Joule的仿真速率到达 了16,384个内核的 峰值 ,但这只是其全体86,400个内核的一小部份。
通过 对两台呆板的比拟,能够得出 论断。Jouel是天下上第 81快的超等盘算机 ,占用数十个效劳器机架,耗费高达450千瓦的功耗,而且须要数万万美元的制作用度。比拟之下,CS-1装置在效劳器机架的三分之一中,耗费20千瓦的功耗,售价仅为几百万美元。
虽然这项义务十分玲珑(但很有效),并且成绩十分合适CS-1,但它依然是一个十分惊人的成果。那他们怎样做到的呢?这t全体都表现在计划中。
增加通讯
盘算机芯片的性命始于一个称为晶圆的大硅片上。将多个芯片蚀刻到统一晶圆上,而后将晶圆切割成单个芯片。当WSE也被蚀刻到硅晶圆上时,该晶圆将作为一个独自的操纵单位完全保存。该晶圆级芯片包括近40万个处置中心。每个内核都衔接到其本人的公用存储器及其四个相邻内核。
将这么多内核放在一个芯片上并为其供给本人的内存是WSE能做到这么大的缘由。这也是为甚么在这类情形下,芯片表示更好的缘由。
大少数大型盘算义务都依附于大范围并行处置。研讨职员在数百或数千个芯片平分配义务。这些芯片须要协同任务,因而它们之间坚持着一直的通讯,往返通报信息。当信息在停止盘算的处置器内核和同享内存之间存储信息时,每个芯片外部都市产生相似的进程。
这是一个d带点儿怀饿旧公司,在纸上做它的全部营业。
该公司应用快递公司从镇上其余分支机构和档案中发送和搜集文档。快递员晓得穿过都会的最好线路,但行程只要要起码的时光,详细取决于分支机构和档案馆之间的间隔,快递员的最高速率以及路上有几多其余快递员。简而言之,间隔和交通会减慢速率。
当初,设想一下公司正在制作一座簇新的闪亮摩天大楼。每个分支机构都搬进了新大楼,每个工人在办公室里都有一个小的文件柜来存储文件。当初,他们须要的任何文档都能够在跨办公室或穿过大厅达到街坊办公室所需的时光停止存储和检索。信息通讯几近消散了,由于所有都在统一个屋子里。
Cerebras的巨型芯片有点像那座摩天大楼。与须要联网大批传统芯片的传统超等盘算机比拟,它通报信息的方法(通过其专门定制的编译软件进一步帮助)愈加高效。
摹拟天下的开展
值得留神的是,该芯片只能处置充足小的成绩以合适晶圆。然而,因为呆板可能及时停止高保真摹拟,因而此类成绩可能存在相称现实的利用。作者指出,该呆板在实践上应当可能正确地摹拟试图下降在驾驶舱上的直升机四周的气流,并使该进程半主动化-这是传统芯片没法做到的。
他们指出,另一个机遇是应用摹拟作为输入来练习也驻留在芯片上的神经收集。在一个惹人入胜的相干示例中,近来 证实 ,加州理工学院的呆板进修技巧在求解雷同品种的偏微分方程以摹拟流体能源学时, 速率快 了 1000倍 。
他们还指出,芯片的改良(以及其余相似的产物,假如有的话)将可实现任务的极限持续往前推动。Cerebras曾经领先 宣布了其下一代芯片 ,该 芯片 将存在2.6万亿个晶体管,850,00个内核以及两倍以上的内存。
固然, 晶圆级盘算 能否 真正腾飞 另有待视察。这个主意曾经存在了几十年,然而Cerebras是第一个当真寻求它的人。明显,他们信任他们曾经以一种有效且经济的方法处理了这个成绩。
其余新架构也正在试验室中停止研讨。比方, 基于忆阻器的神经状态芯片 通过将处置和影象放入单个相似晶体管的组件中来模拟大脑。固然, 量子盘算机 位于独自的通道中,然而能够处理相似的成绩。
可能此中一种技巧终究崛起来统治全部这些技巧。或许,这仿佛很有可能,盘算可能会决裂成一堆奇异的基础芯片,依据情形将它们全体封装在一同以充足应用每个芯片。   义务编纂:tzh
更多内容阅读推荐:冰箱里积水太多怎么办
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

无图版|手机版|计算机技术论坛 JSJBBS.CN @ 2008-2024 ( 鲁ICP备17021708号 )

技术支持 : 北京康盛新创科技有限责任公司

快速回复 返回顶部 返回列表