找回密码
 立即注册

QQ登录

只需一步,快速开始

  • 欢迎访问 计算机技术论坛-电脑迷与初学者的家园!由于论坛管理严格,新注册会员可能遇到各种问题,无法解决的请发邮件 admin@jsjbbs.cn
查看: 1555|回复: 0

公子王孙NVIDIA造顶级计算平台 第一次融合AI与HPC高性能计算

[复制链接]
发表于 2021-4-7 04:32:16 | 显示全部楼层 |阅读模式
#117803#­NVIDIA的下1代GeForce游戏卡迟迟不肯露面,1方面是缺少足够的竞争刺激,另外一方面则是NVIDIA的业务重心早已转移,不再只盯着游戏卡,更关注的是计算平台,毕竟那里发展空间更大,利润也高很多。
­NVIDIA今天宣布推出新1代计算平台“HGX⑵”,具有多达16块顶级计算卡Tesla V100,而且第1次将AI人工智能、HpC高性能计算融会在了统1架构以内。
­Tesla V100基于新1代GpU架构“Volta”(伏特),采取台积电12nm FFN(16nm加强版)工艺制造,具有5120个CUDA核心、640个Tensor深度学习核心,面积达815平方毫米,集成了210亿个晶体管。
­其浮点性能高达半精度30TFlops、单精度15TFlops、双精度7.5TFlops,Tensor性能则有120TFlops,同时搭配4096-bit位宽的16GB HBM2高带宽显存,频率1.75GHz,带宽900GB/s。
­NVIDIA此前的计算平台HGX⑴整合了8块Tesla V100,总计40960个CUDA核心、5120个Tensor核心、256GB显存,通过300GB/s双线带宽的NVLink总线相连,浮点性能单精度125TFlops、双精度62TFlops,Tensor性能1pFlops。
­而新1代HGX⑵则用上了16块Tesla V100,范围和性能轻松翻番,总计81920个CUDA核心、10240个Tensor核心、512GB显存,浮点性能单精度250TFlops、双精度125TFlops,Tensor性能2pFlops。
­NVIDIA还在系统内部署了12颗NVSwitches开关,用于GpU之间的直接互联,NVLink总线双向带宽高达2.4TB/s。
­除高性能,HGX⑵平台的最大优点是支持多种精度计算,可适应不同需求,比如在科学计算和摹拟中,可以使用Fp64、Fp32高精度计算,而在AI训练和推理中,则可以使用Fp16浮点、Int8整数精度计算。
­联想、超微、QCT、Wiwynn4大服务器厂商都将在今年晚些时候发售各自的HGX⑵系统。
­富士康、英业达、广达、纬创4大ODM厂商则正在设计基于HGX⑵的系统,将在今年晚些时候面世,可用于云计算数据中心。
更多内容阅读推荐:国有土地征收和补偿的规定
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

|计算机技术论坛 JSJBBS.CN @ 2008-2025 ( 鲁ICP备17021708号 )

技术支持 : 腾讯云计算(北京)有限责任公司

快速回复 返回顶部 返回列表