作者 | 周愚

编辑 | 邓咏仪

“我们已经迎来了生成式AI的引爆点。从此,全世界的每个角落,都会有算力需求。”


(资料图片)

北京时间5月29日,台北国际计算机展(COMPUTEX 2023)大会上,英伟达创始人兼首席执行官黄仁勋发表了主题演讲,并甩出了多项重磅发布:超级芯片GH200 Grace Hopper已全面投产,发布新型AI超级计算机DGX GH200,以及开发游戏、广告等领域内的生成式AI应用。

黄仁勋并不掩饰如今英伟达的雄心壮志:从一家单纯的芯片公司转向人工智能计算领域的领导者。

“CPU扩张的时代已经结束。”他在会上宣称。他认为,加速计算和人工智能正在重塑计算机,随着AI应用对计算能力的需求不断扩大,GPU才是未来的主角。

英伟达的最新GPU GH200 Grace Hopper超级芯片已经全面投产,未来将为运行复杂的AI和高性能计算工作负载提供动力。据英伟达官网,该芯片可以提供高达900GB/s的总带宽——比传统加速系统标准PCIe Gen5通道带宽高出7倍。

来源:英伟达

新发布的AI超算系统DGX GH200被业界评价为“算力杀器”——搭载256个Grace Hopper超级芯片,新的互联方式让机器像一个巨型GPU运行,提供1EFLOPS的性能和144TB的共享内存,这比上一代DGX A100的内存多出近500倍。

谷歌云、Meta及微软等公司将有望成为首批获得DGX GH200访问权限的公司,未来也将向更多客户开放。与此同时,英伟达也计划打造基于4组GH200、576TB HBM内存的AI超算系统NVIDIA Helios,预计将于今年年底上线。

以训练一个LLM大语言模型为例,黄仁勋表示,所需的960个CPU组成的服务器集群将耗费约1000万美元和11千兆瓦时的电力。而所需的GPU服务器则仅需耗费约40万美元和0.13千兆瓦时的电力——成本和电力消耗分别是CPU的4%和1.2%。

推荐内容