发新品、涨股价,英伟达帝国雏形尽显!
时间:2021-04-15 00:00:00来自:竞科技字号:T  T

4月13日,全球芯片大厂英伟达(NVIDIA)的年度好戏GTC2021正式上演!

在这场95分钟的演讲中,NVIDIA首席执行官黄仁勋(JensenHuang)一连发布多款重磅新品,涵盖GPU、CPU和DPU等多个方向,AI、自动驾驶、机器人、5G和数据中心诸领域无一不包。

可以说,NVIDIA在通向“全领域芯片解决方案供应商”的道路上即将行至目的地,庞大“芯片帝国”的根基已经建成。

而好事成双的是,受益于数据中心和加密货币挖矿的强劲需求,NVIDIA还表示其第一季度营收将高于其早先预测的53亿美元。

该公司表示,NVIDIA支持加密货币挖矿的部门目前预计本季度的销售额将达到1.5亿美元,高于之前预测的5,000万美元。

受此利好消息影响,NVIDIA的股价在当日盘中大幅上涨近6%,收于608.36美元。今年迄今为止,其股价已经上涨了16.5%。

▍八款新的GPU瞄准高性能

在今年的GTC2021上,NVIDIA的看家业务GPU推陈出新,共发布了八款新的基于Ampere的图形处理单元(GPU)。

这八款GPU可用于笔记本电脑、台式机、服务器和工作站,目标客户是数百万艺术家、设计师、工程师和虚拟桌面用户。

“混合工作已经是新常态,”NVIDIA专业可视化副总裁BobPette在一份声明中表示。“基于NVIDIAAmpere架构的RTXGPU为来自任何设备的工作负载提供了高性能处理能力。”

NVIDIARTXA5000和NVIDIARTXA4000GPU定位于台式机,它们采用了全新的RT核心、Tensor核心和CUDA核心,将AI、图形和实时渲染的速度提高到前几代产品的2倍。

对于专业人士来说,全新的NVIDIARTXA2000、RTXA3000、RTXA4000和RTXA5000GPU可以为笔记本电脑带来加速性能。它们包括最新一代的Max-Q和RTX技术。

在数据中心方面,NVIDIA展示了A10GPU和A16GPU。

A10为设计师和工程师提供了比上一代的虚拟工作站高2.5倍的性能表现;而A16GPU则提供的用户密度则是上一代的2倍,且总拥有成本更低,虚拟桌面基础设施体验也比上一代有所提升。

新的NVIDIARTX台式机GPU和NVIDIA数据中心GPU将从本月晚些时候开始从全球分销合作伙伴和制造商处发货。新的NVIDIARTX笔记本GPU将于今年第二季度预计在全球制造商的移动工作站中推出。

▍“全球首款TB级计算CPU”

除了GPU,NVIDIA心心念念的CPU也没落下,它发布了其Grace处理器。这是一款基于ARM架构的中央处理器(CPU),适用于大规模的人工智能和高性能计算应用。

Grace是以20世纪50年代开创计算机编程的GraceHopper命名的,该CPU预计将于2023年初上市。

黄仁勋在发表主题演讲时表示,这是NVIDIA的第一款数据中心CPU,专门为大规模运行的应用而设计,“这是全球首款为TB级计算设计的CPU。”

通过使用ARM架构,Grace为训练巨型AI模型的系统提供了10倍的性能飞跃。而NVIDIA表示,瑞士超级计算中心和美国能源部洛斯阿拉莫斯国家实验室将率先使用Grace。

据了解,这款CPU的研发耗费了1万名工程师一年的时间。NVIDIA表示,这款芯片将满足世界上最先进的应用,包括自然语言处理(NLP)、推荐系统和AI超级计算的计算需求。

“前沿的人工智能和数据科学正在推动今天的计算机架构处理难以想象的数据量,”黄仁勋在演讲中说。“使用授权的ARMIP,NVIDIA将Grace设计为专门用于大规模人工智能和高性能计算的CPU。再加上GPU和DPU,Grace为我们提供了计算的第三项基础技术,以及重新构建数据中心以推进AI的能力。”

Grace是一款高度专业化的处理器,目标是训练下一代NLP模型等工作负载,这些模型的参数超过1万亿。

当与NVIDIAGPU紧密结合时,基于Grace的系统的性能将比今天基于NVIDIADGX的系统(运行在x86CPU上)快10倍。

Grace是为人工智能和高性能计算应用而设计的,但NVIDIA目前并没有披露更多关于Grace将用于何处的信息。NVIDIA也拒绝透露Grace芯片的晶体管数量。

随着AI模型的数据量和规模成倍增长,NVIDIA推出Grace。如今最大的AI模型包括数十亿个参数,并且每两个半月就会翻一番。训练它们需要一个新的CPU,可以与GPU紧密结合,以消除系统瓶颈。

“用经典的x86CPU和GPU通过PCIe连接,很难解决这些问题。Grace专注于IO和内存带宽,与GPU共享主内存,不应该与AMD或英特尔的通用数据中心CPU相混淆。”MoorInsights&Strategies的分析师PatrickMoorhead说。

Grace性能的基础是第四代NVIDIANVLink互连技术,该技术在Grace和NVIDIA图形处理单元(GPU)之间提供900千兆字节/秒的连接,与当今领先的服务器相比,可实现30倍的总带宽。

此外,Grace还将采用创新的LPDDR5x内存子系统,与DDR4内存相比,带宽将提高两倍,能效提高10倍。此外,新的架构还提供了统一的缓存连贯性和单一的内存地址空间,将系统和HBMGPU内存结合在一起,简化了可编程性。

“Grace平台及其ArmCPU是NVIDIA迈出的一大步,”TiriasResearch的分析师KevinKrewell在一封电子邮件中表示。“Grace的亮点在于,使用定制的ArmCPU将有可能扩展大型LPDDR5DRAM阵列,使其远

本站郑重声明:所载数据、文章仅供参考,使用前请核实,风险自负。
© 2008 北京济安金信科技有限公司 北京合富永道财经文化传媒有限公司
京ICP备12044478号 版权所有 复制必究
本站由 北京济安金信科技有限公司 提供技术支持