AI行业跟踪点评:英伟达:从一个硬件公司到生态公司
时间:2024-03-20 17:59:19来自:西部证券字号:T  T

事件:英伟达GTC2024于3月18日至21日举行。北京时间3月19日,英伟达创始人黄仁勋发表GTC2024的主题演讲《见证AI的变革时刻》。

英伟达推出首个采用MCM(多芯片封装)技术的BlackwellGPU——B200,在同一个芯片上集成了两个GPU。Blackwell引入第二代Transformer引擎,支持FP4和FP6,将算力、带宽和模型参数规模提高了一倍。B200有2080亿个晶体管,是H100的2倍多;FP4算力高达20PFlops,是H100的5倍。

B200的两块小芯片之间互联速度高达10TBps,大幅提高了处理能力。

GB200亮相,集成了1个GraceCPU和2个B200GPU。与72个H100相比,GB200NVL72的推理性能提升达30倍,成本和能耗最多能降低25倍。

1)在GPT-3基准测试中,GB200性能是H100的7倍,训练速度是H100的4倍;2)GB200NVL72将36个GraceCPU和72个BlackwellGPU集成到一个液冷机柜中,训练性能达到720PFlops,推理性能达到1.4Eflops;一个GB200NVL72机柜就可以训练27万亿参数的模型。

推出NIM(NvidiaInferenceMicroservice,推理微服务),旨在成为AI软件的“晶圆厂”。NIM使得部署AI变得更容易,且推理所需算力更少。未来,开发者可能不再需要编写代码,而是通过与AI交流,调动一系列NIMs来完成训练和应用部署。

与苹果强强联合,OmniverseCloud流可以传输至VisionPro。Omniverse是英伟达用于3D协作和数字孪生的平台。通过英伟达Omniverse的云API和图形交付网络(GDN),企业现在可以轻松将3D应用的OpenUSD(交互式通用场景描述)实时串流到VisionPro混合头显中。例如,设计师可以佩戴VisionPro在Omniverse平台的应用程序内进行汽车设计。

宣布人形机器人项目GR00T。基于新的通用基础模型,GR00T驱动的人形机器人能够理解并学习文本、语音、视频甚至现场演示的输入,然后模拟人类行为、在现实世界中导航和交互等。此外,英伟达还推出新型“机器人大脑”计算芯片JetsonThor,可在FP8精度下提供800TFlops算力。

我们认为英伟达正逐步从一个芯片公司转型为一个以生态系统建设和行业合作为手段,以前沿技术为驱动力的生态公司。基于最强算力芯片,与各行业龙头企业合作,如亚马逊、比亚迪、新思科技等等,将自身软硬件技术与垂直行业与应用场景深度结合;同时,布局前沿方向,升级Omniverse、发布NIM服务、启动GR00T项目,英伟达的AI生态系统已然逐步成形。

建议关注:浪潮信息、紫光股份、工业富联。

风险提示:AI技术突破不及预期、宏观经济增长不及预期、国际环境变化。

  • 浏览记录
  • 我的关注
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
本站郑重声明:所载数据、文章仅供参考,使用前请核实,风险自负。
© 2008 北京济安金信科技有限公司 北京合富永道财经文化传媒有限公司
京ICP备12044478号 版权所有 复制必究
本站由 北京济安金信科技有限公司 提供技术支持