英伟达、云厂商们也没有H100余粮了,未来全球顶级芯片缺口达40多万张
时间:2023-08-07 00:00:00来自:AI前线(微信公众号)字号:T  T

对人工智能的巨大需求也暴露了用于开发和部署人工智能模型的强大芯片的全球供应链的局限性。GPU是一种关键的硬件,可帮助运行训练和部署人工智能算法所涉及的无数计算。行业分析师表示,持续的GPU紧缩已经影响了大大小小的企业,包括人工智能行业的一些领先平台,并且至少在一年或更长时间内可能不会出现有意义的改善。

AI圈里,苦H100GPU久矣OpenAI联合创始人兼职科学家AndrejKarpathy近日发文称“目前硅谷最热门的八卦,就是谁谁又买了多少块H100GPU。”

特斯拉掌门人马斯克曾经向整个科技行业发出警告,称巨大的GPU危机即将来临。今年4月,马斯克曾发表推文说,“如今不管是人是狗,都在疯狂购买GPU。”而巨大的需求,势必引发严重的供应短缺。时间快进到当下,每个人都想搞自己的AI产品和业务。面对这样一场声势浩大的AI洪流,即使是像英伟达这样的全球巨头也难以及时制造出充足的GPU货源。

市场对高性能GPU(特别是英伟达H100)的需求仍在猛增。截至2023年8月,科技行业正经受英伟达H100短缺的严重折磨。GPU供应不足,正在对严重依赖其进行模型训练和推理任务的AI厂商造成重大影响。

微软最近的年度报告显示了人工智能芯片可能长期短缺的最新迹象。该报告首次将GPU的可用性确定为投资者可能会遇到的的风险因素。

微软写道:“我们将继续寻找和评估扩大数据中心位置和增加服务器容量的机会,以满足客户不断变化的需求,特别是考虑到对人工智能服务不断增长的需求。”“我们的数据中心取决于许可的可建设土地、可预测的能源、网络供应和服务器,包括GPU和其他组件。”

微软对GPU的认可凸显了计算能力的获取如何成为制约AI发展的关键因素。该问题直接影响正在构建人工智能工具和产品的公司,并间接影响希望将该技术应用于自己目的的企业和最终用户。

来自OpenAI公司的AndrejKarpathy表示,“目前硅谷最热门的八卦,就是谁谁又买了多少块H100GPU。”有趣的是,AWSLambdaCEOStephenBalaban也提到,“Lambda将于今年年底之前上线数千块H100——如果您需要64块或者更多的H100,请提前私信预约。”没错,这宝贝现在就是这么紧俏。

包括Quora公司CEOAdamD’Angelo和OpenAI创始人SamAltman在内的多位AI领导者,也都表达了自己对于GPU短缺问题的担忧。OpenAI透露,GPU供应不足阻碍了他们的短期计划,包括模型微调和划拨专用容量。也许这正是OpenAI目前拘囿于GPT-4,无法进一步履行其大语言模型开发承诺的原因之一。

谁,需要多少?不只是AI公司,其他几类组织也对H100GPU有着迫切需求。其中既包括研究大语言模型的初创企业,也有Azure、GCP和AWS等云服务供应商(CSP),CoreWeave、Lambda等大型私有云,以及马斯克的特斯拉等其他知名公司。说到马斯克,他自己已经抢先一步购买了数千块英伟达GPU,给自己的xAI储备“战略物资”。面对这块人人抢夺的现状,马斯克甚至曾劝Altman买下ai.com域名来换取GPU资源。

据报道,GPT-4的训练过程可能用到了约1万到2.5万块英伟达A100。至于GPT-5,马斯克估计可能需要3万到5万块H100。2023年2月,摩根士丹利预测GPT-5大概需要使用2.5万个GPU。面对如此庞大的GPU需求,加之英伟达又是市场上唯一可靠的供应商,似乎整个AI世界的运转都着落在了这家显卡巨头身上。

根据最近一篇博文,OpenAI预计需要约5万块H100GPU,InflectionAI的采购计划则大致在2.2万块左右。Meta的需求尚不明确,但有传言称他们可能需要约2.5万个GPU,且实际上限甚至可能超过10万块。

目前硅谷最热门的八卦,就是谁谁又买了多少块H100GPU。近日,在Twitter上广为流传的一张“我们需要多少张GPU”的图片引发了网友们热议。

包括Azure、GoogleCloud、AWS和甲骨文在内,各大主要云服务供应商可能各自需要约3万个GPU。AWSLambda和CoreWeave等私有云预计共需10万个GPU。其他专注于AI业务的厂商,例如Anthropic、Helsing、Mistral和Character等,可能分别需要约1万个GPU。

无法在云端按需获取A100了。

根据马斯克的说法,GPT-5可能需要3万-5万张H100。

值得注意的是,这些数字只是近似估值,云服务商及其最终客户间可能存在一些需求重合。综合来看,H100GPU的市场总需求可能在43.2万块左右,按每个GPU价格3.5万美元计算,意味着产品总价值高达150亿美元——没错,全部要被英伟达赚走。

此外,值得一提的是,上述估算还不包括字节跳动(TikTok)、百度和腾讯等中国公司。这些公司可能对H800这款专为中国市场设计的GPU同样有着大量需求。

尽管前景充满不确定性,但业界仍希望随着供应增加和GPU技术的进步,最终逐步缓解短缺问题。例如,英伟达一直在谈论发布A800——号称能在AI模型构建方面提供同样的算力,只是目前还没有可靠的实证。而在需求缺口得到填补之前,AI公司只能探

本站郑重声明:所载数据、文章仅供参考,使用前请核实,风险自负。
© 2008 北京济安金信科技有限公司 北京合富永道财经文化传媒有限公司
京ICP备12044478号 版权所有 复制必究
本站由 北京济安金信科技有限公司 提供技术支持