距离ChatGPT横空出世逾四个月后,被视为AI大模型训练算力基础设施的GPU也在国内迎来需求暴增。
据公开报道,中国互联网巨头们自今年初开始向全球GPU龙头英伟达大量采购GPU,其中仅字节一家采购金额便超过10亿美元,接近2022年英伟达在华销售的商用GPU收入总和。
订单量暴增的背后,大模型训练的需求被认为是主要推动因素。据民生证券不完全统计,截至今年4月末,国内至少已经发布了30多款大模型产品,涉及各类科技企业,既包括BAT在内的传统互联网巨头,也涵盖了商汤、科大讯飞等国内AI独角兽企业,以及搜狗创始人王小川等企业高管为代表的“创业派”。
一家国内AI企业人士告诉《中国经营报》记者,以目前主流的ChatGPT-3.5大模型为例,OpenAI便部署了近3万颗GPU芯片作为算力集群,而如果要迭代版本,GPU数量可能还得倍数级增长。“国内的基础大模型算力要求会低一些,但由于参与竞争的企业数量多,GPU总需求规模会非常巨大。”该人士表示。
在此背景下,GPU正迅速崛起为当红产业。ICInsights数据显示,2015至2021年全球GPU芯片市场规模增速超过20%,2021年全球GPU芯片市场规模超过220亿美元。产业智库甲子光年预计,2023年中国AI芯片市场规模将达到557亿元,其中GPU在AI芯片市场占比约为90%。
英伟达暂无敌手
GPU全称GraphicProcessingUnit,译称图形处理单元,最早作为计算机显卡的核心芯片出现,专属用于进行复杂图像数据的计算。随着该功能性的需求进化,GPU逐渐成为计算机图形渲染、游戏图形处理领域不可或缺的角色。
“与CPU相比,GPU拥有更多的独立计算单元,也就是‘核数’。”CHIP全球测试中心中国实验室主任罗国昭告诉记者,因此,相比于要承担大量系统管理、控制及程序执行功能的CPU,GPU的角色更为单纯,就是计算,故而特别适合作为提供AI算力的基础核心器件。
公开信息显示,与半导体产业链一样,GPU也包括从IP、设计、软件生态到应用的完整上下游环节。其中,设计环节被认为是主导GPU能力的领域,目前全球GPU设计企业主要包括英伟达、AMD两大巨头,尤其是英伟达,在AI训练芯片领域,其市场份额超过了90%。
据记者了解,AI训练GPU是针对人工智能大模型训练任务而设计的特定GPU。AI模型训练通常涉及大规模的矩阵计算和深度神经网络的训练,这些计算密集型任务可以通过GPU的并行计算能力加速。AI训练GPU通常具有更高的算力和更大的显存容量,以支持大规模模型和数据集的训练。
“英伟达的几款专用芯片是目前针对大模型训练的性能最优的算力平台,没有竞争者。”半导体产业分析师季维告诉记者,这也造成了全球大模型厂商都在求购英伟达专用GPU用于数据训练的局面,而不单单是中国厂商。
季维向记者表示,从产业健康度而言,一家独大并不是良好的产业生态,但在大模型训练领域是个特例,因为尚未出现有力的竞争者。记者注意到,英伟达专用GPU的供不应求,也助推其日前市值一度突破1万亿美元,成为首个达成这一成就的芯片企业。
中国产业链赶超
虽然在用于AI大模型训练的专用GPU市场,中国厂商还未有足够能力涉足,但巨大的算力需求所带来的市场动力,已让中国半导体产业走在追赶之路上。
通用GPU是布局最早的领域。在云计算业务的推动下,国内四大互联网巨头以每隔一年的速度先后推出通用GPU芯片。其中,2019年,阿里率先发布了AI芯片含光800;2020年,百度量产第一代AI芯片昆仑;2021年,腾讯发布视频处理芯片“沧海”和AI芯片“紫霄”。2022年7月,字节也正式确认了其在自主造芯方面的布局,覆盖视频平台、信息和娱乐应用等领域。
季维告诉记者,区别于用于AI大模型训练的高性能GPU,通用GPU更多用于各种通用任务,包括具有高度的并行计算能力和大规模的计算核心,也可以同时处理大量数据,提供较高的计算性能和吞吐量。目前,国内厂商推出的通用GPU更多用在大模型的推理过程中。
“虽然性能上目前通用GPU还无法替代AI训练GPU,但二者差距也在缩小,通用GPU也可以用于AI训练任务,并通过适当的软件和优化实现相对较高的性能。”季维表示,百度CEO李彦宏今年3月便曾在亚布力中国企业家论坛上透露,昆仑芯片现在很适合做大模型的推理,将来会适合做训练。
与此同时,国内GPU专业赛道也开始涌现燧原科技、天数智芯、摩尔线程等一众新势力明星公司。以摩尔线程为例,其量产的“苏堤”和“春晓”两颗全功能GPU芯片,可以同时完成图形渲染、视频编解码、AI计算加速、物理仿真、科学计算四大功能。
“这两年,我国GPU产业整体还是有了长足进步,横向比尚有差距,但跟我们自己比,已经出现很多具备创新力的新兴厂商,这一点是我们应该看到的。”罗国昭表示。
国产化挑战待解
随着厂商纷纷入局,中国GPU产业已开始漫漫征程,与此出现的挑战,也成为当前全产业发展必须面对的问题。
在业内看来,国产化率仍是我国GPU产业需要解决的首要问题。据官方发布的相关数据显示,2019年,中国芯片的自给率仅为30%左右,其中涵盖GPU在内的可编辑逻辑器