10年后回忆2023年,人们该怎么理解ChatGPT出现后的AI涌现?北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军很早就有相关思考。“今天大家对AGI(人工通用智能)和强人工智能太轻描淡写了,绝大多数人没有认真想这个词意味着什么。”黄铁军表示。
9月的珠海暖阳下,第一财经记者见到了前往参加博鳌亚洲论坛国际科技与创新论坛第三届大会的黄铁军。业界人士乐于讨论大模型商用的当下,黄铁军倾向于目光看得更远,并思考更终极的问题。他大约10年前就想明白AGI会出现,且在约2045年可以做出来。他告诉第一财经记者,AGI是全面超越人类智能、有自我意识的超级智能,并非很多人理解的通用型人工智能。AGI要不要做,是需极其慎重的事。而AI对人类的影响和预备性措施,早就应该考虑。
黄铁军的想法代表了一部分学者和业界人士的担忧。今年3月,生命未来研究所(FutureofLife)发布了一封《暂停大型人工智能研究》的公开信,呼吁所有AI实验室立即暂停比GPT-4更强大的AI系统的训练,暂停时间至少6个月。马斯克、苹果联合创始人SteveWozniak等知名科技人士签署了公开信。黄铁军也签署了,他认为“这是一种呼吁,至少提醒大家前面有危险”。
黄铁军认为可能存在的危险包括,AI智力超越人类后的决策权问题,以及面对强大的AI时,人可能出现的“躺平”心态。但黄铁军并不反对AI,或者说认为“不可能拦住人群不要往前跑”。他认为,AI水平赶超后或许能解决人类束手无策的复杂问题,比如星际旅行。面对AI,他认为人们要做的最重要的事情或是适应。
智源研究院在科技部与北京市的指导下成立,定位为非盈利科研机构,独立于高校和商业之外,但智源研究院向业界输出的骨干,仍助力奠定国内大模型发展的基础。智源研究院还是国内最早迈上大模型路线的机构,2021年,黄铁军在悟道1.0发布会上称,AI从“大炼模型”逐步迈向“炼大模型”,“大模型”的中文表达就此诞生。
作为国内AI最早的推行者之一,站在学界与业界的交界,黄铁军的见解有一定代表性。他将大模型比喻成“发电厂”,将大模型提供的智力比喻为“电”,并认为全世界可能只需要屈指可数的几个大模型。
“就像法拉第用一个线圈在磁场中旋转,AI也能产生‘电流’了。”黄铁军如此形容大模型出现后的当下。与第一财经记者的对话中,他还谈及大模型如何改变AI公司的商业逻辑、AI产业未来的形态、AI可能抵达的远方和人类与AI共处的未来。
“全世界可能只需几个大模型”
第一财经:国内掀起“百模大战”,这是企业不得不抓住的风口还是应对竞争的被动应对?匆匆入局大模型,您认为业界是否缺乏某些思考?
黄铁军:总的来说是因为大模型在人工智能、信息系统里发挥明显作用,所以各家都会做。长远看,不需要那么多大模型,全球可能只需要屈指可数的几个大模型体系,但这有一个发展过程。就像现在的移动互联网,主要是iOS和安卓两个生态,互联网最初也有很多局域网,发展到一定程度才融合成一个大体系,大模型这种提供智力服务的基础设施将是网络化的。今年上半年,国内出现“百模大战”,现在(新大模型数量)已经回落,长远看还会收敛,这是商业正常现象。
在以云为载体的智力时代,要研究的技术还很多,不是某个公司、某个团队训练出一个模型这种概念。就像电网用了100多年,还在研究如何改进电力技术,最终呈现出“一度电花多少钱”的结果。将来,AI也将变成“一度智力”花多少钱、背后多少成本的问题,这是一个比技术学科还大的领域,需要大学、非盈利机构参与,从各角度改进。就像法拉第用一个线圈在磁场中旋转,产生电流。现在AI也产生“电流”了。从法拉第实验产生电流开始,到今天能随时用电,中间有太多事情要做。
第一财经:语言大模型兴起后,原本细分领域AI公司的工作方式会不会改变?
黄铁军:变化很大,以前AI公司是产品思维,训练一个模型,比如CV(视觉)模型,整合软硬件卖人脸识别服务。就像PC时代和移动互联网时代(的商业模式演变),PC时代是卖PC、卖软件,移动互联网时代则出现iOS、安卓的App,平台开始起关键作用。不过,目前很多大模型还是持产品思维,(厂商)认为大模型可以提升业务(效率)。这还是初级阶段,不是长期状态。
归根结底,大模型能力强意味着很多因素,例如数据尽可能全、尽可能新。而现在做大模型,(厂商)抓一些数据学习后就开始卖,数据少,智力水平不高。大模型要像电厂一样,采用多种手段发电,让大家直接用电,而不是靠卖电机给用户。(大模型)一定是网络化的运营服务产业形态。
大模型现在好像已经很大了,但即便是1万亿参数,也不过是人脑的1%,况且人脑的参数还比大模型的参数复杂,未来大模型参数量肯定比现在大很多。最新数据也要进入大模型体系,这不是随便一个创业公司承担得了的。大模型应该像电力系统,各方做好一端,最后并入电网、供给服务。大模型不同于此前CV等细分领域大模型,最根本是在于它有吸纳一切的能力,它作为载体,能把生产资料和下游用户连成一个体系。
第一财经:大模型如果变成发电厂