大模型狂奔一年,该从追赶GPT-4的目标中走出来了
时间:2024-02-07 18:06:34来自:第一财经字号:T  T

“如果说2023年大家可能都是朝着一个目标,就是去追赶GPT-3.5或者GPT-4的话,未来不同的机构、企业和团队会朝着不同的方向去发展,更加多样化。”上海人工智能实验室领军科学家林达华表示。

2023年是属于大模型的一年,OpenAI发布的GPT-4成为科技界的一个里程碑,其接近人类的智能让世界为之瞩目,而对于国内的大模型来说,2023年是跟随并追赶GPT-4的一年,《北京市人工智能行业大模型创新应用白皮书(2023年)》显示,我国10亿参数规模以上的大模型已超过200个,百模大战之下,企业期待复制“大力出奇迹”。

在交流中行业人士认为,过去一年国内大模型让人印象深刻的是“追得很快”,与GPT-4的距离有了明显的缩小,但应谨慎乐观的点在于OpenAI也在迭代。不过,国内大模型该从追赶GPT-4的目标中走出来了,其能力也到了一定高度,具备了向某些行业渗透的条件。

一方面,会有一些企业、机构继续寻求基础技术提升,另一方面,会有更多参与者探索向行业落地,“我相信这些探索能够将大模型从去年能力的展现,变成真正能变革生产力的一个工具,这两方面今年都会有巨大的竞争。”林达华说。

展望2024,ChatGPT核心研发科学家、前OpenAI研究员肯尼斯·斯坦利和乔尔·雷曼稍显冷静,他们认为2024可能会面对的一个很大的问题是,人工智能会延续之前的发展势头,还是出现一些减缓,“2024年可能并不像我们期望的那样具有划时代的意义”。

“追得还是蛮快”

对国内大模型来说,追赶OpenAI是过去一年最大的命题,也是行业内外都在关注的一个话题。

站在当下来看,至少在对标ChatGPT-3.5的版本上,国内大模型接下了这个挑战。在对谈中第一财经问及过去一年国内大模型的突破,林达华表示,“印象深刻的进步就是追得还是蛮快。”

“ChatGPT刚出来时,觉得我们离3.5的版本有较大的距离,但是看到2023年下半年发布的模型,尤其是一些表现不错的头部模型,在我们主客观以及公开的评测中都对ChatGPT-3.5有了比较全面的超越。”林达华发现,国内的厂商和研究机构追赶ChatGPT的周期,比他一年前的预期更快,没到一年基本已达到ChatGPT-3.5的水平。

当然,目前国内大模型还未完全追赶上GPT-4,但林达华认为,我们的距离有了较明显的缩小,“因为GPT-4是一个相对固定的点,不断往这边追,距离一定是越来越小的。总体来看,国内最新发布的一些模型表现让人有惊喜,看起来事情会比原来预期会更乐观一些。”

在国内大模型与GPT-4的客观比较上,上海人工智能实验室旗下大模型评测体系司南(OpenCompass2.0)近日发布了对部分主流大模型的评测结果,可以作为一个参考。

在百分制的客观评测基准中,GPT-4Turbo(升级版GPT-4)在各项评测中均获最佳表现,达到61.8分的及格水平。另外,分析结果显示,不少国内厂商近期新发布的模型在多个能力维度上正在快速缩小与GPT-4Turbo的差距,包括智谱清言GLM-4、阿里巴巴Qwen-Max、百度文心一言4.0的排名较为靠前,反映了这些新发布的模型具有较为均衡和全面的性能。

根据评测结果,推理、数学、代码、智能体是国内大模型的短板,但在主观评测中,国内模型在中文场景下相比海外模型具有优势,在中文语言理解、中文知识和中文创作上,国内商业模型相比GPT-4Turbo具有极强的竞争力。

不过,在追赶过程中,GPT-4并非一成不变,“OpenAI的能力也在进步,后续会发布的GPT-5也一定会超越前一代,不会完全停下来等待大家追赶,国内和国外的模型都需要往前去拓展自己的能力。”林达华表示。

复旦大学计算机科学技术学院教授、上海市数据科学重点实验室主任肖仰华同样对第一财经表示,如果限定一下,如在两三年做到GPT-3.5的版本和GPT-4的版本,是早晚能追上的事,但问题是对方也在迭代。他表示,“我们总体上还是属于跟随OpenAI的阶段,即便从谷歌发布的新的大模型来看,要追赶OpenAI也是很不容易的一件事,尤其是对于通用人工智能来说。”

“我们一直担心的一个问题是,在通用人工智能这个赛道上只有第一没有第二,因为它一旦突破了这个拐点,后面的增长是指数级的,而且有明显的先发优势,可以更快利用真实用户的反馈,跑在一个快速迭代的道路上,且它已经形成了一定程度的商业闭环。”肖仰华说。

天工智能联席CEO兼昆仑万维2050全球研究院院长颜水成此前对第一财经表示,在国内以前研究大模型的团队相对较少,主要原因是对算力资源的需求非常巨大而商业化前景不是非常明朗,2023年由于ChatGPT的成熟让大家感觉AGI的时代已经来临,国内在大模型上的投入产生了巨大的变化。

目前国内通用大模型的发展已经取得了一定的进展,但与OpenAI等国际领先企业相比,仍存在一定的差距,“OpenAI在自然语言处理领域的研究和应用已经积累了多年的经验和技术优势,其团队成员中也拥有众多的顶尖科学家和工程师。相比之下,国内的大模型研究和应用还比较年轻,需要更多的时间和努力来追赶。”颜水成说。

“梦幻般的一年”

抛开追赶不谈,大模型行业在过去一年也有诸多技术

  • 浏览记录
  • 我的关注
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
本站郑重声明:所载数据、文章仅供参考,使用前请核实,风险自负。
© 2008 北京济安金信科技有限公司 北京合富永道财经文化传媒有限公司
京ICP备12044478号 版权所有 复制必究
本站由 北京济安金信科技有限公司 提供技术支持