行业大模型重塑千行百业 "百模大战"加速数商洗牌
时间:2023-07-20 00:00:00来自:证券时报字号:T  T

从金融、交通,到教育、医疗,一段时间以来,各个行业大模型如雨后春笋般出现在世人面前,让“大模型”这个几个月前还显得有些缥缈的新事物拥有了落地的根基,展现了“AI赋能千行百业”的潜力。

行业大模型,指的是在特定行业领域应用的大型语言模型。与以ChatGPT为代表的通用大模型相比,行业大模型通过对垂直细分领域的数据进行更有针对性的训练和优化,从而更好地理解行业的语义和规范,更有效地执行专业性更强的任务。

“通用大模型就像一个综合成绩很好的高中生,具备了基本的智商和能力,可以回答和解决很多基础问题。行业大模型更像学习了专业知识的本科生甚至硕博生,通过注入行业知识,使之具备解决专业问题的能力。”上海数库科技首席科技官曹峰在接受证券时报记者采访时做了这样生动的比喻。目前,业内普遍认为,未来只会有两三家“独大”的通用大模型,并涌现出无数更贴近产业需求的行业大模型。

在此背景下,高质量的行业知识库和训练数据便成了制胜的关键。多名接受证券时报记者采访的业内人士表示,行业大模型的火热将为数据服务商带来发展机遇,助推数据收集、数据存储、数据标注、数据治理等垂直行业的持续繁荣。不过,随着业务门槛的提高、专业需求的多样化,以及平台巨头持续发力AI基础数据服务,行业或将迎来洗牌。真正能站稳脚跟的,是那些能切实解决行业痛点,拥有数据资源积累和技术壁垒,并快速将自身业务与大模型相融合的数据服务商。

行业大模型纷纷亮相

“华为云盘古大模型不作诗,只做事。”今年7月7日,华为常务董事张平安在华为开发者大会2023(Cloud)上说道。张平安介绍,华为云盘古大模型3.0包括“5+N+X”三层架构,即5个基础大模型、N个行业大模型和X个细分场景模型,将深耕行业,致力于重塑千行百业。

去年11月底,由美国OpenAI公司推出的ChatGPT聊天机器人轰动全球。这款会聊天、能作诗的大型语言模型能学习人类知识、与人类交流互动,实现了“智能涌现”。此后,国内外科技巨头纷纷入局通用大模型赛道,一场大模型领域的“军备竞赛”大幕由此拉开。

然而,要成功训练一个性能良好的通用大模型,需要强大的算力和数据支持,也离不开密集的人才储备,是一场“烧钱游戏”。据国信证券估算,GPT-3的单次训练成本就高达140万美元,对于更大的大语言模型,训练成本则介于200万美元至1200万美元之间。这对于大厂而言尚可接受,对于中小企业而言则过于昂贵。

“一方面是受限于算力、人才和资金储备,通用大模型注定是少数玩家参与的赛道;另一方面,一些面向企业客户的场景,往往需要综合考虑性能与成本,即投入的模型研发成本、模型推理成本与产生的价值是否匹配,而且一些行业的私域数据还涉及到数据安全和隐私保护等问题。这自然就促使大家更多关注行业大模型了。”锦秋基金执行董事臧天宇在接受记者采访时表示。

易华录数据要素科技创新研究院院长林镇阳在接受证券时报记者采访时说,通用大模型在垂直行业应用存在整合不足的问题,在解决医疗、法律等特定行业问题时准确度低,难以商用,研发行业大模型是推动大模型规模化落地应用的迫切需求。“大模型不应该是空中楼阁,未来一定是要落地,走向行业应用的。这是一件好事,也是正常的商业逻辑。”华创资本创始合伙人王道平在接受证券时报记者采访时表示。

与此同时,开源大模型的发展也为行业大模型提供了快速实现的可能性。臧天宇介绍,当前大多数行业大模型都是基于特定场景的数据,依靠开源大模型进行微调,从而在一些任务中取得不错的效果。“如果都是从零开始训练行业大模型的话,付出的成本太高。可以说,开源模型给过去在垂直领域形成了数据积累的玩家提供了一个更好的起点,也可以说是便宜得多的‘入场券’。”臧天宇说。

此前,行业还在热烈讨论“中国需要什么样的大模型”,如今,国内互联网巨头都用自己的行动给出了答案:百度与行业头部企业或机构共建了11个行业大模型,在能源、金融、航天、制造、传媒等领域探索落地;阿里云联合7家顶尖生态伙伴推动大模型在不同行业落地应用;腾讯云则与传媒、文旅、金融、政务、教育等行业的头部企业探索了超50个行业大模型的应用解决方案……

巨头亲自下场研发行业大模型,是否意味着中小厂商已无机会?或许未必。一家头部大模型研发公司的技术负责人向证券时报记者表示,未来大模型将应用于千行百业,这是一个巨大的蛋糕。公司研发并推出行业大模型,更多是希望让市场看到大模型在不同行业的应用前景,吸引更多垂直领域玩家加入。“我们希望构建大模型生态系统,帮助开发者开发各种AI原生应用,让各行各业享受到大模型的技术红利。”该技术负责人说。

数据要素正变得越来越重要

算力、数据、算法,被称作人工智能的“三驾马车”。一直以来,行业对于算力和算法的关注度远远高于数据。尤其在今年年初,各大国内科技巨头对标ChatGPT逐鹿中文版通用大模型,高性能芯片的短缺带来“算力荒”,算力要素成为了市场最关注的热点。然而,进入到行业大模型的“大航海时代”

  • 浏览记录
  • 我的关注
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
本站郑重声明:所载数据、文章仅供参考,使用前请核实,风险自负。
© 2008 北京济安金信科技有限公司 北京合富永道财经文化传媒有限公司
京ICP备12044478号 版权所有 复制必究
本站由 北京济安金信科技有限公司 提供技术支持