摩根士丹利已使用GPT-4进行投资策略分析,高盛也用大型语言模型做风险管理分析……
在ChatGPT成为华尔街投行的新装备时,更快、更准、更定制的金融大模型来了——彭博社发布针对金融领域500亿参数的大语言模型BloombergGPT,在处理金融专业任务上的表现,比通用大模型实现了大幅提升。
今年以来,大模型席卷金融业,一夜之间,几乎所有金融场景都在探索适配大模型接口。然而,理想丰满,现实骨感。有大型金融机构IT部门人士比喻,金融大模型从战略规划到部署落地,有着从“卖家秀”走到“买家秀”的差别。大模型在金融场景落地的最后一公里并不好走,现在谈效果为时尚早。
在接受证券时报记者采访时,各类参与主体均多次提到“生态共建”,期待联合多方力量解决算力、算法、数据、安全、监管等问题,共赴这场金融大模型的“开卷考试”。
大模型席卷金融业
随着大模型走向千行百业,一个共识逐渐形成:将通用大模型与垂直领域的专用大模型相结合,可以有效提升大模型的适配性。继ChatGPT后,人工智能将在垂直应用领域掀起第二波浪潮。
巨浪席卷而来,国内金融机构和大模型厂商们也在争分夺秒抢滩。
今年8月份金融机构发布半年报,大语言模型还停留在高管们的口头报告中。如今,它们已经化身一张张采购订单投向市场。金融机构的采购需求,从算力储备到模型采购,从云计算资源到数据治理,覆盖了人工智能产业链上的各类厂商。
10月10日,工商银行发布“NLP大模型产品新技术采购项目”入围结果,智谱华章入围;同月,招商银行千亿级预训练基础大语言模型招标中,上海稀宇科技夺标;11月10日,百度网讯、中国电子系统技术有限公司联合拿下邮储银行“超大规模预训练模型金融场景应用系统软件开发”项目包。在各大保险集团内部,针对大模型准备的GPU服务器采购、数据治理服务项目的招标,也在紧锣密鼓地推进。
据了解,金融机构部署大模型主要有三种方式。
第一种,是独立全栈自研,强调独立自主可控。这是一些AI基础较好的大型金融集团布局大模型的路径之一。
第二种,在通用大模型或者专业大模型基础上进行微调,结合自身海量数据和丰富场景,形成契合自身需求的金融大模型。
第三种,从云端调用,按需接入各类大模型API(应用程序编程接口),完成私有化部署。当前,百度的文心一言、阿里的通义千问、腾讯的混元大模型,都有面向金融行业构建生态合作伙伴的部署。
拥有众多子公司和业务场景的多元化金融集团,通常选择多种方式齐头并进,并在内部形成赛马机制;一些科技基础相对薄弱的中小金融机构,通常采用第三种方式,以控制成本。
面对庞大市场需求,各大厂商纷纷开发金融大模型,一些金融科技公司也凭借过往在金融领域的积累,发布适配各类业务场景的垂直类金融大模型。
市场火热之下,今年国内金融领域垂直大模型竞相出炉。5月,度小满推出国内首个开源的千亿级中文金融大模型“轩辕”;8月,马上消费发布首个零售金融大模型“天镜”;9月,蚂蚁集团针对金融产业深度定制的金融大模型AntFinGLM亮相,并在集团内的财富、保险平台上内测;10月,恒生电子金融大模型LightGPT升级,在专业金融数据集、合规性要求和部署方式上实现突破,并宣布三款大模型应用产品开放公测。
度小满首席技术官许冬亮在近期一场公开活动中感叹:“今年以来,围绕生成式AI的浪潮,每周都有新迭代、新发展,每天都能看到真实的效果,有点爆炸式发展、奇点临近的感觉。”
如雨后春笋般出现的金融大模型,也给金融机构造成了选型困难。金融业需要什么样的大模型?今年9月,由中国信通院牵头,联合腾讯云、科大讯飞、恒生电子、马上消费等40多家企业共同编制了国内首个金融行业大模型标准。该标准涵盖了金融大模型的关键能力要求,包括场景适配度、能力支持度和应用成熟度三大方面。此外,标准还从金融行业特性出发,覆盖了投资研究、投资顾问、风险管理、市场营销、客户服务等多个应用场景,并详细规定了金融大模型在数据合规性、可追溯性、私有化部署、风险控制等方面的要求。
“值得重做一遍
金融服务链”
和传统人工智能相比,大模型能为金融行业带来什么增量价值?
如果说传统人工智能是专用的、烟囱式的、孤立的,在大语言模型时代,人工智能已经可以借助专业知识和推理能力,在特定领域完整地执行一段任务。
不久前,一批数字员工被引入太保集团审计中心,在审计检查、公文质检、咨询问答等工作环境下进行能力试点,这些数字员工与真实员工进行人机编队,共同作业。太保数智研究院院长王磊日前表示,大模型会带来新的范式革命,和传统人工智能的巨大区别体现在思考模式、行动力、通用性和边际成本等方面。“大模型出现后,实现了对人、对岗位建模的可能性。”
在消费金融领域,大模型能力也在显露头角。今年8月,马上消费发布“天镜”大模型时披露,经过近3个月的使用,新的智能客服对客户意图理解准确率达到91%,相较于传统人工智能的68%有明显提升;客户参与