数据要素化风口之下,数据孤岛等一系列限制金融机构数字化转型的瓶颈有望迎来解决契机,这也催生新的技术服务商加紧跑马圈地。
央行科技司近期披露,已在北京、江苏、浙江等14个地区组织商业银行、清算机构、非银行支付等开展金融数据综合应用试点。其核心是探索人工智能、数据、物联网、隐私计算等新一代信息技术,在安全合规的前提下推进金融数据高效治理、安全共享,实现跨行业数据融合应用,充分激活数据要素潜能。
《中国经营报》记者获得的一份发自央行北京营管部的文件显示,上述试点由央行各地分支机构推动,将在6月中旬截止申报。“我们已经在计划与合作银行申报试点,如果入选,预计能达成比较重要的业务示范效应,有助于吸引更多合作方和投资方。”一位上海隐私计算服务商高管向记者透露。
记者了解到,如何让数据要素合规流动是当下金融行业面对的巨大痛点,也蕴含着无限创新的可能,这让主要解决数据共享安全问题的“隐私计算”成为关键技术。虽然技术和市场仍处于早期,但大厂和创业公司已跃跃欲试,颇有些两年前区块链风起时的势头。此时,被行业称作“人工智能最后一公里”的赛道会成为一个多大规模的市场,相关技术范式会否成为数据要素化过程中的“技术基石”等问题亦备受各界关注。
赛道火热
根据今年4月发布的《腾讯隐私计算白皮书2021》定义,隐私计算(Priva-cyComputing)是一种由两个或多个参与方联合计算的技术和系统,参与方在不泄露各自数据的前提下通过协作对双方数据进行联合机器学习和分析。
在翼方健数CEO罗震的印象里,2019年到2020年初时,隐私计算赛道只有几家竞争者。“很小众的市场,大家互相都知道,但今年已飙升到上百家。”他表示。
“市场规模起得很快。”星云Clu-star副总裁许振主管星云隐私计算技术的场景落地,他发现,今年以来一些银行隐私计算技术底座的一期项目投入多则可以达到数百万。此外,该技术服务在广大外部数据交易环节的渗透率保守估计也有10%。以去年数据交易市场100亿元左右的市场规模算,隐私计算今年至少可以分走10%的份额。
“过去我们给金融机构讲隐私计算,主要停留在概念和理论上。今年已经是金融机构拿着场景需求来找我们,一起深入隐私计算的业务解决方案了。”富数科技合伙人、高级总监黄奉孝告诉记者。
去年以来,除了最初布局隐私计算的几家服务商,不少区块链公司也开始转战这一赛道。“除了底层密码学技术有一定相通性外,更重要的是隐私计算应用场景更多、生意更好做。”一位行业第三方智库人士表示。
富数科技、星云Clustar和翼方健数是行业里较为知名的三家第三方隐私计算服务商,分别面向金融和医疗领域——这也是目前隐私计算应用最广泛的两大场景。据记者了解,金融机构、运营商、政务、医疗科研是目前隐私计算技术主要的应用方向,而金融场景大约占据了七到八成的市场份额。
除此之外,巨头也在加紧布局。记者注意到,国家工业信息安全发展研究中心近期发布的《中国隐私计算产业发展报告(2020—2021)》显示,中国的隐私计算专利申请量在过去两年飞速上升,其中拥有专利数最多的前三家公司分别为蚂蚁集团、阿里巴巴及微众银行。
而赛道风起亦有其特殊的政策背景和技术背景。
首先是政策驱动。2020年4月,中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》,将构建数据要素市场上升为国家政策。在黄奉孝看来,数据作为新的生产要素,其性质在发生质变。这也推动了整个行业的技术重心从“数据获取与存储”升级到“数据开放共享”。“过去十年的数据安全重在防御,未来十年的数据安全重在流通。从各地政府到银行,响应政策进行创新探索的动力都在增长。”
而在技术侧,则是算力性能的快速迭代。由于涉及多方计算,此前隐私计算的性能较慢,一个联邦学习模型训练下来往往需要几个小时。但去年以来,密文训练和明文训练的差距不断缩小。中国信息通信研究院(以下简称“信通院”)云计算与数据研究所近期披露的数据显示,2020年隐私计算整体速度只比明文计算慢25倍,隐私计算技术已接近产业化。
合规压力倒逼金融机构
但对于金融机构而言,合规压力的驱动可能更为迫切。近年来,在《数据安全法》和《个人信息保护法》即将落地的预期压力下,数据流通市场生态发生深刻改变。
据记者了解,在数据共享过程中,此前的数据市场遭遇了买方和卖方的断裂,“不给做不了,给了不允许”成为金融机构使用数据时的巨大痛点。
合规压力之下最终会导致业务需求倒逼。一位数据行业资深从业者告诉记者,目前跨机构的数据流动遇到了瓶颈,很多外部数据金融机构在引入时有顾虑,间接导致风控迭代停滞。“一家持牌消费金融公司因为此前遭遇外部数据源切断,针对某一业务的风控模型不再奏效,必须收缩业务,导致去年放款量下滑了20%。”他透露。
前述隐私计算服务商高管告诉记者,以风控场景为例,金融机构此前想要接入外部数据源时,通常有几种方式:第一种是金融机构把数据样本拷贝