如何在不暴露和不泄露各自财产的情况下,准确地比较两个百万富翁谁更加富有,即“百万富翁命题”。这一看似无厘头的命题实际上用到了现代密码学的重要内容。
世纪之交的2000年,华裔科学家姚期智凭借这一命题研究获得了“计算机领域的诺贝尔奖”——图灵奖,为日后隐私计算的应用打下了理论基础。
所谓隐私计算,即在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合,达到对数据“可用、不可见”的目的,从而实现数据价值的转化和释放。隐私计算是一类既能保护用户隐私,又能实现数据计算效果的技术的统称。
时值壮年的姚期智那时恐怕不会想到,在他完成“百万富翁命题”近40年后,他的祖国已经成为全球第二大经济体和数字经济最为发达的国度。而他的模型和思想,如今在金融、政务、医疗等场景中得以商业化应用,并形成独特的赛道。
当下,恰逢中国开始进入对数据安全和个人信息安全严格监管的时代。当海量的、已经“升级”为生产要素的数据资源,面对严格的个人信息监管时,发轫于姚期智的隐私计算技术终于有了用武之地。
同时,隐私计算不仅是商业和产业层面的问题,在个人信息保护、数据安全与数据应用之间寻求平衡,以数据优势持续构建中国的国家竞争力,同样是事关国运的重大命题。在这条赛道上,既有互联网巨头公司竞争,也有长期从事大数据业务的企业参与,还有初创企业的加速入局,资本正在识别“隐私计算”赛道的长短与容量,投资人跃跃欲试。
一位天使投资机构的投资人对《中国经营报》记者表示,中国庞大的市场和数据使用场景,总是能够提供更多的可能性,现在一切仍未有明确的答案,投资人正在探索隐私计算是否能够成为一个独立的赛道。“不试一试,怎么知道呢?”他说。
何为隐私计算?
简单来说,隐私计算是一类既能保护用户隐私,又能实现数据计算效果的技术的统称。
近日,招商银行“慧点隐私计算平台互联互通项目”中标结果公布,这个名字看起来有点拗口的项目,实际上是国内首个由大型股份制商业银行牵头,与多家隐私计算服务商共同合作的跨平台互联互通项目。项目中标方之一的同盾科技公司相关人士告诉记者,该项目将协助招商银行完成企业级隐私计算互联互通标准的制定。
隐私计算,这个对大众来说有些陌生的概念,正在变得越来越重要,金融业对其更是颇为热衷。在招商银行的项目之前,浦发银行联合腾讯云计算公司等机构,启动了“多方数据学习‘政融通’在线融资项目”;交通银行则联合中国银联、华控清交启动了监管沙盒项目;中国工商银行、中国农业银行也不同程度地在相关业务中尝试性地应用隐私计算工具。
在知名咨询公司Gartner对重要战略科技趋势的预测中,“隐私计算”技术连续两年入围。Gart-ner还预测,到2025年,将有一半的大型企业机构使用隐私计算在不受信任的环境和多方数据分析用例中处理数据。那么,隐私计算究竟为何物?
简单来说,隐私计算是一类既能保护用户隐私,又能实现数据计算效果的技术的统称。
“百万富翁命题”中,富翁拥有的财富就是数据所有权,富翁公布财富数据就是数据使用权,是否有一种技术,能让他们向这个技术平台透露财富数据,经过一系列加密数据的计算,最终得出(谁更富有的)结果,而他们的财富数据本身不会泄露。对于需要数据的企业来说,他们获得的不是原始数据,而是经过加密的数据,以此来为计算结果提供服务。理解了这一假说,就能理解隐私计算的大概思路。
姚期智早在上世纪80年代提出的这一命题,被视为隐私计算的雏形。但是,在他提出这套算法的时代,由于计算机的算力有限,实际应用耗时颇长,在当时并未广泛应用。
目前,隐私计算包括多个“流派”。据记者了解,姚期智论文中提出的方法,在隐私计算领域中被称为“多方安全计算”,更多依托于密码学,是将一组相互不信任或者不信任任何第三方的独立数据所有者,通过一个函数得出准确的运算结果,同时各方输入的数据信息不会暴露且不可还原。
“用更通俗的话说就是,多方安全计算,是指每个人算一点,然后合在一起能够完成一个任务,它可以做一些相对简单的数据查询、统计等计算。”同盾科技合伙人兼人工智能研究院院长李晓林说。
除了多方安全计算,隐私计算还有“联邦学习”和“可信执行环境”两大流派。
“联邦学习”由国际互联网巨头谷歌提出,是一种分布式的“机器学习”,即多个参与方事先商定好分析模型,在数据不出各方“本地”的情况下,用各方数据对模型进行训练,而后得出结论供各方使用。“这一流派是从机器学习的角度出发,比多方安全计算又走近了一步,更适合目前人工智能的需求,模型训练和学习需要利用更丰富的多方数据,因此需要数据隐私的保护。”李晓林说。
无论是多方安全计算,还是联邦学习,都是软件层面的路径,而“可信执行环境”这个流派,则加进了硬件的因素。这个流派的核心思路,是通过构建一个独立于各方,且受各方认可的安全硬件环境,在安全、机密的空间内进行计算,得出结论。
“通过硬件打