银行探路隐私计算应用:怎么建?怎么用?
既要保护数据安全,又要利用数据创造经济效益,“鱼与熊掌”如何兼得?
具有“数据不出域”“可用不可见特征”的隐私计算,成为时下最受关注的“技术解”之一。特别是在数据合规风险下,隐私计算有望成为有效保护个人信息的“一剂良方”。
近年来,隐私计算试点应用正在金融、医疗、政务等多个领域铺开。目前,银行业是隐私计算应用实践最多的行业。
不过,隐私计算应用得到快速推进的同时,诸如“系统孤岛”、运算效率低、安全性等挑战也逐步显现,以及商业化的应用价值等问题,都还有待进一步解决。
隐私计算站上风口
数据作为一种新型生产要素,其高效运用与安全之间如何实现平衡?隐私计算,被各方寄予了厚望,并在政策和市场合力推动下站上风口。
所谓隐私计算,是一种多方安全计算技术体系,也就是在保护数据安全及个人隐私的前提下,实现数据流通及数据价值深度挖掘的一系列方法。其中关键技术包括联邦学习、多方安全计算、机密计算、差分隐私、同态加密等。
中国人工智能学会(CAAI)荣誉副理事长、智能投研技术联盟(ITL)主席、微众银行首席人工智能官杨强告诉上海证券报记者,隐私计算的核心特征是“数据可用不可见”,可以保证数据在不出本地的情况下,得到安全使用并实现价值流动。其有效解决了“数据孤岛”与保护用户隐私之间的两难问题,是实现数据安全与隐私保护的关键技术。
据获悉,近年来,隐私计算的探索发展,不仅得到央行等多个部门鼓励,并在多个城市落地试点,包括北京、上海等城市。“隐私计算正在加速发展,市场层面也从落地初期验证阶段进入加速实施阶段。”杨强说。
风口之下,越来越多的企业嗅到机会,积极布局隐私计算研发,并推动商业化应用落地。在实际应用领域方面,隐私计算产品正快速融入金融、医疗、政务等场景中。艾瑞咨询报告显示,2021年中国隐私计算基础产品服务的技术采购中,金融、政务、运营商占据了75%至80%的市场份额。
头部银行在行动
金融行业是数据密集型行业,金融机构在推进数字化转型时,既要守护客户隐私,又要利用数据。面对这种需求,隐私计算被认为是一种有效的平衡工具。
2020年底以来,央行先后出台两份金融行业标准——《多方安全计算金融应用技术规范》《金融业数据能力建设指引》。此后,银行加快了隐私计算布局,开始“摸着石头过河”。据了解,农业银行、交通银行等国有大行,光大银行、浦发银行等股份行以及部分农商行,均启动了隐私计算研究并搭建隐私计算平台,在部分场景开展了试点。
一家国有大行金融科技部门人士透露,该行从总行到分行都在试点隐私计算应用,“隐私计算试点应用,是我行数字化转型战略的重要部分,因为这是一种确实能解决核心数据不落地的有效方式。”
光大银行从顶层设计出发,与华控清交信息科技(北京)有限公司(下称“华控清交”)联合搭建了一个具有基础设施意义的隐私计算平台。2021年8月,该行上线多方安全计算平台。该平台可以保障各企业原始数据在“可用不可见”“可控可计量”的前提下,规范开展数据共享与融合应用,实现跨企业间隐匿查询、联合统计、联合建模等功能,适用于联合营销、联合风控、统一授信等场景。
热潮之下,市场不乏顾虑。熟悉该行业的人士称,要让隐私计算在银行业务中真正发挥作用,就要对原有系统流程进行“大刀阔斧”式的改造,但其难度很高。
“隐私计算投入较大,主要是头部银行在布局。而且,对于隐私计算供应商来说,盈利模式也不理想——是收平台建设服务费,还是与银行分润?”一位熟悉该行业的人士说。
“系统孤岛”挑战待解
在试点应用中,隐私计算面临的考验也已显现。
“以我们落地情况来看,还要评估数据交互模型的碰撞效果。每个隐私技术平台的数据模型不同,集合在一个平台,需要不断调整优化。”一家国有大行金融科技部门人士说。
这个考验,正是行业面临的共性挑战——不同隐私计算平台之间,存在数据流通壁垒。
杨强解释说,数据提供方采用不同的隐私计算技术,在不同平台部署,技术实现原理也存在较大差异。如此一来,跨平台就无法互联互通,造成新的“系统孤岛”。
“系统孤岛”会带来不少麻烦:不仅增加系统建设和运维成本,数据应用的安全也面临更大挑战。杨强建议,可以通过开源开放的生产写作方式,有效打通数据、平台、机构之间的“孤岛”,实现跨地区、跨地域、跨平台互联互通,同时推动制定统一行业标准,降低技术的使用门槛,实现真正的技术普惠。
注意到,业内开始出现打破不同隐私计算平台壁垒的合作迹象。2021年9月,研发隐私计算技术的两大头部企业——华控清交和星云Clustar达成战略合作意向,双方将在隐私计算平台间的数据互联互通等方面合作,努力打破因隐私计算技术差异造成的数据流通壁垒。
打破前述流通壁垒,只是解决隐私计算应用的诸多挑战之一。对于行业而言,最大的挑战在于——如何将隐私计算产品以简单易部署、低成本的方式推广到更多场景和更广泛的生态。
这其中,一个重要的影响因素就是隐私计算的运算效率。平安科技副总工程师王健宗表示,相较于传统集中式机器学习、明文计算,当前隐私计算会有数十倍甚至百倍的计算损耗。
他认为,算法优化和硬件加速有望提升隐私计算的可用性。“未来,量子计算、光学计算有驱动隐私计算加速发展的可能。”