如今数据已是新产业、新业态的核心生产要素,数据运用面临的隐私性、可用性也随之备受关注。
较其他领域,金融领域对数据的管控更为严格。目前,一种面向数据隐私保护的机器学习新算法——联邦学习,为金融行业人工智能技术的应用提供了一种新的机制和平台,有效打破隐私保护与数据使用的困局。
目前大型银行已经开始布局,部分金融科技公司也已纷纷入局联邦学习应用。那么联邦学习在金融行业大规模落地还面临着哪些问题?如何解决?
银行“扎堆”联邦学习
“目前部分头部银行已经开始做联邦学习的商业化落地,比如对供应商的招募已经开始,今后在头部银行的带动作用下,隐私计算技术在金融行业大规模落地的趋势十分明显。” 4月18日,在中国计算机学会(CCF)主办、CCF YOCSEF上海学术委员会和普华永道协办的联邦学习技术论坛上,致星科技商务副总裁许振提到。
据许振透露,联邦学习在产业落地的应用场景范围很大,相当于一个数据淘宝,预计今年内会有更多联邦学习相关基础设施落地。
据交通银行金融科技创新研究院研究员谢谨在会上介绍,隐私计算是面向隐私信息全生命周期保护的计算理论和方法,具体是指在处理视频、音频、图像、图形、文字、数值、泛在网络行为信息流等信息时,对所涉及的隐私信息进行描述、度量、评价和融合应用等操作,形成一套符号化、公式化且具有量化评价标准的隐私计算理论、算法及应用技术,支持多系统融合的隐私信息保护。联邦学习是隐私计算技术的一种,是机器学习和人工智能面对更加严格的数据管理规定的解决方案。
根据此前微众银行发布的《联邦学习白皮书V 2.0》(下称“白皮书”),通过合规的多维度联邦数据建模,风控模型效果通常约可提升12%,消费金融类企业机构有效节约了信贷审核成本,整体成本预计下降5%-10%,并因数据样本量的提升和丰富,风控能力进一步增强。
白皮书提到,联邦学习的核心特征在于,参与各方在不转移自身数据的前提下,进行数据联合训练,从而实现联合建模的目标。
目前,联邦学习已经在一些关键的金融领域取得了进展,例如智慧风控场景、隐私保护场景等。
谢谨具体介绍称,基于多方安全知识图谱可以计算中小微企业融资服务项目,通过融合图计算与安全计算技术,在保护各自数据的条件下,实现跨机构间(如银行与运营商)数据安全融合,构建联合关系图谱,打破图计算的数据边界,识别更复杂、更全面的关系链条以及欺诈风险。
隐私保护方面,则运用多方安全计算、图像识别技术,有效核实商户责任人和收银员身份,解决传统收单管理中设备、人工验证带来的管理漏洞,在保护商户责任人和收银员隐私安全的基础上有效提升收单机构反欺诈、反洗钱等风控能力,降低收单机构运营成本。
大规模落地难在哪?
相较于其他领域,金融领域对数据的管控更为严格,因此在实际的落地过程中,总是面临着各种问题。
“在不同的隐私计算平台之间实现跨接成为新形势下的必然趋势。不同的机构在不同的业务场景中应用不同的隐私计算技术形态;会逐渐形成了事实上难以对接的新数据壁垒。因此,在不同的技术平台之间寻求可能的跨接协议甚至是桥接平台将成为未来的需求。”谢谨介绍道:“常见的横向联邦学习模型是最常见也容易实现互联互通考虑的联合建模方向,但纵向联邦学习的互联互通是主要突破点。联邦迁移学习本身可以为未来的应用场景拓展无限可能。”
对于今后隐私计算技术能否在金融行业大规模落地。平安科技联邦智能产品部李泽远在会上分析称,目前金融领域每条业务线及相关系统都在做数字化转型,跨部门甚至跨机构间的数据流通成为刚需。处于对隐私安全保护意识的提升,数据流通必然是需要隐私计算技术的支撑。
谈及落地方面的难点,李泽称,目前我国中小型银行数量较多,但这类银行的科技能力有限,对金融科技方面的前期建设投入较大,相关项目周期较长。此外对于隐私计算产品的市场监督度,还需要进一步提升。对于隐私计算,金融机构应从被动接受要求转化为主动落地金融相关的产品。
针对落地应用的瓶颈,上海交通大学教授郁昱会上指出,首先是效率问题,当前不能做大规模的通用计算,只有一些简单的计算;其次是安全性方面,由于隐私很难量化,对于安全性如何证明,如何评估都需要进一步解决。此外,除了技术还有更多方面的因素需要考虑。如合规性的问题,产品属性如何界定,如何被相关机构认可和监管这些都是需要考虑的问题。