编者按
金融数字化发展联盟与《中国信用卡》长期关注中国银行卡行业发展,为展示行业在支付创新、数字化转型等方面的研究与实践成果,在《中国信用卡》创刊三十周年之际,金融数字化发展联盟联合《中国信用卡》推出创刊三十周年征文活动,邀请金融机构分享自身高质量发展经验,我们将陆续发布征得的优秀文章以飨读者。
作者
中国建设银行信用卡中心数据管理处 宋丹蒂
当前,信用卡市场已步入存量时代,竞争日趋激烈,客户用卡交易依托各类消费场景,银行通过自有渠道开展各项活动能力有限。而第三方互联网企业场景覆盖面广,契合客户消费支付习惯,与客户连接深入紧密,具有丰富的数据资源和营销触点。因此,在保证数据协作安全、合规的前提下,探索新的数据合作模式,成为银行信用卡业务发展的诉求。
一、隐私计算及其在银行中的应用价值
1.隐私计算为合法合规利用数据带来创新机制
隐私计算是面向隐私信息全生命周期保护的计算理论和方法,本质是隐私信息的所有权、管理权和使用权分离的人工智能算法、密码学协议和相关平台系统,主要解决数据要素流转过程中的数据加工使用权的跨域管控问题,以及在保护数据隐私的前提下,解决数据流通、数据应用等数据服务问题。隐私计算不是某一种具体技术,其由密码学、人工智能、安全硬件等许多领域交叉融合而成,主要包括可信执行环境(TEE)、多方安全计算(MPC)、联邦学习(FL)。考虑到数据不出域的普遍诉求,多方安全计算、联邦学习成为目前隐私计算的重点发展方向。
(1)多方安全计算
多方安全计算最早由中国科学院院士、图灵奖获得者姚期智于1982年提出。它是密码学的重要分支,通过一系列经过严格证明的密码学协议(如秘密共享、不经意传输等),解决一组互不信任的参与方之间保护隐私的协同计算问题。多方安全计算不仅要确保输入的独立性、计算的正确性、去中心化等,同时还需确保不泄露输入值给参与计算的其他成员。多方安全计算解决了每个参与主体除了计算结果外不能得到其他实体任何输入信息的难题,能够满足监管对数据要素流通和协作的合规性要求。隐私求交(PSI)是多方安全计算的一种特例算法,主要用于两个集合的交集,但同时不泄露其他信息。
(2)联邦学习
联邦学习作为一种新兴的人工智能基础技术,在2016年由谷歌最先提出,国内微众银行率先将其扩展并应用于金融行业。其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,由多个参与方或多计算结点之间开展高效率的机器学习,故又称为“联邦机器学习”。相比聚合不同的数据源,联邦学习的独特性在于不同服务器上的数据无需整合到同一数据库,便可实现机器学习过程的逻辑统一。联邦学习无需共享底层数据,避免创建额外的数据副本,可以有效解决数据孤岛问题,让多个参与方在不共享数据的基础上进行联合建模。
根据联邦学习所使用数据在各参与方的不同分布情况,可以将联邦学习划分为三类:横向联邦学习、纵向联邦学习和联邦迁移学习。横向联邦学习可以简单理解为“样本联合”,适用于参与双方的数据集用户特征重叠较多而用户重叠较少的情况,通过取出双方用户特征相同而用户不完全相同的那部分数据进行训练。纵向联邦学习可以简单理解为“特征联合”,适用于参与双方的数据集用户重叠较多而用户特征重叠较少的情况,通过取出双方用户相同而用户特征不完全相同的那部分数据进行训练。联邦迁移学习则适用于两个数据集的用户与用户特征重叠都较少的情况,此时不对数据进行切分,而是利用迁移学习来克服数据或标签不足的问题。
多方安全计算、联邦学习等隐私计算技术为合法合规利用数据、流通数据带来创新机制,确保了数据流通的最小必要原则,避免了应用场景中的数据滥用和数据泄露风险。
2.隐私计算为银行带来更多业务价值
利用联邦学习,结合银行经营场景,隐私计算能为银行在更多的领域带来更多价值。
目前,银行外部数据应用模式主流是实时联机查询,即业务组件在取得授权的情况下,实时调用查询服务,将所查询的数据嵌入业务流程或者模型中伴随业务办理调用。这种模式下,考虑到合法合规性、成本控制等因素,往往只能查询个别标志或评分,数据使用范围及效率受到限制,特别是一些评分数据还会出现数据“水土不服“的情况。
通过联邦建模,可同步兼顾合规性、有效性,节约企业在数据服务中的投入成本。联邦学习无需共享数据,避免创建额外的数据副本,能让多个参与方在不共享数据的基础上进行联合建模。
银行可以通过联邦学习汇聚行内外数据,优化外部数据应用模式,针对具体业务场景进行数据建模。这种方式一方面可以拓展外部数据使用范围,另一方面可以解决以往由于引入的评分只包括外部数据变量而可能带来的“水土不服”的问题。整个过程中,银行不需要向外部公司直接提供客户任何建模标签及Y变量,能够充分保护合作过程中的数据安全,最大程度避免数据泄露,并实现数据使用过程中的“分类施策、最小必须”原则。
笔者整理了部分银行在智能风控、精准营销两大领域使用隐私计算的10个业务场景(见表1)。这些场景将会是未来银行业充分利用数据及隐私计算赋能业务发展的方向。
二、A银行基于隐私求交的信用卡精准营销实践
在移动互联网时代,伴随消费者消费行为和观念的持续改变,网络购物、团购外卖已经深深嵌入人们的生活形态。信用卡消费渠道也由线下向线上迁移,移动网络消费成为信用卡机构竞争的重要战场。过去,银行针对互联网平台客户的信用卡营销要么依托互联网平台,利用其掌握的客户消费行为数据直接投放广告或活动进行促销;要么利用银行自身客户数据通过银行自有渠道进行营销促活。采用第一种方式,银行不掌握目标客户具体数据,也很难对营销及结果施加干预;采用第二种方式,银行无法将营销真正嵌入至互联网平台。两种营销方式的效果都差强人意。银行与互联网平台都希望探索一种基于合法合规数据交互的营销方式,来提升信用卡营销的效果及转化率。
在此背景下,A银行信用卡中心通过开展隐私计算技术及合法合规性研究,探索、部署开源隐私平台,实现与互联网平台隐私求交的能力。营销过程中,A银行信用卡中心通过选取符合营销规则或模型的目标客户,使用客户证件及手机部分段位组合并进行MD5(哈希)不可逆加密形成客户标示。互联网平台按照同样的方式筛选预定规则的客户并按相同规则形成客户标示。双方在此基础上利用隐私求交算法,求出双方交集客户,即为营销目标客户。整个过程通过加密及隐私求交,双方完全避免了敏感信息传输,且双方仅对共有目标客户进行了定位,非共有客户信息不会被识别泄露,确保了全流程的信息安全。双方通过隐私求交得到共有目标客户,能够高效支持网络场景精准化营销,不交互其他信息,不泄露非共有客户信息。这是A银行首次与集团外公司共同应用开源框架开展安全计算,为信用卡中心拓展更多元的合作方和更丰富的业务场景提供了技术基础。
三、未来隐私计算应用中的关注点
在国家大力推进数据要素流通、促进数字经济发展的背景下,政府旗下各地的数据集团公司、互联网企业、银行等金融企业、智能制造行业都在着力探索和研究利用隐私计算促进数据流通、创造数据价值。隐私计算必将成为技术发展的热点。目前,隐私计算在信用卡业务及银行其他业务领域中要想取得重大突破,仍有两个关键点需要关注:一是技术及平台的统一性、兼容性;二是相关法律法规及监管要求的进一步明确。
技术及平台的统一性、兼容性是银行业应用隐私计算必须面对的问题。当前,隐私计算算法及平台如雨后春笋,不断涌现,但也面临兼容性问题。各银行之间、银行和其他机构之间的隐私计算平台无法相互兼容,项目合作往往因为各自坚持使用自己的平台而很难达成一致。这反映了隐私计算缺乏行业认可的统一标准或统一平台,行业各方各自平台的兼容性几乎为零。目前,如腾讯最早开源了自家隐私计算FATE,阿里开源了“隐语”,中国信息通信研究院也开设了“联邦学习产品安全认证”来认证平台的安全性。相信经过一段时间的发展和市场筛选,最终会沉淀几家比较通用的隐私计算平台。
相关法律法规及监管要求需进一步明确。当前,《中华人民共和国个人信息保护法》《信息安全技术网络数据分类分级要求(征求意见稿)》等尚未覆盖隐私计算所用的技术,有关隐私计算的法律法规建设还有很大的提升空间,行业各方在使用隐私计算的过程中也较为谨慎,大规模的应用仍在摸索当中。不过,相信银行业在应用隐私计算的过程中,通过加强行业交流,与监管部门积极沟通,必会助力相关法律法规及监管体系进一步完善与优化。
(本文系《中国信用卡》“创刊三十周年征文”投稿)
本文刊于《中国信用卡》2024年第7期
相关推荐