从隐私计算到可信隐私计算


随着隐私计算技术的发展,为打通因技术差异造成的壁垒,避免形成“计算孤岛”,互联互通已经成为业内共识。

隐私计算,是一种由两个或多个参与方联合计算的技术和系统,参与方在不泄露各自数据的前提下通过协作对他们的数据进行联合机器学习和分析。在隐私保护计算框架下,参与方的数据不出本地,实现“数据可用不可见”。

业内专家认为,未来,隐私计算的发展要平衡好安全和效率,互联互通是必然。隐私计算领域专家——加拿大工程院及加拿大皇家科学院两院院士、FATE开源社区技术指导委员会主席、OpenIslands社区技术指导委员会主席杨强认为,这离不开开源的发展。开源基于“开源开放、技术普惠”的逻辑,有助于软件开发增强安全性、降本增效、加速迭代、促进产业协同创新,挖掘数据价值,为各产业技术发展提供动力。

“当前数据流通需求不断加强,机构间数据流通成为促使数据要素市场化配置、充分释放数据要素价值的重要环节。”中国信通院云大所大数据与区块链部副主任闫树表示,同时,不断实施的法律法规使得数据的安全与保护,特别是数据流通过程中的合规性,成为持续稳定的市场需求,而不再是短暂的监管应对行为。

闫树认为,隐私计算技术在不转移或泄露原始数据的前提下实现数据融合“可用不可见”的特点,有助于在满足合规要求的前提下充分挖掘数据价值,呼应了国家颁布的《数据安全法》《个人信息保护法》中提出的安全合规要求。

回顾隐私计算的发展进程,闫树将其分为3个阶段:第一个是萌芽阶段(1982-2017),隐私计算所依赖的相关技术被提出并持续创新,整体处于理论研究层面;第二个是启蒙阶段(2018-2019),相关基础技术逐渐成熟,隐私计算的概念与技术体系初步形成,相关技术产品开始出现,整体处于技术普及和市场教育层面。2020至今则是应用阶段,大量的验证性测试(POC)启动,隐私计算在部分领域,如金融、政务、医疗等已经开始落地应用。

“目前,隐私计算仍处在应用阶段的初期。”闫树认为,相关技术产品能够满足的实际应用场景有限,未来随着性能、安全性等方面的提升,隐私计算的应用将进一步丰富、向更多行业扩展。

目前,金融行业是隐私计算当前应用最为成熟的领域。闫树表示,去年以来,银行、保险等大型金融机构不断加大隐私计算研究和应用,具体场景在金融风控、营销等传统场景下进一步细分、外延。

“金融是隐私计算的一个非常好的应用领域。”杨强表示,隐私计算近几年在金融行业的推广和应用速度是非常迅速的。

“愈发严格的监管合规要求,用户逐渐增强的隐私保护意识,使得金融业加大对隐私计算的投入。”微众银行人工智能首席科学家范力欣表示。

闫树也表示,金融服务平台的应用大大降低了银行对坐席、对办公场地和营业网点的需求,加强了营销转化和风险控制能力,优化了服务效率和客户体验,驱动银行数字化智能化转型。

“未来,金融与隐私计算的融合是必然的趋势。”范力欣为,从国际趋势上来看,监管机构在隐私保护方面的处罚更趋严格。如今年2月,匈牙利数据保护机关就AI数据处理侵权对布达佩斯银行处以65万欧元罚款。起因是该行利用AI技术对客户服务电话进行自动分析,且“没有实际的风险缓解措施”。处罚的依据,就是以保护个人数据隐私为目的的通用数据保护条例(GDPR)。范力欣认为,今后类似的监管措施还会层出不穷,监管环境会愈发严格。而作为解决隐私保护与发挥数据要素价值矛盾的隐私计算和可信联邦学习,必定会越来越重要,发挥更大的作用。

随着隐私计算技术进入应用阶段,实践中的需求也使得隐私计算升级的要求越来越迫切。

“隐私计算技术需要在安全和效率之间取得平衡。”杨强表示,不能仅停留在“理论完美”,如果一种技术安全性高,但实际使用效率却很低,这样的技术是无法应用的。

杨强认为,可信联邦学习包括可信隐私计算的意义在于,它既安全,又高效、系统可解释、门槛低(也就是普惠)。基于这些,杨强提出了可信联邦学习的概念,希望从“理论完美”转变为“实用完美”,具备高可用性和普惠性。

杨强提到的安全和效率之间的平衡问题,切中了当前隐私计算技术发展中面临的瓶颈。

闫树认为,当前隐私计算技术发展需要突破的关键点在于两个方面,一方面是性能。当前亟需突破隐私计算现有的性能瓶颈。一是满足高稳定性要求,可监控、可回滚,具备一定的网络/节点容错性,提供高可用性;二是满足高性能要求,在安全、准确的前提下,提升计算效率,且能够支持大规模数据的计算。另一方面就是安全。需要增强隐私计算全流程安全性。一是可证安全,并明确算法本身带来的隐患或者信息泄露以及已有的攻击手段及可能带来的信息泄露。二是流程可监管,包括事前的授权、事中的监控、事后的审计,能够快速发现安全风险。

未来,可信联邦学习在金融场景中潜力巨大。范力欣认为,一是应用层面,实际中的需求会越来越多,要求人工智能系统具有安全性(安全可靠),可用性(高效能),可解释性(透明易理解),今后会有更多兼顾这些需求的实际应用案例落地;二是监管层面,对人工智能系统的可监管和合规管理会越来越严,可信联邦学习顺应这一趋势将大有可为的;三是技术层面,来自应用和监管的需求会倒逼技术的发展,不断提出各种创新的技术方案,比如对数据要素流动的溯源及管理办法,对模型归属权的确认和管理等,以满足不断增长和拓展的需求。

随着隐私计算的发展,互联互通成为大势所趋。“隐私计算是新事物,大家纷纷搭建自己的隐私计算的平台和技术模块,但这存在一定的问题。”杨强表示,隐私计算技术走向应用,就好比是大家合力盖一座房子,各家公司创造的都是盖房的基本元素,如砖头、钢架、玻璃等,但是等到要组装房子的时候,发现各个元素并不匹配,A家砖头和B家砖头有差异,钢架和玻璃又对不上,最终无法实现盖房子的目的。

“实现隐私计算跨平台间的互联互通已成为产业内的迫切需求。”闫树认为,在隐私计算落地应用的过程中,不同技术厂商提供的产品和解决方案在设计原理和功能实现之间存在较大差异,使得部署不同技术平台的数据流通参与方之间无法跨平成同一计算任务。为实现多个合作方之间的数据融合,用户往往要付出极高的沟通成本以协调产品选型方案甚至不得不部署多套产品以逐一适配,造成重复建设。作为促进跨机构间数据共享融合的关键技术,隐私计算有望成为支撑数据流通产业的基础设施,但高额的应用成本将不利于隐私计算技术的推广应用。因此,跨平台间互联互通的需求尤为迫切。

杨强认为,互联互通离不开开源的发展。一个开源软件能够让各行各业的人,基于同一套代码,按照共同的标准来盖房子。在开源的基础上,盖房子的每一个元素都能实现无缝衔接,这样才能把房子给盖好。“如果隐私计算、联邦学习技术只是掌握在少数巨头公司的手里,我们无法真正实现数据流通。”杨强表示,必须把应用这门技术的门槛降低,而降低门槛的一个有效手段就是开源。“开源社区在互联互通方面尤其重要,是隐私计算技术沟通的重要桥梁。”杨强表示。

记者了解到,联邦学习开源社区FATE推出后,极大促进了各方对联邦学习的了解。“现在几乎所有互联网公司、大数据公司以及智能制造公司等都有相应的联邦学习团队,百余家以联邦学习技术为基础的初创公司如雨后春笋般出现。”杨强认为,这离不开开源的推动,开源让大家都能“上手”,并且在实践中设计开发出各种各样针对不同场景的应用。

对于隐私计算未来的发展,闫树认为,隐私计算仍具有相当广阔的发展空间。随着数据融合需求的增强以及数据保护要求的提升,隐私计算作为解决数据安全合规流通的关键技术,在2021、2022连续两年入选了Gartner的前沿科技战略趋势,在2022年入选了IDC“变革型”技术曲线,受到了外界的广泛看好。从市场角度分析,自2018年,国内隐私计算进入快速发展期,根据IDC调研数据显示,2021年中国隐私计算市场规模突破了8.6亿。此前,毕马威从软件销售和服务收入以及业务运营利润分成两方面测算出,隐私计算未来将触达百亿甚至千亿市场,发展空间广阔。(经济日报记者陈果静)

金融信息安全讨论群,请添加群主微信:qiao070132,备注:姓名+公司+职务+安全入群。返回搜狐,查看更多


发表回复

您的电子邮箱地址不会被公开。