对话| 数字时代,隐私计算的发展前景与挑战
共 3896字,需浏览 8分钟
·
2021-07-20 00:55
7月8日,火星财经发起“区块链+隐私计算,告别个人信息的‘裸奔’时”的视频直播活动开播。微众银行区块链隐私计算技术负责人李辉忠受邀参与活动,围绕隐私计算与区块链技术与媒体主持人展开对话,并探讨隐私计算的发展前景与挑战。
以下根据对话内容整理(对话人:李辉忠&火星财经主持人西娅):
一、 如何理解“数据是数字时代的石油”?
西娅:2017年《经济学人》杂志在封面中提到了一个非常有意思的观点“数据是当今时代的石油”,我们该如何理解数据?您如何看到“数据是数字时代的石油”的这种观点?当下很多普通人理解的数据就是电话等身份信息。
李辉忠:我对“数据是数字时代的石油”比喻不太认同。“数据”与“石油”有很多不同。
我们讲“石油”的时候,石油产生能量,推动了工业时代的发展,“数据”更确切应该比喻为“能量”。数据的本质是存储在介质中的信息,这些信息背后隐藏了很多有价值的知识,但是这些知识并非天然存在,需要人为的劳动才可以产生,也就是说,需要挖掘、分析和学习才可以产生,才能推动社会发展。
数据应该被比喻为“火”,是可以传递和重复使用的。数据在使用过程中,会产生新的数据,新的数据又可以被复用,开启自循环的迭代演进,从这种角度讲,数据的价值要超越石油。从抽象的角度去看,整个人类社会进步是能量优化和信息优化,以及逐步熵减的一个过程。数据挖掘与使用的核心就是从海量数据中,通过AI、大数据、隐私计算以及分布协作的方式挖掘价值信息。挖掘过程就是熵减的过程。
二、隐私计算如何保障用户数据主权?
西娅:从“网络奴工”到“网络公民”,隐私计算如何保障用户数据主权?在数字时代扮演了怎样的角色?
李辉忠:为什么我们讲到数据,就会讲到隐私计算?接下来我就展开讲讲。
我们讲数据的时候经常会用石油来比喻,这是因为石油在第二次工业革命的时候扮演了非常重要的角色,如此比喻体现了数据的重要性。热力学第二定律告诉我们,有温度差的地方就会产生动力,就像在数字时代,凡是有信息差的地方都能释放数据的价值。互联网时代就是这样的,大的公司之所以有更好的服务,是因为他们拥有更多的数据。数据跟原来的生产要素的较大区别就是,数据需要流动才能产生价值。
虽然在热力学定律中,我们知道温度差产生动力,但是它不会反向地自动产生,其逆向的能量转换需要有外界的输入。数据释放价值也一样,也就是说信息少的一方想要从信息多的一方获得信息需要付出劳动,这就引发了两个问题:第一,数据需要流动才能产生价值;第二,数据的流动涉及到多方的协作,而不是单方运算。
一旦数据自由流动之后,就会引发一系列问题,比如数据的确权问题、激励问题、隐私问题,所以在这样的背景下,大家认为隐私计算非常重要。但隐私计算本身是一个综合的技术,是需要推动数据流动,并保护数据合规合法使用的一套机制。这种机制依赖于一系列的技术综合运作,包括区块链、联邦学习、安全多方计算等技术,需要根据不同的场景,量身订造。
由于在这个过程中涉及到不同的参与方与参与方之间的数据流动,它们是否合法合规,是否保护了数据的隐私和敏感,从这个逻辑来推导,就需要一系列的技术来支撑,包括需要用户授权、授权的登记以及过程的追溯,未来的审计与加密等,且需要联邦学习、安全多方计算技术来辅助。总之,在数据重要性得到时代的共识之后,熵减的过程降低了信息差,挖掘了数据价值,推动了数据经济的发展,且在这个过程中,带来了隐私保护的问题,也就产生了隐私计算。
三、区块链与隐私计算产生了什么化学发应?
西娅:区块链与隐私计算产生了什么化学发应?两者互为必选项吗?
李辉忠:我们也经常在思考区块链与隐私计算的关系,思考他们之间的共同点和不同点。从共同点来看,区块链技术需要多方参与,构建一个分布协作的场景,各方都参与贡献。隐私计算其实也有这个特征。在这样的基础上,两种技术就有了相互融合的空间。
隐私计算在多方协作过程中存在信任的问题,比如数据确权等。引入区块链技术,通过分布协作、共识机制以及智能合约等工具就可以实现数据的互信,比如信息登记确权、追溯、审计等。此外,区块链本身就是一个分布式账本数据库,可以帮助衡量参与隐私计算的多方的贡献价值,更好地创造平等的协作环境。所以说,区块链技术可以更好地辅助隐私计算。
反过来讲,区块链本身也是一种自成体系的技术栈,一种分布式账本数据库。参与的多方之间共享信息,就会涉及数据流动。共享记账和数据流动本身就可能存在隐私问题。举个例子,在供应链场景里可能有核心企业、银行机构、一级供应商以及二级供应商等,共同组建了一个分布协作的环境。假设用区块链来做的话,是一种明文记账的方式,比如核心企业与一级供应商之间有账务往来,由于二级、三级供应商也参与记账,那么他们也会知道这笔交易,这里就可能存在隐私的问题。由此看来,隐私计算反过来支撑区块链中的隐私保护。
在我看来,区块链和隐私计算相辅相成,并非附属关系。有的场景下也许区块链技术是主要支撑,隐私计算负责增强;有时也许是隐私计算为主要支撑,区块链技术来辅助。总的而言,两者是互相支撑,融合发展。
四、隐私计算应用场景
西娅:隐私计算当前应用的主要行业和场景有哪些?
李辉忠:近两年隐私计算的概念虽然很火,但是还处于相对早期阶段,处在逐步完善的一个过程中。如果说关于隐私计算的应用场景还是围绕数据去讲,那么互联网时代的数据是如何产生的?
第一个数据产生场景是个人和机构之间现在会有数据往来。个人在享受机构提供的产品服务的过程中,数据不断地流向机构,同时在使用体验的过程中,不断地会有新的数据产生。
第二个数据产生场景是,随着整个互联网的发展,我们从信息化时代迈向了智能化时代,但很多产品的服务能力需要多个机构之间相互协作。比如普惠金融或者智慧城市,不是某一家公司就能够支撑这件事,再比如数据新基建提出来的场景,需要大量的机构参与进来,而且场景覆盖的行业也要求非常广。
整体上,数据的隐私或者数据的流动是双循环的,是个人和机构之间一个循环,然后,机构和机构之间一个循环。这两个双循环推动了整个数据产业的发展,所以隐私计算必然也绕不开这个双循环。隐私计算就是要支撑这两个循环里面的应用场景的。
从个人和机构的应用场景看,其实现在已经有很多的法规要求,收集用户数据的时候必须经过用户授权。这种场景可能是隐私计算中一个非常重要的落地,可实现选择性授权情况下的最小使用。
从机构和机构的应用场景来看,机构之间需要有很多的相互协作,以进行服务质量的提升和服务能力的挖掘,比如智慧城市、普惠金融、绿色医疗等,单一机构的数据能力很难提供广泛的服务,因为没有足够的风控能力,没有足够的数据或者没有良好的模型。所以,未来机构之间可能是联合的数据使用,比如联合的建模,联合的数据统计分析。
前不久刚刚颁布的《数据安全法》, 9月1日开始实施。《数据安全法》里面提到了三个让我印象深刻的地方,第一条就是,对于个人数据要非常慎重地使用、要最小地使用,要保护用户的隐私安全;第二条就是对公共数据鼓励和提倡最大化地去释放和挖掘;第三条就是要构建政务数据开放平台,将政务的公开数据更大地释放给全社会、全产业。基于未来政务数据公开的大背景下,如何使用好公共数据来推动产业的发展,隐私计算在这块的落地实际上可能是很重要的。
总结来看,隐私计算将在个人和机构之间、机构与机构之间的双循环应用场景下落地。
五、隐私计算面临的挑战
西娅:隐私计算有待解决或即将面临的挑战是什么?
李辉忠:对于一个相对早期的技术,或者说相对发展比较前期的一个技术而言,隐私计算会面临各种各样的挑战。
首先法规上没有特别的完善,其次技术上还存在很多的困难,最后,目前也没有太多的应用场景。
其实,大家在认知上都需要升级,包括在法规层面、科普层面以及生态层面,需要有更多的人去积极地推动这件事情。区块链刚刚开始的时候,其实也遇到类似的问题,区块链到底是干什么用的?随着区块链生态中,越来越多的人参与进来,并且有一些积极的力量在推动之后,现在整个业界对区块链的认知已经有了很大的提升。所以,隐私计算也一样,需要有更多的人去积极推动,做到认识和行动统一,打破隐私悖论。这其实就是一个很现实的问题。
第二个现实的问题就是说从技术的角度来看,技术本身存在各种各样的问题,比如性能问题、安全问题等。因为隐私计算本身具有较大的复杂性,其在性能上、数据量上、产品体验等方面都带有一些复杂性,这会导致业界在提供解决方案时,做出一些妥协,那么这个妥协本身是不是合理?也是需要业界逐步推进认知的。
比如隐匿查询和不经意传输是当前业界普遍认为最高级别的安全密码保护,但我们看到行业的一些方案可能只是做了一个对称加密,所以其实存在一系列的技术和认识问题。大家对新的技术理解程度和角度不一样,需要整个产业不管是从需求方还是从技术方、实施方等,都可能需要做一些改变,或者说进行一些提升,这个我觉得是当下面临最大的挑战。
此外,还需要再法律法规进一步推动完善。
六、隐私计算的未来发展前景
西娅:结合您的理解和观察,请畅想一下隐私计算的未来发展,是否未来可期?
李辉忠:未来的数字时代是一个大舞台,隐私计算将会是舞台上奏起的美妙交响乐,政策法规是指挥家,区块链、联邦学习、安全多方计算等各种不同技术协同演奏,主唱就是各类隐私计算落地场景。