数字经济时代,数据正越来越彰显其重要价值。当数据成为与土地、劳动力、资本、技术同等重要的生产要素,两个问题也随之而来:一是当企业或机构通过大数据挖掘提供服务时,社会各方的数据权益如何保护;二是单独一家企业、科研院校或政府部门拥有的数据量毕竟有限,在某些情况下大家又难以坦诚地共享数据,客观上造就了一个个“数据孤岛”。 能否有一种机制,既能让彼此共享数据,又不会泄露核心机密呢?作为一种平衡数据利用和隐私保护问题的技术,隐私计算悄然兴起,正逐渐发挥越来越大的作用。
大数据“杀熟”,隐私计算说“不”
当下,各行各业都在推动数字化转型。数字化不仅是企业发展的必经之路,也成为经济社会发展的必然趋势。随着互联网、大数据、云计算、人工智能、区块链等技术加速创新并日益融入经济社会发展各领域全过程,数据的价值愈发凸显。
电商领域一个至今为人津津乐道的案例是,买了奶粉的家庭接下来大概率会买扫地机器人,这种被大数据挖掘出的正相关,预示着购买者家中可能刚刚添丁。金融机构也很早就开始用大数据勾勒用户画像,除了单位、收入、学历等基本信息,数据甚至覆盖到了出入场合、看书种类、浏览网页频率等几万个维度组合。类似的“大数据画像”固然能提高电商、企业、金融机构的营销效率,降低获客成本和运营风险,但数据挖掘的隐私边界在哪里,亦引发了诸多讨论。
pixabay.com
中国互联网络信息中心(CNNIC)今年2月发布的第49次《中国互联网络发展状况统计报告》显示,截至2021年12月,我国网民规模达10.32亿,互联网普及率达73.0%;我国网民人均每周上网时长达28.5个小时,较2020年12月增加2.3个小时。显然,互联网已深度融入人们的日常生活,数据改变了人们的生产、生活和消费模式,这对社会各方的数据驾驭能力提出了更高要求。
在此背景下,在推进数字化转型过程中,信息安全和隐私保护被提到了前所未有的高度。2021年11月1日正式生效施行的《中华人民共和国个人信息保护法》,是我国第一部个人信息保护方面的专门法律。加上此前生效的《中华人民共和国数据安全法》《中华人民共和国网络安全法》,共同组成数据保护领域的“三驾马车”。
如何在数字化进程中兼顾信息安全和隐私保护呢?让数据“可用而不可见”的隐私计算或许提供了一种解决之道。上海树图区块链研究院研究总监杨光解释说,简单而言,隐私计算如同一个黑箱,人们不需要看到黑箱内是如何运作的,就能得到运算结果,“相当于人们共享了数据价值,又保护了各自的数字权益。”
在技术层面上,隐私计算几乎适配当前互联网的各个环节,让数据既能使用,又能保护隐私。因此它的出现,被业界视为“治疗”过度个人信息收集、大数据“杀熟”、隐私泄露等一系列问题的“一帖良药”。
想要大数据,但不想“被看见”
数据量越大、质量越高,越能进行准确的建模训练和预测。然而,并不是所有人都愿意公开自己的数据或模型,一来数据太容易被复制,担心拿出核心数据会降低自己的竞争力,二来某些领域的数据本就不适合公开。
比如,云计算本是一种节约成本、提高算力的方式,但某些企业不愿“上云”的原因之一就是,“上云”等于将自己的数据和算法模型一并交给了云服务商。如果有一种技术能限制云服务商查看运算数据的权限,企业“上云”的积极性将极大提高。
同理,在上下游企业或竞争对手之间,他们的数据往往高度相关且互补,如果能聚在一起,一定能发挥出比单打独斗更强的作用。但是,在保障自身数据安全的情况下,没有一家企业愿意拿出自己的核心数据。
上海交通大学网络空间安全学院长聘教轨副教授、光之树科技首席密码学科学家袁晨表示,破解“数据孤岛”的关键在于,在保障各方利益的情况下实现数据共享,而隐私计算是目前业界公认的方向之一,近年来发展迅速。
通俗地讲,隐私计算就是为解决“想要大数据,又不想‘被看见’”的需求而生。比如,寄快递时,“先寄后付”模式每单可节省少则5秒钟、多则一分钟。在疫情背景下,利用隐私计算技术,光之树科技将顺丰快递“先寄后付”的目标客户拓展了三倍,这是如何做到的呢?
袁晨解释说,“先寄后付”的目标客户是那些金融信用良好的用户,而顺丰并没有掌握这样的用户信息,但银行已经有相对完善的客户信用信息。然而,一般情况下,银行绝对不会将该核心信息交给别人。作为国内领先的隐私计算公司,光之树此前曾为中国银联提供了隐私计算解决方案,使得他们可以在不透露用户信息的情况下,只告诉顺丰该用户是否可以成为“先寄后付”的目标客户。由此,同一份数据发挥了更大的作用。
在产业数智化和精准营销领域,隐私计算也大有可为。比如,一家企业希望通过以数据库比对的方式,找出与现有客户相似的潜在客户,进行客户群体拓展。然而,企业都不希望将自己的核心用户名单开放给第三方。“你不给我,我怎么找?”隐私计算就能帮助企业解决这一两难问题。
互联网应用繁荣催生新赛道
每一种生产要素必须有与之相匹配的共享、交易机制,蓬勃发展的隐私计算无疑为数字经济的底层逻辑提供了一种技术支撑。
袁晨介绍,隐私计算分为硬件方案和软件方案。硬性方案就是可信计算TEE(可信执行环境),软件方案分为安全多方计算和联邦学习的隐私计算。目前,中国在该领域处于第一梯队。
“在同等条件下,软硬件结合的计算模式优于单靠软件计算。”近年来,袁晨在国际顶尖密码学会议上保持平均每年被收录1-2篇论文的频率。他也是目前为止,中国在国际三大密码学顶级会议上发表隐私计算相关论文数量最多的学者。
在硬件方面,为支持隐私计算的机密计算服务器应运而生。它是指在芯片改造和硬件支持下,可以支持在运算过程中看不到其中的运算数据、只输出运算结果的服务器,适用于大规模数据运算。
作为异军突起的细分赛道,近年来隐私计算在中国的发展尤为迅猛。全球范围来看,不仅互联网巨头纷纷开出相关部门,初创企业的数量也十分可观,他们常常作为各单位的可信第三方存在。比如,为全球顶尖制药公司提供隐私计算平台的初创企业Owkin,实际上就充当了链接起医院、科研机构和制药公司的中间节点。
“隐私计算是一种面向应用的技术,需要繁荣强大的数字产业作为支撑。在这方面,中国有强大的数字支付、发展充分的互联网应用,保障数字权益的法律法规也相继出台,理应在隐私计算领域走在前列。”在袁晨看来,隐私计算在国内的蓬勃兴起,正是中国数字经济发展的生动写照。
“上海发展隐私计算拥有得天独厚的条件。”光之树科技创始人张佳辰说,这也是公司将总部设在张江的原因。去年底,上海数据交易所揭牌成立,光之树科技成为该交易所的首批技术服务方。在她看来,上海集聚了大量半导体企业和互联网产业,还有大量金融机构和生物医药企业,在隐私计算的“护航”下,将催生出更多新业态、新模式,让数字经济跑得更快、更稳。