每个人都在不经意的时候,走进了“数字化生存”中。我们有了新的认识,新的能力,同时也感受到了巨大的挑战和更多的不确定性。我们该如何更好地迎接新世界的到来,理解“数字化”,以及“数字化生存”。
有研究机构曾讨论了数据的价值以及消费者在真实环境下的隐私决策、隐私风险以及应运而生的隐私工程和隐私增强技术。由此不难发现,由于数据具有全新的、与过去有形要素截然不同的本质属性,各利益相关方对数据问题的理解往往局限在主观视角内,容易陷入“盲人摸象”的困局。这背后根本原因在于人们对数据本质的理解不够,或缺乏一个基本共识。因此,要在保护数据安全和隐私的前提下,更好地让数字技术服务于社会和用户,我们需要一个更加整体的和平衡的视角,帮助我们更好地认识数据本质。
在此我们需要提出一个整体理解数据和隐私本质问题的综合框架——数据权衡框架。
正好开放型研究机构罗汉堂近期发布了《理解大数据:数字时代的数据和隐私》(中文版)。报告尝试回应数据价值、数据分享风险和解决方案、数据治理原则等问题,并建立了理解数据的整体性框架。
罗汉堂,于2018年6月26日在杭州成立,是由阿里巴巴倡议,并由社会科学领域全球顶尖学者共同发起的开放型研究机构。罗汉堂首批学术委员会委员以经济学家为主,包括7位诺贝尔经济学奖得主。罗汉堂将携手更多的全球社会科学家和实践者,研究数字技术对经济和社会的影响,深刻理解并主动参与这一变革。罗汉堂的研究服务全社会,应对最重要的全球挑战,并着眼于人类社会的长期发展。
数据作为一个核心的生产要素,具有非竞争性这一本质特征(Arrow,1969)。指的是,与石油等实物商品不同,数据可以被无限次生产和使用,而初始数据和数据主体不会被损耗掉。很多人将数据比喻为新的石油,但它更像是可以传递不会消耗的火种。数据分享的范围越广,其价值也会随之增长。诺奖得主Romer(1990,2018)曾经一针见血地指出,信息是推动人类进步的一种特殊生产资料,但信息的非竞争性这个特点并未得到充分重视。所谓数据生产,我们指的是观察、记录和处理数据。虽然数据主体(个人)可以上报数据,但在大多数情况下,特别是随着数字技术的进步,数据通常由第三方观察或推断得出。
数据不等于信息。数据的价值取决于在多大程度上能够提取出解答和服务应用场景问题的信息。这个价值也会因为应用场景不同而不同。
数据的价值是在使用场景中实现的。消费者可以通过对个性化数据的分析获得匹配自己偏好的推荐,小微企业可以通过分析后的数据了解市场。另外一个例子是共享单车服务。想使用自行车的消费者通过扫码进行身份信息登录,可以当场租赁自行车。数据交换是实现这一场景的必要条件。消费者、供应商和提供相关应用的平台,都从中受益。
数据的第二个本质特征是不可分离性(non-separability),即数据使用的效果无法和数据主体完全分离。数据生产者在使用数据时可能会侵犯数据主体的隐私或忽视他们的数据安全,这正是隐私和安全问题的根源。
因此,数据的两个本质特征决定了,一方面,数据主体并非是生产和使用数据的一方,而且往往可以多方同时生产和使用而不会对数据造成损耗,这就和其他物理商品有本质不同;另一方面,数据主体和数据的生产以及使用也无法完全分离:如果数据主体不允许自身的活动被观察到,就不会有数据产生,同时数据的使用也可能会影响到数据主体。一个合理的数据治理和权益分配机制,应当让各参与方有动机参与到数据的生产、交互和应用,同时保护好数据相关对象的隐私和数据安全。
虽然数据共享会带来隐私风险,但如果有恰当的机制设计和技术保障(见第四章),风险和收益之间的权衡可以变得可控。
很多先例表明,科技发展带来新的挑战,也带来新的解决方案。比如人们曾经非常担忧乘坐飞机和汽车旅行会有死亡风险,而且这些风险可能永远不会完全杜绝。但有了先进的飞行和汽车安全保障技术,加上政府监管和行业自律,如今很少人会因为在出行和风险之间做出权衡而避免乘坐这两种交通工具。电梯安全问题也与此相似,在纯技术层面,电梯的安全风险几乎可以被完全消除。同样,有了完善法规和先进加工技术,一个人摄入的食物量与他食物中毒的风险几乎没有关系。数字隐私保护可能永远达不到电梯运行的安全水平,但这不能成为我们停止追求完美的理由。
考虑到数据分享对普惠性繁荣的重要意义,隐私风险不应被视为阻碍信息分享的理由。真正的答案不在光谱两端,我们可以运用报告提供的数据权衡框架来找到中间地带——在促进数据流动的益处与隐私和安全保护的成本之间达成合理的平衡。随着机制设计的改进和相应支持技术的发展,这种权衡本身也在发生变化。