是时候讨论数字数据研究中的同意了

2019-08-01 11:19:29来源：

今天的人们无论走到哪里都会发布数据。来自其金融交易，社交媒体平台，可穿戴健康监视器，智能手机应用程序和电话的数据流。

通过利用电话提供商，技术公司和政府机构收集的大量数字数据集，研究人员希望揭示数据中的模式并最终改善生活。这些研究的范围包括对尼泊尔通话记录的分析，该记录显示人们在地震发生后搬到哪里，以便提供援助;根据谷歌地图智能手机应用程序的位置数据估算污染风险。但是，对于如何进行这项研究的道德规范，特别是那些提供数据的人应该如何同意参与，却相对较少受到关注。

一般而言，涉及人的研究提案受到1947年纽伦堡法典和随后的1964年赫尔辛基宣言的指导原则的审查。这些是在第二次世界大战期间不合情理的纳粹实验之后形成的道德原则。他们要求研究人员从了解研究主题的人那里获得自愿同意，以便做出是否参与的明智决定。但访问匿名和汇总数据的研究通常不需要知情同意。

一个原因是，理论上，这些数据不再与人相关联。但事实上，风险仍然存在。许多研究表明，可以在匿名和聚合的数据集中识别个体。上周，伦敦帝国学院和鲁汶天主教鲁汶大学-LA-Neuve的，比利时，研究人员在发表于一纸证明自然通讯(L.乌鸦。等自然COMMUN10，3069; 2019)是怎么回事即使匿名和汇总的数据集不完整，也可以重新识别人员。

其中一个含义是，弱势个人和群体 - 包括无证移民，持不同政见者或种族和宗教群体成员 - 有可能通过数字数据研究被识别并因此成为目标。一个新闻专题中自然五月描述的通过匿名，汇总的电话通话记录追踪人群的位置的潜在意外后果的例子(见自然569，614-617; 2019)。

评估风险

对潜在误用的担忧也适用于源自智能手机应用，社交网络，可穿戴设备或卫星图像的匿名和汇总数据。目前，关于数字数据研究的益处是否超过风险的决定很大程度上取决于收集和分析数据的研究人员 - 而不是那些无意中参与的人。

纽伦堡和赫尔辛基的知情同意原则演变为纠正这种不平衡。然而，在大数据时代，同意是复杂的。与大多数生物医学研究不同，使用数字数据集的研究人员很少自己收集主要数据。相反，电信公司，技术公司和国家机构收集信息并决定是否允许对其进行研究。

如果被监控的人员可以选择分享他们的数据进行研究，那么同意就需要相对开放。这部分是因为对大数据的研究搜索了意外的模式。此外，它们可能导致结果，或导致无法预测的潜在应用。例如，研究人员研究了土耳其数百万来电者的匿名电话记录，以了解该国叙利亚难民的位置和行动是否可以揭示他们的生活方面，可能有一天可能会提供有用的措施。研究人员不可能要求参与者为了明确的目的分享他们的数据，因为研究人员自己并不知道他们的研究将在何处发挥作用。

在美国，根据共同规则的“广泛同意”条款允许使用匿名的汇总数据进行研究，该规则是关于人的研究的联邦政策。但广泛的同意并不等于知情同意，因为参与者不知道他们的数据将如何使用，他们也不会意识到潜在的危害。在欧盟，使用匿名，汇总数据的研究人员可免于遵守通用数据保护法规。

如果完全同意，那么通常只需要一个盒子来勾选很少人在急于激活他们的电话服务或应用程序时阅读的条款和条件。大数据研究往往忽视了涉及人的其他研究中的一个关键原则 - 参与者应该被允许随时退出研究。这是因为从解除标识的汇集数据集中提取和删除人员数据在技术上非常困难。

如果执行得当，知情同意 - 医学研究的黄金标准 - 包括临床研究人员和研究参与者之间的对话。很难想象如何在数百万登录应用程序的人之间复制这样的对话，但是没有理由放弃。

在日益增长的数据治理领域，计算机科学家，生物伦理学家以及法律和人权学者正在集中精力研究如何将代理机构返回给数据来源的人。创意的范围包括在收集数据时标记数据，以便个人可以看到如何使用这些信息，创建能够评估大数字数据研究安全性的机构审查委员会。

围绕数字同意的对话正在发生，但必须更加紧迫。它们需要由独立于政府和行业的组织(如国家数据监管机构)领导，以便强大的利益不会占据主导地位。也就是说，他们应该包括收集数据的公司，以及使用数字数据进行研究的伦理学家，人权组织，国家科学院和研究人员。

纽伦堡法典旨在保护无辜人民免受伤害风险。这些风险并没有消失，这就是为什么需要有一套适合数字时代的更新指南。