您的位置:首页 >新闻资讯 >

计算机科学课程必须强调隐私超过能力

2019-08-05 12:02:58来源:

隐私的概念在很多方面与计算机科学课程在过去十年中推动的数据驱动思维方式相对立。数据可用性和分析能力的巨大进步已导致许多课程重塑为课程教学如何管理,探索,评估,理解和利用这些新发现的数字财富。深度学习和其他分析课程经常超出能力范围。相比之下,程序员应该以隐私的名义放弃数据丰富的想法是一种在许多课程中很少受到关注的观点。

今天的计算机科学课程集中在为未来的技术领导者做好准备,以利用数字革命。从管理“大数据”到通过深度学习来理解它,课程作品大量强调了当今数字化大潮的积极因素,而不是它可能对隐私,安全和安全带来的巨大负面影响。

过去,隐私在网络安全的标题下经常被归为一种,并且被置于事后的想法中。隐私侵犯主要是在公司失去对客户数据的控制的背景下进行的,而不是故意以侵犯隐私的方式利用这些数据。

一家公司从其客户那里收集了大量数据,没有任何形式的网络入侵并合法地将这些数据转售给其他人,因此通常被视为保护隐私,因为它成功地保护了手中的数据免受损失。

越来越多的计划开始将某种形式的道德培训纳入其课程。然而,这里的重点主要集中在程序员自身,强调如何思考他们如何处理用户数据以及如何解决他们设计中的偏见。这些课程可能会强调人工智能可解释性等主题,以减轻无意的人口偏见和考虑算法损害,例如为什么建立一个可以强行揭露脆弱社区成员的人工智能系统可能会造成严重伤害,因此即使它代表一个伟大的,也不应该追求技术成就。

一些程序教导遵守GDPR等隐私法,但这种指导通常围绕“最小化”,其中数据收集被调整以符合法律的字母,如果不是它的精神,利用法律的无数漏洞和豁免。

相比之下,图书馆和信息科学课程历来强调隐私和公民自由问题,特别是数据收集的最小化。与我们背后的数字庞然大物相比,我们在网上行为和兴趣的每一个字节都在吸尘,历史上,图书馆一直采用恰恰相反的立场,只保留他们所需的最少信息,并在第一时间删除数据。

图书馆历史上对我们最亲密和不受约束的兴趣有着极大的洞察力,经常记录我们父母从图书馆看到的第一本儿童书中的信息消费,以便将其作为婴儿读给我们。如果图书馆保留了这些信息,他们就可以构建令人难以置信的个性化推荐系统,并产生有利可图的收入流,转售该数据或使其可用于广告

相反,大多数公共图书馆都实行绝对最小化,其中每个数据点在不再需要时被丢弃。大多数公共图书馆历史上只保留当前签出的项目列表,而不是保留用户的整个结帐历史记录,一旦退回材料就将其删除。

这种最小化是出于必要,因为图书馆,特别是在互联网时代之前,对具有监督意识的当局非常感兴趣。

然而,计算机科学课程在历史上并没有强调这种尽量减少成本的想法。恰恰相反,数据囤积被视为无限财富之路。毕竟,即使您今天支付服务费用,您仍然是产品,因为数据耗尽比订阅费用更有价值。

在数据分析方面,隐私自然会与功能冲突。数据越多,分辨率越高,算法产生的洞察力就越多。因此,越多的公司优先考虑隐私并主动删除他们所能做的一切,并最大限度地降低他们必须收集的内容的分辨率,他们的分析能力就越少。

这代表了一种哲学上的权衡。一方面,计算机科学专业的学生被教导他们能够以最高分辨率收集他们所能获得的每个数据点,并无限期地囤积它。这一直延伸到诊断日志记录之类的事情,这些事情往往成为一种全有或全无的概念,甚至导致大公司遭遇严重的安全漏洞。另一方面,像图书馆和信息科学这样的学科强调隐私而不是能力,在安全的情况下摆脱数据。

当涉及到政府监控,数据泄露,道德问题研究,内部威胁和其他隐私问题时,公司对用户的数据越少,可以滥用的信息就越少,存储和分析成本就越低。如果一家公司可以使用数TB的聚合数据而不是1 PB的个人级别高分辨率数据,那么它可以节省大量成本并将许多批次分析转移到实时。

最后,或许我们应该强调“隐私优先”,而不是将“数据是新油”这样的格言纳入未来技术领导者的词汇中,而是关注公司如何绝对最小化他们收集的数据以确保更多隐私 - 保护和减少奥威尔的未来。