一项新研究认为,人际互动数据或可长期用来识别匿名数据集中个体的身份。英国伦敦帝国理工学院的Yves-Alexandre de Montjoye和同事研究认为,处理这类数据的现行做法可能并不符合欧盟《通用数据保护条例》(GDPR)的匿名化标准。
为了开展服务或出于研究目的,短信应用、手机运营商、社交媒体平台和其他应用都会收集细粒度的互动数据。这些数据已被用来研究个体间的互动模式,预测流行病的空间传播,以及评估友情对政治动员的影响。根据当前的数据保护条例,这些数据无需征得用户同意就能分享和出售,但前提是数据必须匿名。
在1月26日发表于《自然—通讯》的一项研究中,Montjoye和Ana-Maria Cretu等发现,人们的互动数据能保持长期稳定,这或许能用来识别匿名数据集中个体的身份。
作者开发了一款基于深度学习的模型,他们训练这个模型根据个体的互动网络来识别他们的身份,并应用于一个在不同时期收集信息的逾4万人的数据集。该模型能基于个体的2级(2-hop)互动网络(与目标个体相隔1人的个体互动)识别出52%的人,基于个体的直接(1级)互动网络识别出15%的人。
由于这类互动网络能保持长期稳定,作者在20周后还能用个体的2级互动网络识别出24%的人。当作者将该模型用于一个587人的蓝牙近距离数据集时,该模型可以识别出超过26%的人。
这项研究结果表明,匿名化、非连接互动数据或具有长期可识别性,这可能对隐私保护条例的遵守具有启示意义。他们认为,接入控制和隐私增强系统这类安全措施或能防止这种个人身份被识别的情况发生。(来源:明升官网明升体育app报 冯维维)
相关论文信息:
版权声明:凡本网注明“来源:明升官网明升体育app报、明升手机版(明升官网)、明升体育app手机版杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、明升头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。