时间:2019-06-11 来源:互联网 浏览量:
引发争议的数据库名为MS Celeb,发布于2016年。“Celeb”取自“名人(Celebrity)”,顾名思义,微软从名人名单中选择了流行度靠前的10万人,并利用搜索引擎为每个名人提供大约100张照片,从而产生了大约1000万照片。
图自微软官网。数据对人脸识别技术的发展至关重要。微软官网介绍显示,MS Celeb的发布旨在促进学术研究,鼓励研究人员开发最好的人脸识别技术。由于数据库中包含大规模的真实人脸照片,研究人员可以用它来训练和评估自己的人脸识别算法。
据《金融时报》报道,微软是通过知识共享许可协议(Creative Commons license)抓取和收录这些照片的。按照知识共享许可协议,照片的版权所有者许可后,微软可以将照片用于学术研究。
版权所有者许可,并不等同于照片中的被拍摄者许可。有分析人士指出,人脸照片属于生物识别数据,按照欧盟GDPR的规定,处理此类数据须征得当事人的明确同意。因此,微软的数据库面临法律上的风险。
不仅如此,有研究人员发现,MS Celeb数据库所收录的已不仅仅是名人照片,还有一些普通人的照片。据《金融时报》报道,信息安全记者Kim Zetter、技术作家Adam Greenfield、负责消费者隐私保护事务的原美国联邦贸易委员会专员Julie Brill等人都在其中。
《金融时报》称,这些人完全没有意识到自己的人脸照片被收录到了微软的数据库中。Adam Greenfield对《金融时报》表示,这说明微软无法保证其研究人员的诚信。“我并不是公众人物,没有任何道理放弃自己的隐私权。”他说。
“微软拓展了'名人'一词的含义,仅仅在网上工作并拥有数字身份的人也被纳入了'名人'的范畴。”研究人员Adam Harvey在接受《金融时报》采访时表示。
针对质疑,微软回应《金融时报》称,MS Celeb仅被用于学术用途。但公开资料显示,多家公司使用过MS Celeb进行算法训练,如英伟达、IBM、松下、日立等。
虽然微软表示已经删除MS Celeb,但Adam Harvey指出,这些数据并不会完全消失。他说,一旦数据被发布、被下载,它就存在于全世界的硬盘上,微软无法阻止人们根据自己的目的发布和使用数据。
微软亚洲研究院公开资料显示,其人脸算法已经在微软的诸多产品上得到应用,包括Windows 10 Hello 人脸登录、微软认知服务 Face API,Xbox、Office、必应搜索、微软小冰、Seeing AI等等。
事实上,微软高层在近几年中一直表态称要限制人脸识别技术的使用。2018年7月,微软总裁Brad Smith在博客中称,政府应考虑如何规范人脸识别技术;12月,微软呼吁立法监管人脸识别软件。另微软计划于今年在其公司内部实施防止人脸识别技术滥用的道德准则。
编译、综合:南都记者 冯群星