编者按:本文来自微信公众号“新智元”(ID:AI_era),来源:cnet,编辑:LRS,36氪经授权发布。
上周六,在一个黑客论坛上,一个用户免费发布了上亿用户的Facebook数据。
公开的数据包括来自106个国家和地区的超过5.33亿Facebook用户的个人信息,其中包括超过3200万条美国用户记录,1100万条英国用户记录和600万条印度用户记录。
数据内容包括他们的电话号码,Facebook ID,全名,位置,生日,个人简历,部分人群的数据还包括电子邮件地址。
这批数据通过随机抽样检测验证了真实性。
网络犯罪公司Hudson Rock的CTO Alon Gal首先发现了这些数据。
Gal在1月份首次发现了泄漏的数据,当时在那个黑客论坛中,有一个用户在宣传一个机器人,这个机器人可以付费为用户查询数亿Facebook用户的电话号码。
Gal认为,一个包含私人信息的大型数据库,肯定会导致犯罪分子利用这些数据进行社会工程攻击或黑客攻击。
2015年9月,英国咨询公司剑桥分析公司在未经Facebook用户同意的情况下获取数百万Facebook用户的个人数据,而这些数据的主要用途则是政治广告,史称Facebook-剑桥分析数据丑闻。
Facebook的用户数据是被一款名为 "这是你的数字生活 "(This Is Your Digital Life)的应用收集,该应用由数据科学家亚历山大·科根及其公司Global Science Research于2013年开发。该应用通过提问来收集用户的回答,并能通过Facebook的Open Graph平台收集用户的Facebook好友的个人数据。
该应用获取了多达8700万份Facebook个人用户资料。剑桥分析公司获得这些数据后对此展开分析并根据分析的结果为2016年泰德·克鲁兹和特朗普的总统竞选活动提供帮助。2018年5月,剑桥分析公司申请破产。
消息曝光后,Facebook为非法收集数据的事件道歉,此外扎克伯格还需前往美国国会作证。
2019年7月,联邦贸易委员会宣布Facebook因违反隐私规定,必须缴纳50亿美元的罚款;
2019年9月,一个Facebook用户的电话号码数据库泄漏,总共包含4.19亿条记录,其中美国用户1.33亿条,英国1800万条和越南5000万条。
Facebook发言人杰伊·南卡罗表示,这批数据的获取是基于2019年的一个漏洞,目前漏洞已经被修复了。在Facebook拒绝对用户电话号码访问时,数据就已经被抓取。
究竟是谁抓取了数据,何时从Facebook抓取了数据以及原因,仍然是一个未解之谜。
2020年,国内数据泄露新闻也屡见不鲜。
3月9日,微博5.38亿数据在暗网售卖,包括用户ID、账号发布的微博数、粉丝数、关注数、性别、地理位置等,售价0.177比特币。
4月16日,青岛某医院6000多人就诊名单泄露,并被谣传确诊新冠肺炎。
4月,国内某高校学生发现自己个人所得税App上有陌生公司的就职记录,疑似学生信息遭到企业冒用,达到偷税漏税目的。
4月,有媒体报道,浙江某银行有内部人员违规泄露客户信息。其中,浙江某农商银行被银保监会罚款30万,泄露信息的内部员工被禁业三年。
5月7日,江苏省南通市公安局公布,破获一起特大“暗网”侵犯公民个人信息案,涉及5000多万条个人信息。
8月,河北省某物流公司报案称:其公司员工账号被本公司物流风险控制系统监测出有违规异地查询非本网点运单号信息的行为,导致大量客户隐私信息有可能泄露,涉案金额达120万元。
12月14日消息,央视记者调查发现,简历信息贩卖已经形成了一条灰色产业链。据报道,不少人在招聘平台上传建立后就会收到骚扰电话,自己的个人简历信息被招聘网站下载后转手卖掉,QQ等社交平台便是贩卖集中地。
近年来,联邦学习不断火热,联邦机器学习是一个机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。
AI的初期发展必然伴随着数据的收集,如何控制数据不被泄露,增强道德意识,也许还有很长的路要走。
https://www.cnet.com/news/facebook-data-for-over-500m-users-reportedly-leaks-online/