作者: Neo
上周末,Facebook爆出公司历史上最大的数据泄漏问题,两家Facebook的合作机构StrategicCommunicationLaboratories(SCL)和CambridgeAnalytica被封杀。
这两个公司做的事情可不一般,其中SCL主要业务是为全球各类机构提供数据分析和决策,而CambridgeAnalytica更有名,他们是美国总统特朗普在2016年竞选时的数据分析团队,并帮助他成功上位。
这起不同寻常的封杀案背后,牵扯出了一个关于数据、隐私、广告和总统竞选的离奇故事。
2014年,当时,作为一家新兴的数据机构,剑桥分析的主业就是分析选民。在2014年美国中期选举期间,他们接受了一个大任务——开发一个新的选民分析工具,了解他们的心理情况和政治倾向,并想办法影响到他们的投票。
这个项目的投资人RobertMercer是美国共和党重要的“金主”之一,他为该项目投入了1500万美元,这笔钱也落入到了剑桥分析的口袋。
“拿人钱财,替人办事”,剑桥分析开始着手新工具的开发,但很快他们遇到了一个问题——建立一个选民的心理学档案需要大量的数据支持,其成本和规模都是巨量的,如果没有数据,新的工具根本无法运作。
传统的选民分析机构使用的是投票记录和消费者购买记录,来分析预测他们的政治倾向和投票意愿。而剑桥分析显然不属于这一类,他们要做的是极尽细致的选民分析,甚至是他/她的心理人格都要知晓。于是乎,剑桥分析把目光转向了Facebook。
在美国,Facebook是最大的社交媒体网站,同样也是一个巨大的选民聚集地。但问题在于,如何才能从一家互联网巨头的手里套出来它最宝贵的用户数据呢?
他们想到了一个办法——给数据搜集挂上一个“学术头衔”。
剑桥分析找到了英国的剑桥大学心理测试学中心。当时,该中心的研究人员正在进行一个项目,根据人们在Facebook上表现出的喜好,通过技术手段绘制个人的性格特征。研究人员付给受访者一笔小钱,让他们下载一款app,并参加个性测试,而该程序将会从受访者的个人资料和好友资料中收集隐私数据和信息。在当时,这种“学术测试”是被Facebook所允许的。研究人员称通过测试,他们能够比父母或者伴侣更了解这些受访者。
但剑桥大学的研究中心在了解到剑桥分析的来意后断然拒绝了他们。不过剑桥分析找到了替代法,他们与同在研究中心工作的教授:AleksandrKogan进行了合作。Kogan教授的身份可不一般,他是一名俄裔美国人,在圣彼得堡州立大学任助理教授,同时也在剑桥大学心理测试学中心工作,而根据后来卫报的调查显示,他还接受了来自俄罗斯政府的资金援助,用以研究Facebook用户的情绪变化。
Kogan教授在与剑桥分析搭伙之后,快速的开发出了一款自己的App,名为“thisisyourdigitallife(你的数字生活)”,里面会对受访者进行人格测验,而这个APP还能同时获的大量的用户数据,诸如:他们喜欢什么、在哪儿居住等等。
从2014年6月开始,Kogan教授就开始为剑桥分析收集Facebook用户的数据,而后者为他负担成本,根据公司邮件和财务数据显示,整个计划共耗资超过80万美元,项目结束后Kogan教授还可以保留数据副本,用于他自己的研究。
在当时,这项合作是符合Facebook规定,平台政策允许应用程序可以读取个人的好友信息,但只能作为改善用户体验,不能转手出售,更不能用于广告营销或其他用途。之后不久,Facebook就在2014年底停掉了类似的合作项目。但是数据已经泄露。
那么,剑桥分析总计获得了多少数据?答案是:5000万份!其中3000万份收到了足够详细的信息,让他们足以将用户与其他数据源进行匹配,并且完成个人心理档案的建立。
而在这其中,剑桥分析实际只获得了27万个用户的允许,同意他们收集个人信息。
泄露的邮件,里面透露了信息涵盖的范围
Kogan教授收集的数据从他自己创建的公司Global Science Research公司通过数据交易的方式交给了SCL,而SCL与剑桥分析互为兄弟公司,二者有着共同的CEO Alexander Nix,数据也就从SCL给到了剑桥分析,并被用于美国的各类政治竞选。
这笔数据被后来事件的“告密者”Wylie称作“来自Facebook的馈赠”,而正是这笔数据让剑桥分析完成了新工具模型的开发,兑现了跟Mercers定下的承诺,还挣到了1500万美元。
泄露的数据也成为后来一系列事件的导火索。2015年底,卫报就曾爆出,剑桥分析利用这笔Facebook用户的私人数据帮助当时的总统候选人Cruz竞选。
当时,Facebook就发出声明,表示将严肃追查该事件,并要求涉事方马上删除数据,不过根据线报透露的消息,这些数据直到17年底依旧可以访问,并且在内部数据库中可以看到大量用户的个人信息,包括用户ID,以及Kogan的研究分析结果。
现在Facebook确认了数据泄露属实,并且要求SCL和剑桥分析以法律保证,销毁了所有涉嫌违规的数据。
不过数据泄露的影响已经显现出来。
在随后的2016年总统竞选中,时任特朗普竞选团队的剑桥分析,利用数据模型在大选中尽可能找出中间选民,并制造更多的“共鸣信息”影响他们的投票结果。在卫报报道中,这个数据库中包含11个州的200万个匹配文件,这意味着数据库中的个人信息与选举登记簿匹配。根据估计,5000万份数据资料占到了北美Facebook用户的近1/3,其中有1/4是选民。
这些数据的作用有多大呢?就在今年2月底,Facebook曾放出一份特朗普和希拉里在竞选时的广告数据。Facebook 高管Andrew Bosworth(News feed之父)爆料,特朗普团队的竞选期间的CPM价格要高于希拉里。
Bosworth称,广告展示的价格取决于受众规模和传播计划,一般而言,如果Facebook的广告系统认为用户会与这条广告进行更多的互动,如点击、评论等等,那么价格就会相对更低。这与数据有什么关系呢?
因为希拉里团队的思路是让更多人看到广告,越低的CPM价格可以让广告覆盖更多的用户,所以其Facebook广告的优化思路完全是以“量”为重,而他是谁似乎并不重要。
但与之相反,特朗普的竞选团队是“精准定向”,他们要把广告投给那些最可能给特朗普做政治捐款,但还没给钱的人投放的,并且要想办法转化那些中间选民向特朗普阵营倾斜。连线杂志称,在选举结束之后,根据统计,特朗普的团队总共从网络上获得了2.5亿美元的政治献金。
为什么特朗普的广告比希拉里的效果要好得多?现在答案出来了,因为特朗普的数字广告主要针对的是关键选民,而如何找到这些选民则依赖于此前剑桥分析建立起的工具、计算模型和数据,从而才能找对人,花对钱!
此刻,开头我们提到的一切都串联起来了:数据、选民、广告策略和美国大选,无数的人和利益都交织在这个圈子里,组成了这个故事。而这个故事结尾,SCL和剑桥分析被Facebook封杀,并将失去未来在北美市场中两党的支持,同时其CEO开始接受法律调查和质询,Facebook因泄露的数据再次登上头条,并想尽办法撇清自己对竞选的影响,而那些被“操纵”的用户,还没有人为他们受到的损失发出声音。