深度分析:数据驱动奥巴马胜选

2012年11月11日13:58  
数据驱动奥巴马胜选 数据驱动奥巴马胜选
今年8月,奥巴马在Reddit和网友进行互动。 今年8月,奥巴马在Reddit和网友进行互动。

  美国时代周刊报道称,数据驱动的竞选决策是奥巴马竞选获胜的关键。数十名数据分析者组成的团队在筹集竞选经费、锁定目标选民、督促选民投票等各个环节的决策中都发挥了重要作用。时代周刊最后断言,政治活动的大数据时代已经到来。以下为全文:

  今年暮春,奥巴马团队中的数据分析人员注意到,乔治-克鲁尼对于西海岸年龄在40至49岁的女性非常有吸引力,那么这个群体无疑最有希望捐钱获得一次和克鲁尼晚餐的机会,当然,还有克鲁尼支持的候选人:奥巴马。

  正如他们在奥巴马连任竞选两年里对其它数据进行收集、储存和分析的那样,奥巴马高级竞选助手们决定利用这一发现。他们试图寻找一位对女性群体有类似吸引力的东海岸的名人,以达到像克鲁尼筹款晚会那样筹集数百万美元的成绩。一名高级竞选顾问说:“我们有大把选择,但最后决定的人选是莎拉-杰西卡-帕克。”于是下一场与奥巴马的晚宴在帕克家中举行。

  对于普通公众来说,他们根本无法知道选择帕克家举行筹款活动的主意是来自数据挖掘技术对同一类支持者的发现:喜欢竞争、小型晚宴、名人。从一开始,竞选经理吉姆-梅西纳就承诺要进行一个完全不同的、由数据驱动的竞选,政治将是目标,但政治本能可能不再是方式。他在就职后称:“我们将计量竞选活动的所有东西。”他雇佣的分析部门的规模是2008年竞选时规模的5倍。芝加哥竞选总部还有一位名为拉伊德-加尼的“首席科学家”,他先前的数据分析曾使超市的打折活动取得最大效果。

  不过,数十名数据分析者组成的团队具体如何工作是一个机密。当被问及相关的工作时,竞选发言人本-拉波特称:“这是我们的核密码”。数据挖掘实验被有很多神秘的代号,例如独角鲸,或是追梦人。这个团队甚至要与其他竞选工作人员分开工作,在竞选总部北端一个没有窗户的办公室里工作。“科学家们”在白宫向奥巴马和他的高级官员进行例行工作汇报。选举团队认为这是他们所拥有的对罗姆尼竞选团队的最大机制优势:数据。

  11月4日,一批奥巴马团队的高级顾问同意向《时代周刊》介绍他们的工作,不过要求匿名,且必须在大选结果出来后再刊登。下面是他们的经验:

  如何筹集10亿美元

  尽管奥巴马团队在赢得2008年选举时因为使用高科技手段而获得赞扬,但它的成功掩盖了一个巨大的弱点:太多的数据库。都是打电话,志愿者和奥巴马团队工作人员使用的名单是不同的;而呼吁选民投票的名单从未与筹款名单进行过比对。这就像是911恐怖袭击事件发生前的的中情局(CIA)和联邦调查局(FBI),两大机构从不共享数据。一名工作人员称:“我们最初分析认为,民主党政治的问题在于有太多数据库,这些数据库之间没有交流。”所以在头18个月里,工作人员创造建了一个单一的规模系统,它将融合来自民调者、筹款者、基层工作人员、消费者数据库、社交媒体、移动电话清单收集到的所有信息。

  新的巨大档案不仅能告诉竞选团队如何发现选民、得到他们的关注,它还允许数据分析人员进行实验,以预测何种类型的选民能够被某种呼吁手段所说服。基层办公室的电话清单不仅是只列有名字和号码,它们还按照人们的易说服性排列,竞选最重要的优先选民被排在最前边。75%的决定性因素包括年龄、性别、种族、居民区和投票数据。有关选民的消费数据也被用于完善情况。一名高级官员称:“我们可以预测哪些人可以通过网络进行说服,哪些人通过邮件进行说服。这些模型今年发挥的作用要比08年大,因为它可以使我们的时间更有效率。”

  例如,竞选团队发现那些取消定阅2008年竞选电子邮件的人们是头号目标,只要获得进行一些人际交流,他们就会返回支持阵营。团队也会针对各种人群进行测试,以增进传播效果。例如他们会测试当地志愿者的打出的电话有效还是非摇摆州志愿者的电话有效。

  新的巨型档案也使竞选团队能够筹集比它最初设想的还要多的资金。在八月份之前,奥巴马阵营里的所有人都大声抱怨竞选筹款不足,但随后来自互联网的资金大幅上升。大部分网上筹集到的现金来自复杂的、由数据驱动的一个电子邮件宣传行动,每天要发出数十个呼吁捐款的邮件。数据收集和分析再次发挥了极为重要的作用。竞选团队会使用不同的邮件标题、发送者和邮件内容,最后发现,春季时以第一夫人米歇尔名义发送的邮件筹款最多,而有时竞选主管梅西纳的邮件表现要好于副总统拜登。在很多情况下,表现最好的筹款人比最差的吸引的资金相差10倍。

  芝加哥竞选发现那些参与“便捷捐款”项目的人所提供的资金数量是其他捐款者的4倍,所以这一项目得到了扩大和更多的激励措施,到10月底。这个项目贡献了大笔捐款。

  预测投票率

  为奥巴马竞选团队打开钱包的数据驱动手段随后被用于预测投票率,分析团队使用四个投票数据流来为关键州选民画出一个详细的图景。一位官员称,过去一个月分析团队仅在俄亥俄州就掌握了29000人的民调数据,这使他们可以在任何时候来深度分析每一个选民群体的倾向。这是一个巨大的优势。例如在奥巴马第一次总统辩论表现不佳时,它可以帮助竞选团队来看到是哪些选民改变了立场,哪些没有改变立场。这一数据库帮助奥巴马竞选团队助手们度过了十月份的动荡选情。

  奥巴马竞选团队还在线进行了督促选民投票的活动,首次尝试大规模使用Facebook来进行督促选民投票。在竞选的最后几周,竞选团队向那些下载APP的人们发送附有他们在摇摆州朋友照片的信息,告知他们点击一个按钮来呼吁朋友们采取行动,例如进行投票登记、提前选票或者参加投票。竞选团队发现近二成的目标人群采取了行动。

  数据还帮助驱动了竞选团队的广告购买,梅西纳根据大规模的内部数据来决定在哪里投放广告,而不是依赖外部媒体咨询人士。一名官员称:“我们根据一些真的很复杂的模型来确定我们的目标选民。”例如,如果发现迈阿密戴德县的35岁以下女性是目标,竞选团队就会向这些人爱看的节目投放广告,他称,电视广告的有效率因此比2008年提高了14个百分点。

  数据还帮助竞选团队决定让奥巴马“不走寻常路”。8月奥巴马决定在热门社区Reddit和网友互动(相关报道),但很多奥巴马的高级助手不解。一名竞选团队人员说:“为什么是Reddit?因为这是我们的目标群体。”

  根据数据驱动作出的决策在为奥巴马赢得第二个任期发挥了巨大的作用,它将成为2012年选战更为密切关注的一个研究部分。这是那些根据经验和灵感来作出判断的华盛顿竞选人士快速失势的又一个迹象。政治活动的大数据时代已经到来。

(编辑:SN005)
分享到:
保存  |  打印  |  关闭
  • 新闻中央委员候选人备选建议名单提交酝酿
  • 体育英超-曼联0-2落后3-2逆转 阿森纳失点3-3
  • 娱乐何韵诗出柜:很骄傲可以讲我是同志
  • 财经消息称油价新机制敲定 4%涨跌幅或取消
  • 科技苹果支付2100万美元获时钟设计授权(图)
  • 博客实拍:赤峰市大雪纷飞 延庆雪后如画美景
  • 读书霸占兄妻:历史上宫闱丑闻最多的朝代
  • 教育男生为女生过节标语火辣 中国教育盛典
  • 育儿9岁女生孝德课上跪求爸爸原谅(图)