闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾剧懓顪冪€n亝鎹i柣顓炴閵嗘帒顫濋敐鍛婵°倗濮烽崑娑⑺囬悽绋挎瀬鐎广儱顦粈瀣亜閹哄秶鍔嶆い鏂挎喘濮婄粯鎷呴崨濠呯闂佺ǹ绨洪崐婵嗙暦閻㈠憡鏅濋柍褜鍓熼崺銉﹀緞閹邦剦娼婇梺缁樶缚閺佺ǹ岣挎径鎰拻濞达絿枪椤ュ繘鏌涚€n亝顥㈢€规洘濞婃俊鐑藉Ψ鎼淬垻娲寸€规洏鍔庨埀顒佺⊕鑿ら柟閿嬫そ濮婃椽宕ㄦ繝鍌氼潓閻庢鍠栭悥濂哥嵁閸℃稑閱囬柕澶涘閸樼敻姊洪崨濠傚鐎殿喖鐖奸獮鎴︽晲閸モ晝锛滃銈嗘閸嬫劖鏅堕敂閿亾鐟欏嫭绀€鐎规洦鍓熼崺銉﹀緞婵炵偓鐎婚梺鐟扮摠缁诲倻绮婚悧鍫㈢瘈闁汇垽娼цⅷ闂佹悶鍔庨崢褔鍩㈤弬搴撴婵炲棙鍨崇划瀛樼節閻㈤潧浠滄い鏇ㄥ幗閹便劑鎮介崹顐f闂佺粯鍔曢悘姘讹綖閺囥垺鐓欓柣鎴烇供濞堟棃骞嗛悢鍏尖拺闁圭ǹ瀛╃壕鐢告煕鐎n偅宕岄柡灞界Ф缁辨帒螣閼姐値妲归梻浣告惈閻妲愰弴鐔侯浄闁挎洖鍊哥粈鍫㈡喐婢跺á锝夊醇閵夛妇鍙勭紓鍌欑劍宀f寧鏅堕悽鍛婄厵妞ゆ梻鐡斿▓婊堟煛娴g懓濮堥柟顖涙閸ㄩ箖鎳犻鍌涙櫒婵犵绱曢崑鎴﹀磹閺囩噥娈介煫鍥ㄧ☉缁狀垶鏌ㄩ悤鍌涘
设为书签 Ctrl+D将本页面保存为书签,全面了解最新资讯,方便快捷。 您也可下载桌面快捷方式。点击下载 | 新浪科技 | 新浪首页 | 新浪导航

一直在讨论的大数据,这次在美国大选中究竟干了什么?

2016年11月14日 11:28    创事记 微博 作者: 南七道    我有话说

  欢迎关注“创事记”的微信订阅号:sinachuangshiji

本稿件由南七道整理翻译,原文来自于Uvm、Befair等网站

特朗普入主白宫,美国大选落下帷幕。回首这场混战,大数据技术在其中其实发挥了不小的作用,甚至占据了至关重要的地位。

社交媒体上的大数据分析

从美国大选之初,各候选人各方面的数据统计就已经被统计在各家网站上。比如从这张数据来看,上图表示的是各个候选人的推文提及率。而在同样的时间序列中,特朗普在推文中的提及率占有明显的领先优势,不过其他候选人在同一个坐标轴中几乎不可见。

图中下方的图标则是关于每位共和党候选人的推文的幸福感指数进行的比较,特朗普相对于克鲁兹和卢比奥有微弱的优势,对于卡森有明显的优势。并且,特朗普的平均幸福指数比希拉里略高(5.79比5.70),但仍比桑德斯低(5.79比5.85)。虽说这些数据并不能够直接决定最后的大选结果,但也间接的为特朗普获胜起到了润滑和推动作用。

除了这些幸福指数和提及率,大数据统计还对各个候选人的各个“标签”进行了统计,而正是这些标签决定了幸福指数等相关数据的分值高低。在下图特朗普和希拉里的“标签”对比中,词语的颜色根据感情状态表示——越蓝越快乐,越紫越悲伤,而且词语的大小由加权平均tf-idf值决定。

从图中不难看出,希拉里的词图中,正面词汇与负面词汇相交织,其中比较重要的正面词汇有“经验”,“才能”,“女性”,“世界”;负面词汇有“犯罪”,“调查”和“谎言”,这也许是与电子邮件服务器丑闻相关。而特朗普的词图中,最大的词汇包括支持者形容的“前行”,以及现在的共和党初选中的“胜利”;负面词汇,或许来自于他的反对者,包括“羞辱”,“攻击”,“种族主义”,“骗子”和“危险”。

除此之外,还有可供我们参考的是词汇转移图,如图所示:

希拉里的词汇转移图与参照分布比较相似(5.76比5.77)。负面词汇包括电子邮件调查及“监狱”,“犯罪”,“囚犯”,“丑闻”等。此外,“票据”是以负面形式呈现的词汇(被理解为支付票据),但是在希拉里这里则是指比尔·希拉里。正面词汇主要有“她”,“女性”,“感谢”,“健康”,而负面词汇“憎恨”,“悲伤”,“失败者”,“诈骗”,“种族主义”较少被提及。

而特朗普有最高的幸福水平(5.79),其正面词汇有“伟大”,“爱”,“美国”,“更好”等,显然,这与他的宣传口号相关——使美国再次伟大。但是他的负面词汇包括了更多。比如“憎恨”,“种族主义”,“死亡”,“失败者”,“悲伤”,“禁止”,以及以亵渎的方式,反映了他的反对者的观点。

通过分析大众趋势,民众可以通过数据了解到谁更符合国民的标准。而社交媒体运用大数据的统计和判断使得民众判断方向发生了一定的偏差,引导了整个舆论的导向,甚至改变了很多人的原始初衷,心中的那杆秤在不知不觉中发生了一定的偏差。

个人数据团队的关键性作用

当然,这个只是社交媒体和一些数据公司较为公正的数据统计,而对于特朗普和希拉里本人而言,个人背后的数据团队比较看来,简直就是一场大数据的盛宴。

传言希拉里有一支堪比硅谷公司的大数据团队——50名专业的程序员和开发者,大部分都是曾经供职于Facebook、Google、Twitter等大型的科技公司的高层人士。在他们的帮助下,如果想要想利用更多技术手段来帮助希拉里赢取更多选票和资金,简直是轻而易举的事情。比如,民主党对于竞选页面进行细微的调整,就可以让捐赠人储存信用卡信息。这种手段常用于电商公司将窗口用户变为付费用户的手段上,但现在在政治上同样适用,很多民众在不知不觉中便已经成为了希拉里“忠实”的支持者。

除此之外,这些大数据团队还能够处理一些突发的技术问题。比如,2015年,联邦竞选委员会报告竞选筹资截止日当天,外部邮箱系统突然崩溃。虽然当时场面一片混乱,但是希拉里的竞选团队竟在4个多小时内搭建了一个临时邮箱系统Balloon,使得危及顺利解决。

这样看来,特朗普似乎只有Twitter这样一个武器,实则不然,特朗普背后的数据团队对于他商人出身的身份进行了量身打造,为这样一位本该有着金钱光环的人打造了一副政客的钢筋铁甲,使得他的辩论能力突飞猛进。特朗普背后的大数据团队着重于希拉里过去的演讲,通过关键词和数据分析来洞悉希拉里演讲的漏洞和缺点,从而为特朗普提供有力的攻击武器。

还记得曾经的辩论会吗?希拉里发言26分钟内便被特朗普打断了25次,这难道不是大数据团队支持的结果?

国内数据公司DataEye CEO汪祥斌认为,其实从上两届奥巴马的总统大选开始,大数据在整个总统大选过程中的应用已经越来越深入,从大选筹资阶段开始,精准的筹资邮件筛选到选情实时分析,选民人群精准定位,结果预测各个环节都已经开始数据化,整个总统大选已经变成一个典型的数据驱动的业务决策过程。不难看出美国的政治已经全面进入了大数据时代。

大数据公司是大选的幕后英雄

如果说到专门为民主党和共和党提供数据分析和服务的要数TargetSmart和DeepRootAnalytics这两大公司了。前者专门为民主党派和州民主党派以及他们的同盟提供大数据分析和服务;而后者则给共和党及其从属团队提供数据分析。

TargetSmart和DeepRoot都是利用Alteryx的软件来说明他们容纳、净化、混合以及分析来源不同的大规模资料。这种方法主要来分析选民的年龄结构,根据不同年龄段来分段并且打分,然后利用这些资讯来优化他们在媒体上的花销,特别是在非常重要的电视广告上,从而扩大宣传效应,使得事情的效果事半功倍。

资料将会指示客户该将他们的竞选广告放到哪,从而使得广告在目标人群的曝光率大大提升,同时还会提示他们花销的纪录,透过让客户在情景中能够意识到这个问题,不仅提供他们所做的与目标人群相关的理由,而且也会分析竞争对手或同盟所做的,对目标人群的影响,这就允许他们能够对正在进行的分配任务具有策略性,并对广告投放更聪明——把广告投放在最不显眼而又最高效的地方,同时根据其他人或组织的移动来及时做出反应。

这一届大选特朗普和希拉里总计为大选烧掉了将近1亿美金,这些钱烧在哪些地方?无外乎宣传公关,而这个其中的宣传打广告以及拉选票就占据了多数,包括电视广告,网络广告,直邮信件等等。在汪祥斌看来,如此高昂的广告投入也为大数据的应用提供了广阔的施展空间。不仅仅是筹资的多少,谁能更有效的进行精准的广告投放某种意义上来说也直接决定宣传战的结果。

大选&赌盘相爱相杀

因2016年美国总统选举胜负难料,激烈的选情也直接带动了赌客下注的热情,博彩公司因此收到创纪录的赌金。在此之前英国互联网博彩公司Betfair称,其“下一任总统”赌盘可能超越英国脱欧公投赌盘,成为历来投注金额最高的一个赌盘。目前该赌盘已经收到约1亿3000万美元的赌金。

而对于该公司而言,对于选举下注早已经是见怪不怪的事了。在此之前,该公司网站共有70多个与美国总统选举相关的赌盘,下注的赌盘从谁将赢得最多的支持票,到各党将拿下多少个州都有。而“下一任总统”赌盘是下注额最高的一个。

英国另外一博彩公司Ladbrokes则透露表现,自从该公司在4年前为本届美国总统选举收注以来,至今的下注额已达500万英镑。不过绝大多数赌金是在美国以外的地区下注的。受到美法律王法公法律的限制,美国境内的政治赌博只局限在与大学有联系的相对小的平台上,而且是供大学做学术研究用途的,不过这些数据统计结果一旦公布,公民的选择和态度就会发生相应的变化。

南七道:南七道新媒创始人,虎嗅年度作者,互联网明星创业公司脸萌、FaceU等品牌操盘手,关注互联网和科技创业。我们在找新媒体编辑,实习生,欢迎后台了解详情。微信公众号:南七道。


(声明:本文仅代表作者观点,不代表新浪网立场。)

文章关键词: 大数据 选举

分享到:
保存   |   打印   |   关闭

婵犵數濮烽弫鍛婃叏閻戣棄鏋侀柛娑橈攻閸欏繘鏌i幋锝嗩棄闁哄绶氶弻鐔兼⒒鐎靛壊妲紒鎯у⒔缁垳鎹㈠☉銏犵闁绘垵妫涢崝顖氣攽閻愭潙鐏﹂柣鐕傜畵瀹曟洟鎮㈤崗鑲╁帾婵犵數鍋涢悘婵嬪礉濮樿埖鐓熼幖鎼枛瀵喗鎱ㄦ繝鍐┿仢鐎规洘顨婇幊鏍煘閸喕娌梻鍌欑閹碱偊骞婅箛鏇炲灊鐎光偓閸曨剙浠奸梺缁樺灱濡嫰鎷戦悢鍏肩厪濠㈣埖绋撻悾閬嶆煃瑜滈崜娑㈠极婵犳艾钃熼柕濞垮劗閺€浠嬫煕閳╁啩绶遍柍褜鍓氶〃濠囧蓟閿涘嫧鍋撻敐搴′簽婵炲弶鎸抽弻鈥崇暆鐎n剛袦濡炪們鍨洪敃銏ゅ箖閵堝棙濯撮柛锔诲幗濠㈡帡姊婚崒娆戭槮闁圭⒈鍋婇幆澶嬬附缁嬭法鐛ラ梺褰掑亰閸忔绱撳鍓佸彄闁搞儯鍔庨埥澶岀磼閳ь剟宕奸姀鈥虫瀾闂婎偄娲︾粙鎴濇纯闂備胶绮崹鍏兼叏閵堝鐓曢柟杈鹃檮閳锋垶銇勯幇鈺佲偓鏇熺濠婂牊鐓犳繛鑼额嚙閻忥繝鏌¢崨顓犲煟妞ゃ垺宀搁崺鈧い鎺戝閽冪喐绻涢幋娆忕仾闁稿瀚伴幃褰掑传閸曨剚鍎撶紓浣风贰閸犳牞鐏冮梺缁橈耿濞佳勭濠婂懐纾肩紓浣癸公閼版寧顨ラ悙鎻掓殻闁糕晪绻濆畷姗€鍩℃担鍝勯叡闂傚倷娴囬崑鎰板煕閸儱绀堥柨鏇楀亾閸楅亶鎮峰▎蹇擃仹缂佽妫濋弻锝夊箛閸忓摜鐩庨梺閫炲苯澧柣妤佹礈閸欏懘姊洪崫鍕枆闁告ǹ鍋愮划濠氭偐鐠囪尙顔愬┑鐑囩秵閸撴瑦淇婃總鍛婄厽闁靛牆顦遍悾娲煛鐏炶濮傞柟顔哄€濆畷鎺戔槈濮楀棔绱�

闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾剧懓顪冪€n亝鎹i柣顓炴閵嗘帒顫濋敐鍛婵°倗濮烽崑娑⑺囬悽绋挎瀬闁瑰墽绮崑鎰版煕閹邦垰绱﹂柣銏狀煼濮婄粯鎷呴悷閭﹀殝濠电偛寮堕悧鐘茬暦閹版澘绠瑰ù锝嚽归悗顓㈡⒑缁嬭法鐏遍柛瀣仱閹繝鎮㈤崗鑲╁帾闂婎偄娲ら鍛存倶椤忓牊鐓涢柛鈥崇箲濞呭﹪鏌$仦鍓р槈閾绘牕霉閿濆毥褰掑箺閻㈠憡鈷戦柛婵嗗椤箓鏌涢弮鈧崹鍧楃嵁閸愵喖围濠㈣泛锕﹂敍婊冣攽閻愭潙鐏﹂柨鏇楁櫆鐎靛ジ鏁撻敓锟�