**欢迎加入我们的电报频道和讨论群 https://t.me/apapaohiohttps://t.me/ocaagroup
选举年总少不了民调。尤其是大选年,各大媒体会持续报道各种民调结果,分析人士会据此判断选举风向,候选人则会依据风向转变调整策略。
但也有人对民调不以为然,尤其是2016年美国大选后,许多人对民调失去了基本信任,宁愿相信所谓的“义乌指数”。2016年选举日当晚,《纽约时报》惊呼“今夜数据死了”,民调几乎一夜之间成了“不着调”的代名词。
那么,民调还可信吗?
首先要澄清的是,民调预测在2016年美国大选中的失败,既是其本身“不够准”所致,也是美国特殊的选举制度造成的。那一年的大选民调,其实没有人们想象的那么差劲。在联邦层面,选前一周的平均民调显示希拉里有3.3%的领先优势,这与最终2.1%的普选票优势相差不大。也就是说,如果美国实行总统直选和“领先者当选制”(如韩国),那么2016年的大选民调就不存在预测失败的问题。
美国大选采用选举人团制度,决定胜负的不是全国普选票,而是各州加总的选举人团票。2016年民调错就错在在州层级上,尤其是对关键的摇摆州(也叫“战场州”)的预测都错了。最终,特朗普正是凭着在这些摇摆州的微弱优势当选总统的——他在密歇根、威斯康星和宾夕法尼亚分别只有0.3%、0.7%、0.7%的领先度。
美国民意研究协会(American Association for Public Opinion
Research)的选后分析报告发现,对低教育人群、“锈带选民”、少数族裔选民、摇摆选民的偏好捕捉失准,以及对各群体投票率的估计失误是造成州层级民调失败的主要原因。
2016年美国大选中的战场州(灰色)和选举人团票数 图片来源:National Journal
那么,今年的大选民调会再次跑偏?答案是:有可能,但2020年民调大概率比2016年民调更准确。为什么呢?
一则,2016年多数民调出现了“覆盖误差”(errors of
coverage),亦即没有覆盖到足量具有代表性的人群,尤其是对低教育人群的采样不足。民调通常采用电话和网络调查的形式进行,而高等教育人群的应答率和配合度较高,这导致他们在调查对象中占比过高。而通常,高等教育人群更倾向于支持秉持自由主义和进步主义理念的民主党,2016年民调由此高估了希拉里的支持率。
为避免重复四年前的错误,今年很多民调机构提升了样本中非高等教育人群的比率,并且如果应答率还是不够,则按照总人口中的教育比例对调查结果进行加权调整。
二则,2016年民调失准部分原因在于第三方分票。最后约有6%的选票投给了绿党、自由意志党以及独立候选人——2012年该比例仅为2%。这些选民对两党候选人都不满意,宁可放弃“两个烂苹果”而选择不可能获胜的“第三者”。在密歇根和佛罗里达州,民主党因此流失了大量选票,也导致民调预测失准。
再看本届大选,民主党方面,拜登在选民中的好感度要高于希拉里,在党内与桑德斯的合作也更紧密;在“第三方”,自由意志党和绿党等推出的候选人都少有名气,存在感弱于以往,所以非主流政党投票(non-
major-party
voting)不会很多。加上近日大法官金斯伯格去世,民主党和共和党都借此催票,料将会使更多选民“归队”——摇摆选民的减少,客观上有助于民调准确率的提高。
三则,2016年民调预测失准还受到投票率的影响。研究表明,过高的胜选几率会导致“选票遣散效果”(demobilization
effect)。2016年选前大部分预测显示希拉里有90%以上的胜选把握,这使部分民主党选民认为希拉里赢定了,自己不投票也不会影响大局,以致民主党的实际投票率不足(类似情况也出现在英国脱欧公投中)。
今年选举情势并不明朗,特朗普连任并非不可想象;而作为在野党,民主党也不再像2016年那般自信。加之邮寄投票提供的便利,两党选民的投票率预计将保持较高水平,或者说,民调中的投票意愿——民调以询问投票意愿的直接方式或询问是否知晓投票规则和附近投票站的间接方式来预估投票率——会更直接地转化为实际的投票行为。
四则,2016年民调失败主要发生在摇摆州。美国民调行业长期侧重于全国民调,比如“总统执政认可度民调”等等,而专注于地方的民调机构较少,投放到州层级的民调资金也相对有限——预算少了就会降低对民调抽样设计和访问数量的要求,加之经验不足,州一级的民调质量远逊于联邦层级。
今年,媒体对州级民调的关注显著增强,民调行业也吸取了上届的教训,在州级民调方面的投入明显增多。特别是对摇摆州,参与调查的民调机构数量和信用评级都有所改善,在调查设计和访问方法方面也有改进,这些都有望提升民调的准确性。
最后,民调稳定性是预判民调预测准确与否的重要指标。目前看来,拜登的民调走势要比2016年的希拉里来得平稳,无论是538网站统计的加权民调还是Realclearpolitics公布的平均民调,都显示拜登有长期稳定的领先优势——虽然领先幅度在8月有所降低,但优势依然较为明显。
相比较而言,2016年希拉里的民调领先就不是很稳定,在2016年5月底和7月底甚至还被特朗普反超了。就像学生考试一样,民调的平时成绩如果较为稳定,则有利于其预测的“正常发挥”——当然民调变化还要看接下来40多天的选情发展,不排除出现“十月惊奇”的可能。
简言之,2020年美国大选民调吸取2016年的诸多教训,并做出了相应改进;加之本届选举对阵态势和候选人特征的变化,
本次大选的民调应该比2016年更加准确 。不过应该看到,民调本身的一些问题仍然存在,可能导致预测失准的情况再次出现:
一是误差幅度问题。凡是问卷调查,无论是通过邮件、电话、网络还是入户方式进行,都存在误差。民调结果不只是一个固定数值,还应包括误差幅度(例如,±2%)。这种误差除了前文提及的“覆盖误差”外,还有“测量误差”(errors
of
measurement),即在调查执行过程中,由问卷设计、问题顺序、措辞方式、应答率等造成的误差。本届选举民调矫正了部分覆盖误差,但仍难以避免诸多测量误差。
通常,学界认为如果两个候选人的民调差距在3%的范围内,其反映的胜负结果基本不可靠。一些研究发现,如果同时考虑覆盖误差和测量误差,民调结果与大选结果的差距甚至可能高达5-6%。目前,拜登在北卡罗来纳、弗罗里达、乔治亚等数个摇摆州平均民调领先度均未超过3%,也就是说特朗普仍有可能在这些州以微弱优势反超。
二是机构效应和媒体取向。民调机构多少都带有政治倾向性,反应在民调结果上即所谓的“机构效应” (house
effect)。对2012年民调的选后研究发现,皮尤研究中心和YouGov等机构的民调结果偏向民主党,Rasmussen和Fox
News等机构民调偏向共和党。此外,媒体在选取和报道民调结果时,也不免带入政治取向和引导性,特别是在当前美国媒体总体偏自由化和进步主义的大环境下,我们对媒体民调报道的解读应该更加谨慎。
2012年美国大选中的机构效应 图片来源:538网站
三是民调调整偏差。民调公司在收集完调查数据后,通常不会直接发布,而是会围绕一系列指标对数据进行重新测算和调整,之后才会公布结果。
第一类调整是按照实际人口学分布进行调整。例如,如果人口普查数据显示成年人口中有40%接受过高等教育,但在1000个调查样本中却有50%的人受过高等教育,这说明调查中高等教育人群比例过高,因此需要降低这部分人群的影响,方法是对这部分回答附加0.8的权重(40%/50%=0.8)。
另外一类调整是针对投票率进行的。由于回答支持某位候选人的选民到了选举日不一定会出来投票,所以民调公司需要根据问卷信息测算出“意向选民”(likely
voters)及其意愿的强弱,并据此对民调结果进行调整。
而问题在于,这两类调整都可能产生新的偏差,因为我们无法预知最终选民中不同教育程度、不同年龄段、不同族群的真实比例以及最终的投票率。从这个角度看,民调调整更像是一门“工艺”而非“科学”。
四是民调公司良莠不齐,单个民调不可靠。在美国,民调是一个巨大的市场,产业规模达180亿美元。不同民调机构采用的抽样方法、访问方式以及样本量大为不同,导致民调结果的科学性和可信度差异较大。有些民调为了控制成本不惜减少样本规模,有些商业民调缺少科学的采样程序,还有些党派民调根本不公布操作细节,这些都会影响调查准确性。
解读单个民调时,我们通常需要先了解民调出处,
确定其信誉情况。这方面,可以参考538网站根据历史准确率、透明性、样本量等指标对不同民调机构进行的评级;还可以核查有关民调是否加入了“美国民意研究协会透明度项目”康奈尔大学“罗珀民意研究中心”的数据库。
五是集合民调的问题。为了克服单个民调存在的测量误差、机构效应,调整偏差等问题,目前流行的做法是将不同机构的民调结果综合起来,根据每家机构的各项指标打分和评级情况测算一个加权平均数,比较著名包括538网站、Realclearpolitics网站和经济学人网站提供的集合民调。
集合民调有利于削弱单个民调的问题和预测偏差,但是集合的方法和过程不免带入研究者的主观因素,并且如果大部分民调朝同一个方向产生偏误的时候,集合并不能消减预测偏差。538网站的集合民调在2012年准确预测了所有50个州的选举结果,但在2016年仍然不免于滑铁卢。
Realclearpolitics网站公布的2020大选平均民调
民调的问题很多,但更关键的问题在于我们如何使用民调——媒体应该如何报道民调,受众应该如何理解民调?在这方面,我们可以给出的建议是:
忌“选择性失明”(cherry-picking), 忌相信“低劣数据”(junky numbers), 忌“随意下结论”(rushing to
judgment),忌“过度自信”(overconfidence),忌”愤世嫉俗”(cynicism)
。总之,既不要因为偏信而被误导,又不要因为蔑视而错过重要信号,保持客观性和甄别力。同时,要更多关于州层级的民调以及选举人团的票数组合,过度依赖全国民调会出现“跨层推理谬误”。
说到底,民调只是用于选举预测的一种工具,是某个时段上选民意向的切片(snapshot),而非真正意义上的预测。惟有认识到这一点,我们才有可能找到民调的正确打开方式。
—–
作者王中原,系复旦大学社会科学高等研究院讲师,复旦大学复杂决策分析中心研究员。
【编者按】 本文仅代表作者观点,不代表APAPA
Ohio及OCAA官方立场。所有图片均由作者提供或来自网络。如存在版权问题,请与我们联系。更多精彩文章,请查看我们公众号的主页。欢迎大家积极投稿!