摆事实:谷歌”黑”希拉里其实比”黑”川普厉害,雅虎和必应更盛
Author 1, Article 2, Date: 9/14/2016.
(本贴参加OCAA征文大赛“俄亥俄华裔谈美国总统大选”)
文章概述
6月9日,名为SourceFed的独立媒体爆料,谷歌涉嫌篡改搜索算法支持民主党候选人希拉里·克林顿(HillaryClinton)[1]。一天后谷歌便发文进行了否认,并声称其算法不针对特定人地会自动过滤负面词汇,所以对两位候选人的保护程度时相同的[2]。连华人打假斗士方舟子都激动地站出来用数据分析挺了谷歌一把[3]。虽然谷歌偏袒候选人的可能性已经在多方激辩后降到了最低。各大搜索引擎支持某位候选人的主观意愿先搁置不提,从客观现实出发,三大搜索引擎(Google.com, Bing.com, Yahoo.com)的搜素结果到底对哪位候选人的宣传更有力呢?这就是本文调查的核心内容。
结论:我们暂且不论二位候选人被三大搜索引擎“黑”(提示负面搜索词)是为什么。数据显示,(1)谷歌委屈了,黑希拉里明明比黑川普多(avg, Hillary 40% vs Trump 25%)。(2) 把所有引擎结果加起来,希拉里和川普被黑的总次数都很高(Hillary 69% vs Trump 40%),但数据显示希拉里被黑得更厉害。希拉里的被黑次数是川普的1.725倍。(4)希拉里和川普被挺的次数都很低,且几乎一样(Hillary 7% vs Trump 6%)。
一句话:用三大搜索引擎搜索希拉里和川普的选民,有高于72.5%的概率会看到不利于希拉里的信息。
分析数据
在不login任何账户的情况下,获取的Google,Yahoo,Bing的搜索提示数据。数据搜集时间和文章发表时间同步。
分析方法
- 在三个搜索引擎中分别输入“hillary clinton”,“hillary clinton is”,“donald trump” 和 “donald trump is” 然后看搜索引擎提示的内容。对比三个搜索引擎提示结果的不同。
- 基于facts图文并茂地阐述观察结果。
分析结果
Google.com搜索结果
Bing.com的搜素结果
Yahoo.com分析结果
分析结论
结论:我们暂且不论二位候选人被三大搜索引擎“黑”(提示负面搜索词)是为什么。数据显示,(1)谷歌委屈了,黑希拉里明明比黑川普多(avg, Hillary 40% vs Trump 25%)。(2) 把所有引擎结果加起来,希拉里和川普被黑的总次数都很高(Hillary 69% vs Trump 40%),但数据显示希拉里被黑得更厉害。希拉里的被黑次数是川普的1.725倍。(4)希拉里和川普被挺的次数都很低,且几乎一样(Hillary 7% vs Trump 6%)。
一句话:用三大搜索引擎搜索希拉里和川普的选民,有高于72.5%的概率会看到不利于希拉里的信息。
局限性
- 虽然英语为搜索候选人的主要搜素语言,不能保证英语的100%使用率。建议其他分析包括西语,汉语都美国二外的分析。
- 不是所有提示都一样的权重。比如sick 和 a liar 的严重程度是不一样的。
- 索然作者分析时没有login任何搜索引擎家的账户,保证了避免针对用户的定制结果。但基于ip的订制依然无法排除。希望更多的研究采用不同ip进行佐证。
- 搜素提示是短期效应(short term effect)。
- 以及其他很多局限性,比如作者水平和时间有限等,就不一一列举了。
参考链接
- Did Google Manipulate Search for Hillary?
- Google denies manipulating search engine to hide unflattering posts about Hillary Clinton
- 谷歌操纵搜索结果支持希拉里·克林顿吗?
附录
声明
Disclaimer: The author analyzed direct search engine data using simple yet reproducible methods. The author and the analysis is not in association with, in support of or against any candidate or political party in the presidential election.