过滤气泡指的是算法基于我们过去的搜索历史,过滤掉与我们观点相左或我们不喜欢的信息,只提供我们想看的内容,从而造成人们认知的隔绝状态。
“过滤气泡”(filter bubbles),这几年最受内容业关注的名词之一。这一概念最早由互联网活动家Eli Pariser在其著作《过滤气泡:互联网没有告诉你的事》(The Filter Bubble: What the Internet Is Hiding from You)中提出:
指的是算法基于我们过去的搜索历史,过滤掉与我们观点相左或我们不喜欢的信息,只提供我们想看的内容,从而造成人们认知的隔绝状态。
然而,在路透社近期的一场研讨会中,针对“臭名昭著”的过滤气泡,高级研究员Richard Fletcher提出了完全不同的观点。本期编译Richard Feltcher的这场演讲,带你打破有关过滤气泡的种种迷思。
过滤气泡:流行、辨析与追问
过滤气泡如今是一个非常流行的隐喻,其背后的原理听起来十分合理且易于理解,也确实有其意义。就在2017年,比尔盖茨还表示,过滤气泡现象是如今新闻业中一个严峻的问题。可见,过滤气泡的概念在许多领域被广泛接受,并不仅仅是技术怀疑论者的呼声。
过滤气泡 VS 回声室
首先,我们需要辨析两个极其相似的概念:“回声室”(echo chambers)与“过滤气泡”(filter bubbles)。
我个人认为,“回声室”(echo chambers)和过滤气泡(filter bubbles)略有不同。
回声室效应指的是:当我们过多地接触我们偏好的信息,我们对于现实的判断可能会被扭曲,因为我们过分关注事物的某一面,而忽略了另一面,并逐渐认为现实就是如此;而过滤气泡描述的是另一种情况:我们不喜欢或不同意的新闻内容会被自动过滤掉,而这会缩小我们的认知范围。
这一区别十分关键,因为回音室可能是算法过滤的结果,也可能是其他原因造成的;而过滤气泡则一定是算法过滤的结果。
人们如何获取新闻?
回到逻辑链的原点:人们究竟是如何获取新闻的?人们真的使用互联网获取新闻吗?
答案显然是肯定的。
让我们来看看路透研究院的《2019数字新闻报告》如何解读。这份年度调查覆盖了五大洲(主要在欧洲)38个不同市场的新闻使用情况,约75000人参与了调查。
当被问到他们的主要新闻来源是什么时,大约相同数量的受访者的回答是网络和电视。在部分国家,电视占比略高;在另外一些国家,则是网络占比更高。但总的来说,我们发现了一个高度一致的特点:电视和网络在人们的新闻来源中占比远远超过了纸媒和广播。
在不同年龄段的用户之间,新闻消费情况也有所不同。对于45岁以上的人来说,电视更有可能是主要新闻来源;而45岁以下的人更偏好从网上获取新闻。
自2013年以来,我们一直在追踪不同国家社交媒体新闻的消费情况。从2013年到2016年,使用社交媒体获取新闻的比例从25%左右增长到50%以上,2016年后,这一比例已经趋于平稳。
再深入一些,看看各个平台的不同。在大多数国家,Facebook是新闻使用的主要平台。从2014年以来,通过Facebook获取新闻的人数比例约占整体人口的35%。从2016年到2018年,这一比例有轻微的下降。而在同一时期,WhatsApp等其他社交媒体在新闻使用方面变得越来越重要。
这些社交网络类型迥异,但它们都被归在社交媒体类别下。在过去的五年里,WhatsApp的新闻使用率从10%增长到了16%,Instagram也出现了类似的增长。
算法、社交媒体与搜索引擎
除了社交媒体,搜索引擎、邮件、聚合器等服务也在某种程度上依赖算法向人们提供新闻。
当被问到他们在网上获取新闻的主要方式是什么时,大约三分之一的人会直接访问新闻网站或应用程序如BBC、卫报等;另外三分之二的人则表示他们会使用其他服务,包括搜索引擎、社交媒体等,而这些服务都在不同程度上依赖算法。
很显然,算法及算法驱动的服务在人们的新闻消费中占据重要位置,的确值得我们的关注。
算法背后:两种“个性化”
提到算法的个性化推荐,首先需要厘清两个概念:自选个性化(self-selected personalisation)和预选个性化(pre-selected personalisation)。
- 自选个性化(self-selected personalisation)指的是,我们主观上对自己进行的个性化处理,这一点在新闻使用中尤为重要。每个人的新闻消费都有其偏好,展现出个性化的特点,所以我们会自主决定买什么报纸,看哪个频道。学术上将这种个性化称为“选择性接触”(selective exposure),它受一系列不同因素的影响,例如人们对新闻的兴趣程度、人们的政治信仰等等。
- 预选个性化(pre-selected personalisation)则指的是,人们在客观上“被个性化”了,完成这种个性化的可能是算法,有时甚至会在人们不知情的情况下进行。这种个性化与过滤气泡直接相关,因为算法可能会在人们毫无意识的情况下代替他们做出选择。
这两种情况的区别尤为重要,因为我们不能将预选个性化及其影响与自选个性化进行比较。毕竟,即使人们在线下消费新闻时,他们的选择也不是完全随意的。个性化一直存在,因此,如果我们想要理解预选个性化究竟造成了怎样的影响,我们必须将其与现实情况进行比较,而不是假想中的模型。
同样重要的是,我们必须警惕,不要把人们在线下的新闻消费行为想得过于理想。在这一领域,我们曾做过研究,比较人们在线上和线下如何选择新闻。我们研究了英国某些新闻机构的受众相互重叠的程度。
在线下,人们会只关注他们喜欢的几家媒体,非常深入地挖掘这些媒体提供的新闻。在线上,情况则有所不同。单家新闻机构的受众规模更小,因为人们的新闻消费被分散到许多不同的媒体中去了。线上新闻通常是免费的,所以人们可以从不同的来源中获取新闻。
我们可以看到,本质上,人们在线下的自选个性化行为比在线上更加突出。
社交媒体如何影响新闻消费:一组对照试验
社交媒体结合了自选个性化与预选个性化。人们首先会依照自己的喜好,关注一部分媒体而忽略另一部分。当然,算法在其中也发挥作用,向人们隐藏他们不感兴趣或不喜欢的媒体内容。
为了更好地理解社交媒体究竟如何塑造了我们的新闻消费,我们设立了三个对照组:
- 不使用社交媒体的人;
- 主动使用社交媒体获取新闻的人;
- 不会刻意用社交媒体获取新闻,但会在使用社交媒体时看到新闻的人。
我们的数据来自英国、美国、意大利和澳大利亚这四个不同的新闻市场。
研究发现,不论是否是为了获取新闻而使用社交媒体,这两组用户接触新闻的程度都远远高于不使用社交媒体的人。也就是说,使用社交媒体的用户会接触到越来越多的不同的在线新闻来源。
有趣的是,这一效应在年轻人身上更加明显,也许是因为他们更善于使用社交媒体,在不同平台上也更加活跃。对于那些对新闻不感兴趣的人来说,此效应也十分突出。我们还发现,相比YouTube和Twitter,这一效应在Facebook上要更为明显。
我们的研究说明,大多数人,尤其是使用社交媒体的人,对新闻并不是特别感兴趣。在如今高度选择性的网络媒体环境中,人们完全可以选择不关注他们不感兴趣的东西。但社交媒体的存在,让人们即使对新闻不感兴趣,也会在偶然中提高接触新闻的频率。
搜索引擎造成了过滤气泡吗?
搜索引擎和社交媒体有所不同。当人们使用搜索引擎获取新闻时,他们是在有意识地、主动地寻找某个内容。当然,即使是这样,搜索引擎仍然可能通过你的数据进行算法选择和推荐。因此,当人们使用搜索引擎时,过滤气泡的确有可能存在。
我们同样比较了两组人群的新闻消费习惯:
- 使用搜索引擎获取新闻的人;
- 不使用搜索引擎获取新闻的人,并重点观察他们新闻消费中的多样性和平衡性。
我们发现,算法带来的自动化的偶然性(automated serendipity)过程有效地丰富了人们新闻消费的多样性。使用搜索引擎获取新闻的人比不使用的人接触更多的新闻来源。更重要的是,他们更有可能使用来自意见两端的新闻来源,即平衡性更高。
依靠自主选择的人的新闻消费习惯往往不够平衡,他们要么倾向激烈言论,要么倾向保守言论;而使用搜索引擎的人则趋向平衡。
过滤气泡,也许并不值得过分关注
简而言之,我们的研究发现,人们越多地使用直接的新闻来源,他们新闻消费的多样性就越低。而社交媒体不仅帮助人们接触到更多的新闻来源,且让人们看到了不同的新闻来源,即提高了人们新闻消费的多样性。
我们的结论与许多其他研究的结论是一致的。事实上,在针对过滤气泡的诸多研究中,大部分研究都没有发现可证明过滤气泡及其影响的有力证据,即使有,也只是混合类证据(mixed evidence)。
多样性不减,但极化的确存在
当然,即使社交媒体和搜索引擎提高了人们新闻消费的多样性,这种多样化的新闻消费中也可能包含着更极端的新闻来源。
我们比较了人们线上新闻消费与线下新闻消费的极化程度的不同。我们调查了12个国家,其中8个国家的受众的线上新闻消费比线下更加极化,也更分散。整体而言,网络新闻环境似乎的确更加极化,或许是因为部分新闻机构更有动力在网络上发布更多的时政类内容。
为什么过滤气泡不值得过分关注?
我并不鼓励大家过分关注过滤气泡,因为它带给我们一些误解,且会使我们忽略更加紧迫的问题。
如我所述,目前可得且可靠的实验证据都表明:
人们基于搜索引擎和社交媒体的新闻消费行为更加多样化,但这种多样性有可能造成人们态度与使用习惯上的极化。这是一个很有趣的结论,因为在某种程度上它与过滤气泡假说所预测的恰恰相反。
过滤气泡假说认为,我们所看到的信息的多样性会越来越弱,最终造成一些负面的后果。也就是说,过滤气泡假说与我们的研究发现最终的结论是一致的,但其中的机制却截然相反。
如今,各大平台都致力于改变新闻服务的方式,人们获取新闻的方式同样也在改变。因此,我们需要批判性地看待算法选择对新闻消费的影响,因为过去几年的情况不一定适用于未来。
尽管我们一直在研究平台及其对新闻业的影响,但更重要的是,我们不能忽视潜在的深层因素,这些因素才是造成我们目前面临的问题的根源。