错误信息的产生、传播及识别和控制——错误信息已有研究评述----中国科学院科技战略咨询研究院

错误信息的产生、传播及识别和控制——错误信息已有研究评述

作者：温家林;张增一 2018-12-28 10:20 来源：《科学与社会》

随着互联网技术的发展和社交媒体的广泛应用，获取或发布信息变得越来越容易，给人们的工作、学习和生活带来了便利。然而，由于互联网和社交媒体降低了信息发布门槛，弱化了传统上信息“把关人”的作用，也导致海量网络信息鱼龙混杂，许多流言、谣言、错误信息或虚假信息广泛传播，给人们的工作、生活带来困扰甚至伤害，成为一个严重的社会问题。本文重点关注的是错误信息，对应于英语misinformation一词。根据《21世纪大英汉词典》的解释，misinformation主要指错误的消息、论断；disinformation主要指假情报；gossip侧重于涉及私人、私事的闲话和小道消息，传播方式一般是口头的、非正式的、非官方的；rumor侧重于谣言、传闻，其信息未经证实，无法确定真假。可见，错误信息（misinformation）与英语中的disinformation、gossip和rumor以及汉语中饿谣言、流言等词一样，虽然都含有“不实信息”之意，但其侧重点和使用语境均不同。因此，本文所说的错误信息具有这样一些特征：第一，不符合人们日常经验，或已被科学研究证明为捏造、子虚乌有的信息；第二，在业界、科学共同体内部等没有得到认可，明确缺乏支持依据的信息。

本文重点关注国外学者关于错误信息的研究，从错误信息产生的原因、传播机制、传播效果及影响和识别与控制等方面进行评述，力图呈现其研究概貌、热点和趋势。

一、国际重要学术期刊有关错误信息研究的基本情况

本文以Web of Science为搜索工具，以“misinformation”为关键词在主题中进行搜索（截止到2018年3月31日），检索结果是4324篇；以“misinformation”为关键词在标题中进行检索，得到802篇文献。经手动筛选去掉相关性不大的文章，最后得到758篇文章，其年代分布见图1。

图 1 关于“misinformation”研究论文发表的年代分布

关于misinformation的研究，最早的一篇文章是由帕特克（Patek AJ.）写的“Diagnostic Misinformation at a Health Resort”，发表于1912年的《美国医学会杂志》（The Journal of the American Medical Association, JAMA）上，研究了医疗诊断中的错误信息。从图1可以看出，关于misinformation的研究论文数量，早期只有零星的几篇论文，在20世纪90年代初年发表论文首次突破10篇以上，在2000年以后，尽管有波动，但整体上呈现出快速增长的趋势，尤其是近几年。这表明，学术界对这一主题越来越重视。

这一主题研究论文的另一个特征是，得到了多学科领域的关注。研究论文主要发表在心理学、传播学和计算机科学领域的学术期刊，所采用的研究方法大部分属于定量的、实证性的研究方法。从具体的学科专业来看，发表论文数最多的学科领域依次为心理学、行为科学、传播学、卫生保健科学服务、计算机科学、儿科、信息图书馆科学、普通内科医学、药理药物学和政策法律等（见表1）。概括来看，心理学、行为科学等领域主要关注的是错误信息对于人们记忆、判断、行为造成的干扰和误导；传播学领域主要关注的是错误信息的形成、传播机制；健康医学、卫生保健科学等领域主要关注的是错误信息对于人们身心健康产生的影响，具体围绕传染病、疫苗、香烟、艾滋病、辐射等人们普遍关注的问题展开分析；计算机科学领域主要从技术层面关注错误信息的传播、预防与控制。

表 1 发表文章数量排名前十的学科专业分布

二、错误信息的产生及影响

现实生活中的错误信息，有些是围绕一些重大、紧急事件出现的，如埃博拉病毒和2011年英国骚乱，这些错误信息会在某一个时间段内集中出现，之后随着事件的结束而慢慢减少直至消失；还有一些错误信息是跟日常生活紧密相关的，会在社交媒体中长时间反复出现，比如关于养生的、关于疫苗注射的。

关于错误信息产生的原因，目前没有找到专门的、系统的研究论述，有些论文在“引言”、“绪论”部分简略提及一下。通过对有关文献进行梳理，发现几种比较有代表性的论述。

第一种观点认为，社交媒体时代的“非中介化”（disintermediation）特点，即内容从生产者直接到消费者，缺少“中间人”和“把关机制”，是错误信息产生的主要原因^[1]。这种“非中介化”改变了用户以往获知信息、交流观点、形成认知的方式，带来疑惑，鼓励投机和轻信。

第二种观点认为，由于角色分工、话语权归属等带来的信息不对等和区隔，使人们在面对危机和其他关系切身利益的情况时，对于未知不能做出理性的判断，从而导致错误信息的产生^[2][3]。对于不确定性，人有一种近乎本能的恐慌，在不能得到确切信息的情况下，任何一类解释都可能被当作是合理的。

第三种观点认为，有些错误信息是个别人或利益集团有意为之。如日本学者的研究指出，日本烟草行业提供给消费者的错误信息包括：对科学进行怀疑，吸烟增加健康、长寿和男子气概，吸烟对人的影响微乎其微，攻击公共卫生倡导者/当局，将吸烟与可靠性、历史或公民权利相联系。^[4]

综上，本文认为错误信息的产生是多种因素共同作用的结果，有社交媒体这种新的传播方式本身带来的结果，也有宏观的社会背景、中观的群体互动和微观的个体心理因素的影响。^[5]

错误信息的影响主要体现在四个方面：（1）影响人们正确认知和决策，如赛思（Seth C Kalichman）等人的研究发现，艾滋病毒感染者使用膳食补充剂与互联网上对医疗错误信息及毫无根据的健康说明的脆弱抵制相关，他们对毫无根据的艾滋病治疗声明表现出更多的信任。^[6]（2）引起疑惑、恐慌和混乱，如有学者以发生在印度的四个真实案例为研究对象，分析了社交媒体在动员人们参与暴动和革命方面的作用。^[7]（3）强化“回音室效应”和“过滤气泡”，如社交媒体中，受众可以凭借自己的喜好选择信息，平台也会以“精准推送”和“协同过滤”的方式投其所好，如果受众接收到的是错误信息，就会进一步使自己对观点及话题自我设限，只听到自己认同的回音，如同身处“回音室”。^{[8][9][10][11]}（4）给人带来记忆损伤，如1978年洛夫特斯（Loftus）等人开创了研究错误信息的经典实验设计，在实验中，之前经历过同一事件的两组被试，第一组被给予关于该事件的误导性信息，第二组得到的信息与事件实际一致，结果发现最后对当初经历的同一事件进行描述时，第一组被试通常比第二组被试更有可能报告错误信息，这种现象被称为“错误信息效应”（the misinformation effect），即人们在暴露于误导性信息之后出现的记忆损伤。^[12]在此基础上，许多研究者更换了不同的变量，如对犯罪场景的描述、对普通场景的描述、对现实生活事件的描述、误导性的问卷以及对事件有误导性的声音等，但都能得到错误信息效应，相关的文献综述可见洛夫特斯的文章^[13]。

三、错误信息的传播

不容否认，缺少把关机制、用户生产和传播内容等社交媒体本身的特点就可能加剧错误信息传播，人们可以毫不费力地将消息迅速转发给许多人。同时，信息接收者的个人因素也要考虑。当面对未经过滤的信息时，虽然人们并不能明确判断其真假，但会认同那些与自己想法相符的部分，即使它是错误的，认知心理学称之为“证实性偏见”。^[14]库玛（Kumar）等人进一步明确了受众面对这类信息时会考虑的四个因素：信息的一致性、消息的连贯性、来源的可信度及普遍可接受性。^[15]大岛优子村山（Yuko Murayama）等人的研究发现，不管什么样的推文，只要受众认为很有必要让别人也知道，他们就会转发；在模棱两可的情况下，一些错误信息可能会因转发而蔓延；而紧急情况下用户可能传播错误信息以解释他们的不确定性。^[16]

此外，政治意识形态^[17]、自我表达和社会化^[18]、个人或集团利益^[19]等因素也是影响错误信息传播的重要因素。国内学者刘自雄等人从社会心理学的角度指出受众对于假新闻的认知和接受是刻板印象、认知失调以及从众心理等各种社会心理因素共同作用的结果。^[20]

关于错误信息的传播特点和模式的研究，主要借鉴了流行病学、社会学、经济学、管理学等学科的知识，如经常被提及的三种模型：

第一种模型是传染病模型。这种模型认为错误信息在社交网络中的传播方式类似于传染病在人群中的传播方式。^[21][22]第二种模型是社会影响模型，这种模型也认为错误信息是通过网络中不同的节点而传播的，但与传染病模型不同，该模型认为，节点之间的关系因为彼此之间互动的情况而有“强关系”和“弱关系”之分，构成“强关系”的两个节点，能更容易地影响彼此的态度和观点。而特定节点只有在相邻节点对某一信息的接受人数超过某一阈值时，才会接受并传播该信息。^[23][24]第三种模型是社会学习模型。与前两种模型相比，该模型中的节点被认为是理性的决策者。他们观察之前信息接受者的反映和结果，然后决定是否相信某条信息。^[25][26]

例如，沃尔特？夸特洛西奥奇（Walter Quattrociocchi）等人在研究社交网络中错误信息的传播时指出，Facebook用户与公开帖子的每一次互动行为—喜欢、分享、评论，都有特定的含义。不同立场的人们惯常采用的信息传播方式不同，持阴谋论的用户更倾向于“分享”，而持科学论的用户更倾向于“喜欢”和“评论”。^[27]道（Dow，P. A.）等人发现，Facebook上的信息流趋向于以“瀑流”（cascades）的形式传播，或者像病毒一样从一个用户快速传输一条信息到另一个用户。“瀑流”的一个特征是，该内容不是仅从原始来源“共享”，而是通过先前“共享”内容的其他人“共享”。^[28]古普塔（Aditi Gupta）等通过构建网络用户图，显示了2011年英国暴动和孟买炸弹爆炸案期间Twitter上错误信息的传播情况，提出要寻找社交网络中关键的“节点”，它们在信息扩散过程中发挥了重要作用。^[29]此外，学者们还以气候变化^[30][31]、免疫接种^{[32][33][34][35]}、政治辩论^[36]、突发事件^[29]、福利方案^[37]等议题为抓手研究这些议题中错误信息的传播。

四、持续影响效应

日常生活中一个值得注意的现象是，关于某个事件或人物的错误信息，即使已经被更正过了，但仍然继续呈现病毒式传播，而正确的信息并没有得到足够关注。埃克（Ecker）把这种现象称之为错误信息的“持续影响效应”（the continued influence effect，CIE）^[14]也有学者将“持续影响效应”称为“信念回响”（belief echoes）^[38]。错误信息会继续影响人们的行为，即使这些信息已经被宣布无效、收回或纠正。而且，针对错误信息的明确警告可以极大地减少但不能完全消除人们对错误信息的依赖。^[39]对此，学者们尝试用记忆障碍（包括记忆覆盖或替代、信息源混淆和差异检测的修改效果）、性别、教育背景、年龄和职业、动机、群体影响等不同因素解释这一效应。^[40][41]研究趋势还表明，随着事件与事后错误信息之间间隔时间的增加，持续影响效应也会更明显。^[12]

错误信息的持续影响在现实中有很多例子。如2003年美国入侵伊拉克期间，公众不断地被暴露在“伊拉克被发现拥有大规模杀伤性武器”的错误信息之下。尽管这样的报告没有得到过证实，但这些连续的暗示足够强大，使美国大部分公众长期相信大规模杀伤性武器的存在，即使大规模杀伤性武器不存在的事实已经很明显。

但是，有学者不同意上述说法，麦克罗斯基（McCloskey，M.）和萨拉戈萨（Zaragoza，M.S.）对错误信息的持续影响效应第一次提出了批评，认为它是实验设计程序导致的假象。例如，他们注意到，被试可能会记住/忘记原始细节或误导性细节，然后随便给出一个测试答案，这就会出现很多种情况，而任何猜测都会有50%的概率。^[42]马特乌什（Mateusz Polak）等人的研究结果也表明，在没有发生记忆扭曲或信息源错误认定的情况下，这种效应仍然可能发生。^[43]

本文认为，对于错误信息进行的“辟谣”、质疑等，只能争取“中立者”，强化“反对者”的批评态度，而对于其坚定的“支持者”很难产生影响，甚至可能产生反作用。在我国，日常生活中类似的“谣言粉碎机”“流言榜”“一周流言”“月度十大谣言”“年度十大谣言”随处可见，但不幸的是似乎没有一个简单的方式能够打破错误信息“春风吹又生”的怪循环。

五、错误信息的识别与控制

在线社交网络中生成的数据量如此之大，在大量数据中检测到错误信息是一项具有挑战性的任务。概括来看，人们通过计算机科学手段对于错误信息的检测，主要从两个方面入手：一是基于内容的特征：信息长度、单词数、特殊字符数、主题标记数、转发数、积极态度词数、否定词数、表情符号数、@数、时间持续长短、是否具有明确网址及数量等；二是基于信息源的特征：用户的注册年龄、发表状态、关注者人数、朋友人数、是否经过验证、描述长度、用户名长度等。

凯塔（Keita Nabeshima）等人开发了一种通过使用构造的语言模式来识别并纠正错误信息的方法，并用于提取2011年日本地震和海啸灾害期间发布的大约1.8亿条推文中的错误信息，其提取的覆盖面和准确性得到了验证。^[44]库马尔（K. P. Krishna Kumar）等借助网络数据深度分析的方法，对Twitter中语义攻击（Semantic Attacks）的类型进行了分析，一种是冒名性攻击（Sybil attacks），即利用社交网络中的少数节点控制多个虚假身份，从而利用这些身份控制或影响网络的大量正常节点的攻击方式；另一种是欺诈性攻击（Shill attacks），即用户作为“托儿”，与传播者串通，传播错误信息。^[45]在此基础上，作者提出了一种新的分类法，来描述信息传播的模式并识别其中错误信息的来源。

使用机器学习和自然语言处理技术在一定程度上将错误信息识别过程自动化了，然而，由于内容的异质性，这类方法的准确性还没有完全达到人们的要求和预期，往往需要人工干预，而且实时计算的成本高昂。

库马尔等人还提出了一种基于认知心理学概念来检测错误信息的方法。^[46]他们发现，受众接受错误信息是因为受到了欺骗信息的提示或诱惑，据此他们创建了适当的指标体系来检测社交网络中的这类欺骗线索。在研究信息的转发情况时，作者运用基尼系数来测量特定来源的信息转发分布的模式。基尼系数本来是一个衡量分布不平等的指标，作者用它来测量用户信息转发行为的差异。基尼系数值接近0，表示转发行为很均匀，基尼系数值超过0.5且接近1表示转发行为非常不均等，即一些用户参与转发了大量的信息，从而加强了错误信息传播的可能性，降低了消息来源的可信度。

卡尔洛娃（Karlova NA）等人的研究证实了这一点，他们发现人们在参与信息传播过程中，会使用提示信号做出判断，这些信号有时会诱导人们传播错误信息。^[47]陈一鸣等人的研究也指出，点击诱惑（Clickbait）现在被用于网上快速传播谣言和错误信息，作者探讨了自动检测这种欺骗手段的方法，并对其在识别文本和非文本中点击诱惑线索的有效性进行了检验。^[48]

在应对错误信息方面，不少研究提出通过修改网络的拓扑结构来限制错误信息传播。^{[45][49][50][51]}例如有学者研究了如何暂时禁止用户之间的链接，甚至暂停账号来限制传播。最主要的方法就是使用独立级联或线性阈值模型对扩散网络进行建模。^[52]但这些策略有一个共同的局限，要从现实世界中提取这些扩散模型的参数非常困难，而且与现实的数据不能完全契合。^[53]为此，Yongjia Song等人将重点放在选择最优化链接子集上，该链接的删除可以最大限度地减少错误信息和谣言的传播。^[54]而莱万多夫斯基（Lewandowsky S）等人提出的对策包括：（1）提供可信的替代性解释；（2）反复撤销错误信息；（3）在受众接触错误信息之前提出明确警告；（4）纠正信息与受众的世界观保持一致。^[14]

艾希礼谢尔比（Ashley Shelby）等人的研究指出，在反对错误信息传播时，不能只使用枯燥难懂的数据统计和研究报告，可以尝试运用一些讲故事的策略，再加上以证据为基础的信息。^[55]

六、总结与讨论

纵观以上学者的研究，我们不难得出以下几点认识：第一，互联网与社交媒体的发展加剧了错误信息的传播，使其成为一个严重的社会问题，引起了多学科领域学者的关注。第二，关于错误信息产生的原因及影响，尽管学者们在认识上有所不同，但似乎一致认为它是社交媒体用户产生内容的机制带来的必然结果，并且操作的便利性和传播的及时性使错误信息能够迅速蔓延，从而造成严重的社会后果。第三，关于错误信息的传播机制，学者们从不同视角基于不同案例或社交媒体平台，进行研究并提出了多种模型，彼此之间在认识上的差异比较大。这表明错误信息传播机制本身的复杂性，仍需要进行更多的、不同平台甚至不同文化背景下的案例研究，为提炼和发展社交媒体中错误信息传播机制的理论提供支撑。第四，关于错误信息的识别与控制，直接关系到网络空间的净化和治理措施，当前学者们的探讨主要集中于技术层面，如构建错误信息的语言识别模式，结合机器学习和自然语言处理技术建立错误信息自动识别系统，修改网络拓扑结构限制错误信息传播等。当然，鉴于错误信息的多元性和复杂性，这些研究也仅仅是一些初步的探讨，离具体的实践应用还有相当大的差距，需要更多的学者进行更深入的研究。

综上所述，当前对于错误信息的研究集中于多个学科的多个方面，也取得了不少重要的研究成果。但是从文献调研和实际了解的情况也应当看到，国内目前对于这一主题的研究尚显薄弱，尤其是从传播学、社会学角度对此的关注不足，有待投入更多的研究。技术的进步使得研究者可以跟踪人们在社交媒体上选择、分享、评论各类信息的足迹，进而探究这类信息在网络空间的社会传播机制。但是，令人感到悲观的是，“回音室效应”、“错误信息的持续影响效应”等提示我们，要想阻止错误信息的病毒式传播，目前并没有明确而简单的办法。技术再发达，对于错误信息的传播只能起到有限的限制作用，而不能彻底消除。从某种意义上说，错误信息是伴随整个人类信息生产和交换过程的。而解决这一问题，需要从公众科学素养、传媒社会责任、技术及社会进步等多个方面进行努力。