编辑推荐:
文章发表在SCIENCE ADVANCES 28 Sep 2022,在任何危机中,如COVID-19、猴痘、气候变化等,确保公众广泛接触最佳科学指导至关重要。我们展示了这场战斗是如何在COVID-19流感大流行的早期就在Facebook上失败的,以及为什么大多数主流人群,包括许多育儿社区,在疫苗到达时已经向更极端的社区靠拢。
摘要 在任何危机中,如2019年冠状病毒病(COVID-19)、猴痘、气候变化等,确保公众广泛接触最佳科学指导至关重要。 我们展示了这场战斗是如何在COVID-19流感大流行的早期就在Facebook上失败的,以及为什么主流的大多数人,包括许多育儿社区,在疫苗 到达时已经向更极端的社区靠拢。 隐藏的异质性解释了为什么Facebook自己推广的最佳科学指导似乎也错过了关键的受众群体。 一个简单的数学模型再现了系统级的曝光动力学。 我们的研究结果可用于在考虑个体多样性的同时,在规模上调整指导,并帮助预测临界点行为和系统层面对未来危机干预措施的反应。
简介 管理危机( 1)如2019年冠状病毒病(COVID-19)大流行( 2, 三),气候变化( 4)现在,猴痘和流产的错误信息需要广泛的公众接触和接受基于现有最佳科学的指导( 5– 12)[指南在《牛津词典》中有定义( 12)作为“旨在解决问题或困难的建议或信息”]。 然而,对这种最好的科学指导的不信任已经达到了危险的程度( 7– 9). 美国物理学会,像许多专业团体一样,把科学错误信息称为我们这个时代最重要的问题之一( 8, 9). 在COVID-19的2020年疫苗接种前的最大不确定性和社会距离,许多人到他们的在线社区指导如何避免感染和提出治疗方案。 社交媒体出现了巨大的飞跃( 13)在2020年的用户中(13.2%),总数达到42.0亿(占全球人口的53.6%),上网的首要原因是寻求信息( 13).
不幸的是,许多人接触到的指导并不是最好的科学( 三)他们的网上社区可能是善意的,但不是专家朋友。 有些人甚至死于饮用漂白剂或拒绝使用口罩( 14). 这就提出了我们在这里要解决的以下紧迫问题:谁发出了指导,又是向谁发出的? 谁接受了指导,又从谁那里得到了指导? 什么时候出了问题? 关于如何、在何处以及何时干预COVID-19以外的当前和未来危机,这告诉我们什么?
本文试图通过对网络社区中COVID-19网络的实证分析和定量分析来解决这些问题。 研究期间从2019年12月开始到2020年8月,这是在美国或英国紧急使用任何COVID-19mrna疫苗的2020年12月临时授权之前的几个月( 15). 我们关注的是发射器-接收器动力学,即,群体集合作为COVID-19制导的主要来源(即发射器)和/或彼此接触到这种指导(即接收器)的程度。 我们用一个再现系统级动态的数学模型来补充这一点。 因此,我们的研究是对许多优秀的现有研究的补充,但不同于现有的许多研究,包括围绕特定主题、来源或目标群体的讨论( 16– 56).
数据收集和分类 我们使用从Facebook收集的数据,因为它是全球占主导地位的社交媒体平台,拥有30亿活跃用户,是156个国家的顶级社交网络( 57). 此外,最近的研究证实,人们(例如父母)倾向于依赖Facebook内置的社区结构来分享指导( 58– 60). 因此,我们选择我们的主要分析单元是内置的Facebook社区,特别是Facebook页面。 我们将每个Facebook页面简单地称为一个社区,但我们强调它与从网络算法推断出的任何临时社区结构无关。 每一页都聚集了一些共同的兴趣; 它是公开可见的,它的分析不需要我们访问个人信息。 我们的出发点是在COVID-19(2019年11月;见材料和方法及补充材料)之前,在Facebook上围绕疫苗健康问题的辩论相互关联的这些社区的生态系统。 社区链接(第页) 我 社区(第页) j 存在于何时 我 推荐 j 所有页面级别的成员( 我 喜欢/粉丝 j )与页面成员简单地提到另一个页面相反:结果 我 随时都可以 t ,自动暴露于来自 j ,即。, j 发射和 我 接收(见第S1节)。 虽然不是全部 我 会员必须注意这些内容 j ,最近的工作( 61)从实验和理论上证明,只有25%的少数人的承诺就足以让一个在线社区改变立场。
我们收集这些Facebook页面以及它们之间的链接,使用的方法与我们之前的工作相同( 62),然后我们将这些页面按与我们先前工作相同的方式分类( 62). 因为我们回顾了这个方法和分类方案( 62)在材料和方法(和第S1节)中,我们只在这里进行总结。 我们从一个人工识别的页面开始,这些页面以某种方式讨论疫苗/疫苗接种,然后,我们使用计算机脚本和人工交叉检查的组合获得这些页面到其他页面的链接。 这个过程被重复多次,以产生一个由Facebook页面(节点)和它们之间的链接组成的网络。 我们训练有素的研究人员根据每一页的最新内容将其分为赞成、反对或中立。 “Pro”是一个页面的特征,其内容积极促进最佳科学健康指导(Pro疫苗接种); “反”是一个内容积极反对本指南(反疫苗接种)的网页,“中立”是一个与支持/反对社区的前COVID-19有社区级链接的网页,但其内容集中在其他主题上,如育儿(如儿童教育)、宠物和有机食品(见材料和方法以及第S1节)。 每一位研究人员都会根据每一页的内容进行独立的人工分类,然后再进行一致性检查。 当有分歧时,他们进行讨论,在所有情况下都达成了一致意见。 他们还根据他们宣称感兴趣的主题对中立社区进行了进一步分类,并发现了12个类别,如养育子女、有机食品爱好者和宠物爱好者(完整讨论和示例见第S2节)。 虽然进一步细分是可能的,但这将导致类别的社区太少,边界模糊。
这种数据收集和分类方法为我们提供了1356个相互关联的社区(Facebook页面),包括来自不同国家和语言的8670万个人,211个亲社区( 图1,蓝色节点),包括1300万个人,501个反社区( 图1,红色节点)包括750万个人和644个中立社区( 图1A,黄金节点)包括6620万个个体。 我们可以根据其喜欢(粉丝)的数量来估计每个社区的规模,因为一个典型的用户平均只喜欢一个Facebook页面( 13):这个规模通常从几百到几百万用户不等,但我们强调,我们的分析和结论并不依赖于我们确定社区规模。 我们收集的关于每个页面管理者的公共信息( 63)建议用户来自不同的国家(详见第S2节)。 最常见的经理人地点是美国、澳大利亚、加拿大、英国、意大利和法国(第S2节)。
图1 暴露动力学。
( A )发射器-接收器复杂性示意图。 每个节点都是一个社区(Facebook页面):亲社区(蓝色)积极推广最佳科学指导; 安提斯(红色)积极反对。 中立者(黄金)有一个形状来表示他们的主题类别(例如,养育子女)。 链接 我 → j 方法 我 “粉丝” j ,从页面提供内容 j 到第页 我 ,暴露 我 的用户 j 的内容。 链接 我 → j 颜色是节点的颜色 我 ; 箭头颜色为节点 j ,箭头方向显示COVID-19制导的潜在流动。 灰色表示当时COVID-19制导出现 t 维恩图显示了中立社区接触COVID-19指南的来源 t . ( B )暴露于COVID-19引导下的早期演变。 (B到D)中的非红色/非蓝色节点表示中性社区的类别,例如,育儿社区为绿松石色(第S2节给出了配色方案)。 仅包括在该时间窗口内涉及COVID-19制导的链接[即,它是(a)的过滤版本]。 ( C )系统pre-COVID-19,显示暴露于COVID-19指南的所有潜在链接[未过滤,如(A)]。 布局是自发的(ForceAtlas2),靠近表示更多的相互联系。 节点大小表示该节点的规范化中间度中心值。 ( D )一年后,就在COVID-19疫苗推出之前。 灰环中的节点(页面)是Facebook宣传最佳科学指导的横幅的主要目标(见第S3节)。 环在(C)和(D)中处于相同的位置,以明确显示键合的增加。 这两张图只显示了网络的最大组成部分。 2年后见系统补充资料。
扩展以获取更多 在查看器中打开
伴随数学模型 为了配合我们的实证分析,我们引入了一个简单的数学模型,可以模拟这些在线社区的集体动态。 我们并不是说它代表了(目前还未知)最好的数学模型,但它确实有一些有利的特点。 首先,它有一个最小且透明的形式,它非常简单,它的输出和预测可以用标准微积分手动验证。 第二,它可以系统地从第一原则(见衍生的补充材料)的基础上,个人聚集或“凝胶”到网上社区的经验事实。 这些社区然后聚合成给定类型的社区。 第三,该模型可以应用于不同的聚合层次:例如,对所有中性粒子的活动进行某种度量 t [即。, G ( t )]以及所有专业人士的相应活动[ B ( t )]还有安提斯[ R ( t )]生成三个耦合方程,如 等式。1和 2下面,或者举例来说,中性子类别可以单独包含,这将为每个子类别添加另一个等式[ G 1 ( t ), G 2 ( t )等等。]。 第四,即使在最粗糙的近似水平上( 公式1),该模型产生的输出曲线与经验中观察到的曲线相似,并且可以使用更复杂的版本(例如。, 公式2). 在最粗略的近似水平上,我们的模型方程的变化率 R ( t ), B ( t ),和 G ( t )(由 · R R ? , · B B ? ,和 · G G ? ,分别)成为
· R = r R ( R 0 ? R ) + r B ( B ? R )
· B = b B ( B 0 ? B )
· G = g G ( G 0 ? G ) + g B ( B ? G ) + g R ( R ? G )
(一)
作为生态系统模型的标准,这三个方程中的每一个都包含一个自作用项[ g G ( G 0 ? G )等]来解释每个亚群的内在增长或衰退( G 0 等等,都是常数)。 耦合项依赖于差异,并且同样具有简单的线性形式。正(或负)耦合意味着正(或负)反馈,例如,如果 r B r B trans data-src=" 0), then having"<0),然后B ( t )超过 R ( t )会增加(减少)的变化率 R ( t )因此增加(减少) R ( t ). 对在线内容的检查支持这样一种观点:(i)亲社区关注于向全体民众(包括中立者和反对者)提供最佳科学指导,这表明专业人士并没有受到反对者或中立者活动的实质性影响。 因此,方程 B ( t )未耦合到 R ( t )或者 G ( t ); (ii)反对者受到专业人士发出的指导意见的影响,因为他们经常把它变成他们自己的版本(包括错误信息),然后把它提供给中立者,以引起中立者对最佳科学指导的关注。 这表明,反对者并没有受到中立者叙述的实质性影响。 因此,方程 R ( t )只耦合到 B ( t ); (iii)中立者受到来自专业人士和反对者的指导。 因此,方程 G ( t )与两者耦合 B ( t )以及 R ( t ). 这些自相互作用和耦合项如中所示 图2.
图2 我们的模型示意图。
同样的示意图也适用于我们模型的两个最粗略的近似值( 公式1)以及更复杂的版本( 公式2). 在 等式。1和 2,pro(蓝色)、antis(红色)和neutrals(gold)已聚合到所有社区(即Facebook页面),如图中所示,中性者在所有12个类别中进一步聚合,如方框所示。
在查看器中打开
方程式2下面提供了一个更复杂的版本 公式1,我们在其中添加 公式1完全数学推导的特征,其中每个凝胶(取决于聚集程度的群落或一组群落)都有自己的起效时间 t c (见补充资料中的推导); 我们还添加衰变项来模拟兴趣的丧失或慢化剂的镇压
· R = H ( t ? t c , ? R ) [ r R ( R 0 ? R ) + r B ( B ? R ) ? d R R ]
· B = H ( t ? t c , ? B ) [ b B ( B 0 ? B ) ? d B B ]
· G = H ( t ? t c , ? G ) [ g G ( G 0 ? G ) + g B ( B ? G ) + g R ( R ? G ) ? d G G ]
(二)
每一个 H (…)是在各自的起始时间变为非零的Heaviside函数 t c 我们使用 公式2与 图3因为它提供了更好的拟合度。 然而,如第S5节所示,包含这些起始项和衰变项并不重要:两者都是 等式。1和 2产生与经验曲线相似的形状,因为它们都具有相同的核心结构,耦合项和自相互作用如中所示 图2虽然信息和谣言的实际传播,就像疾病一样,是随机的,但众所周知,这样的确定性方程可以描述许多这样的随机实现的时间平均行为。 我们已经用随机模拟验证了我们的方程同样精确。 此外,参数估计和优化可能很难用随机模型来执行( 64, 65). 我们还研究了噪声对数据的影响,从整个网络中随机删除多达15%的COVID-19相关链路,以模拟丢失或根本不存在的链路(见补充资料),我们发现我们的主要结果和结论是可靠的。
图3 .数据对空模型和我们的模型( 公式2).
( A )经验数据(圆圈)显示了接受COVID-19指导的亲(蓝)、反(红)和中性(金)社区的数量(即接受者)。 行显示了来自空模型的输出范围,这为数据提供了较差的拟合。 ( C )与(A)相似,但圆圈显示了提供COVID-19指导的社区数量(即发射器)。 ( B )以及( D )将经验数据与我们的生成数学模型进行比较 公式2(虚线)。 利用全数据集对模型参数进行估计。 有关完整复制和与参数估计值的比较,请参见第S6节和软件文件 k -折叠交叉验证。
在查看器中打开
结果 网上曝光问题的复杂性 图1A结果表明,即使使用我们高度简化的节点和链路分类方案,在任何单个快照上的曝光动态都会及时出现 t 即使对于一小部分节点,也可能非常复杂。 节点链接的颜色(即Facebook页面) 我 到节点(Facebook页面) j 是节点的 我 ,而箭头方向表示COVID-19制导的潜在流动,因此 j 到 我 。箭头的颜色是节点的颜色 j 。如果节点 j 及时发布COVID-19指南 t ,然后我们在它周围以及从它发出的任何箭头周围放置一个灰色边界,以指示链接节点的曝光 j 的COVID-19指南 t 。如果没有链接进入节点 j ,则不会将任何其他节点暴露在其COVID-19制导下。 每个页面(节点)都可以链接到其他不同的页面,但是不相关的链接会被过滤掉,正如我们在前面的工作中所解释的那样( 62)和S1部分,产生每个节点有几个链路的网络。 因此,维恩图显示了中性群体的COVID-19引导暴露 t (金色节点,每个形状代表一个单独的主题)。 维恩图中的灰色边界表示时间上的中性节点 t 他们接触到的COVID-19指南完全来自非亲社区 t 也就是说,他们接收到的COVID-19制导完全来自反卫星和/或其他中性粒子。 例如,12只暴露于来自反节点14的COVID-19制导; 因此,12是在反唯一灰色边界区域。 十二有一个从11到它的链接,所以11暴露在12的COVID-19指导下,但这并不影响12本身。
鉴于 图1A,我们并没有试图给COVID-19制导的每一部分科学真理的分数指定一个数值,从而使本文更加复杂。 无论如何,这样的数字都是不可靠的,因为即使是最疯狂的反内容也可能包含真实的片段。 例如,半导体芯片被注入COVID-19疫苗的虚假报道,实际上与一项真正的科学有关:2019年一份顶级科学期刊上的同行评议出版物表明,纳米级半导体结构(量子点)可以用作可注射疫苗标记物( 66, 67). 因此,错误仅仅在于它们没有被这样使用,而不是科学上不能。 有鉴于此,我们采用了一种更简单的方法:我们的团队每天分析所有这些社区内容的经验表明,公共科研机构发布的COVID-19内容如预期的那样促进了最好的科学,而反政府组织则反对。 一个中立社区的初始帖子可能介于这两个极端之间,但通常会因非专家页面成员的非科学评论和回复而被进一步降级,因此最终不会成为权威的最佳科学指南。 这意味着我们可以合理地为来自专业人士的指导保留“最佳科学指导”的标签。 虽然这一点在未来可能会进一步完善,但我们注意到,即使我们对社区和内容的分类有一小部分是错误的,但我们的主要结论没有改变,因为它们只依赖于相对数量。 我们通过在分类中模拟错误来明确检查结果的稳健性。 我们随机选取了 ? COVID-19整个网络的导航链接将以1%的增量删除。 平均而言,删除15%的链接只会在发射器-接收器曲线的幅度上产生5%的差异,最大25%的差异,并且一般的曲线形状被保留。 此外,尽管一些参数值的估计值可能会发生很大变化,但一般的曲线形状被保留下来(详情见第S5节)。 因此,任何依赖于模型的结论都对噪声引起的波动和参数估计值的大变化具有鲁棒性。 我们认识到,最好的科学指导会随着时间的推移而改变,最终可能会被证明是错误的,但这似乎很少发生。
暴露动力学的经验特征 现在,我们展示了我们在不同聚集水平上观察到的暴露动态的经验发现。 分析数据收集时间为2019年12月至2020年8月。 图1B显示了最初关于COVID-19指南的对话是如何开始的,主要是在反社区之间,早在正式宣布大流行之前(2020年3月11日)。 它是中构造的过滤版本 图1A:链接仅出现在 图1B当它所连接的一个节点(社区)在该时间间隔内呈现COVID-19制导。 它显示最大的连接组件。 由于我们使用ForceAtlas2布局算法,观察到的分离是自组织的,并且邻近性表示更强的相互链接,即更多的链接节点 我 它的邻居也有 j 和它的邻居,更接近的视觉节点 我 将到达节点 j (见第S4节)。 它揭示了反社区(红色节点)对系统的影响有多快,中立者(即不是红色或深蓝色的节点,例如,养育社区是淡蓝色的节点)也会被选中或依附于自己。 亲社区(深蓝色)稍后进入并形成自己的领域。 这种支持反隔离的观点表明,当从 图1C到 图1D源于2020年初COVID-19周围的键合,如中所示 图1B.英寸 图1(C和D),只显示了网络的最大组成部分:它包含了系统中91.96%的节点和99.93%的所有边 图2C系统中87.24%的节点和99.94%的边缘 图4D.
图4 中立社区接受非专业指导。
( A )维恩图,如 图1A,显示了暴露于COVID-19指南的来源,该指南适用于系统中巨大连接组件中的所有中性社区( 图1,C和D)2020年1月至8月合计( B )与(A)相似,但仅适用于所有中立社区的育儿社区子集。 ( C )中立育儿社区对COVID-19指南的接触程度随时间和来源(即辐射源)类型分类。
在查看器中打开
图1D在COVID-19疫苗推出之前,提供了一个完整的系统级视图,展示了COVID-19指南可以流动的所有环节(面板C和D 图1相当于 图1A,忽略了黄色阴影,因此类似于不考虑交通的路网,而 图1B是承载交通的道路的子集)。 可观察到的变化 图1C到 图1D表明在疫苗出现前的一年中,反社区的亚群体不仅在社会不确定性最大的一年内内部收紧,而且中立者被拉和/或拉近自己与抗-s的距离,而且像亲子社区(淡蓝色节点)这样的中立群体也在内部收紧。 疫苗接种后的版本在视觉上类似于中的网络 图1D(见第S2节)。
这产生了一个关键的后果,即当人们对COVID-19疫苗的购买变得至关重要时(即2020年12月),许多父母对自己、他们的孩子的健康决策负有责任, 另外,老年亲属在网络中与持极端观点(包括不信任疫苗和拒绝口罩)的反间谍分子以及其他关注非疫苗和非COVID-19阴谋内容、5G、氟化物、化学药品的中立分子(见粉红环内节点)的关系更为密切, 转基因食品,以及相信自然疗法治疗所有疾病的替代健康社区(详见第S2节)。 这种与更极端社区的密切关系对公共卫生可能非常重要,因为在ForceAtlas2网络布局中的邻近性表明了更强的相互联系(见第S4节)。 因此,这些节点在网络中出现的空间越近,它们就越有可能共享内容,从而实际施加影响。 在这种情况下,这意味着极端社区对包括父母在内的主流社区的影响可能会增加。
Facebook通过在一些页面(即节点)顶部放置横幅(例如,指向美国疾病控制和预防中心)的横幅(见第S3节),对best science COVID-19指南进行了自上而下的推广。 但是,我们的地图 图1D明确显示这些横幅主要出现在反社区(红色节点),而且,反政府组织的目标主要是在灰色椭圆形 图1D(第S3节)。 因此,许多中立的社区被忽略了,然而使用这些地图可能是可以避免的。
现在,我们将更仔细地研究一下anti可能对中立类别的育儿社区产生的影响,并将其与anti可能在全系统范围内产生的影响进行比较。 维恩图 图4A量化了在疫苗发现前的最大社会不确定性期间,非亲社区作为COVID-19指导中立社区的主要来源(即发射器)的程度。 719万人只接受了来自非亲社区的COVID-19指导,只有128万人接受了来自亲社区的COVID-19指导。 剩下的540万人同时受到这两种情况的影响,这可能仍然让他们很不确定该怎么想。 图4B结果表明,这种不平衡对育儿社区中的个体更为严重:总共有110万人接受了来自非亲社区的COVID-19指导,但只有503人接受了来自亲社区的COVID-19指导。
进一步分解这一点, 图4C显示了不同类型社区的中立育儿社区对COVID-19指南的长期接触。 从1月初开始,反社区很快就产生了COVID-19指南,当与来自育儿社区的大量链接相结合时,导致了育儿社区对反社区的曝光率迅速上升,如 图4C紧接着,在正式宣布流感大流行之前,来自其他育儿社区的指导的接触率迅速上升,而关注先前存在的非COVID-19疾病(如阿斯伯格综合征和癌症)的社区接触人数也有所减少。 在整个时期内,这些来自反对和其他育儿团体的高水平接触持续存在。 与此形成鲜明对比的是,来自亲社区的曝光率从来没有表现出任何强烈的反应,而且仍然很低。 第S5节显示这些曲线 图4C与选择随机网络的零模型相比具有统计学意义。 这意味着我们可以拒绝曝光网络的微观结构不相关的假设。 总之,暴露网络的复杂性( 图1)这确实是了解曝光动态随时间变化的关键。
这些发现描绘了疫苗接种前阶段的情景:在2020年1月初,中立育儿和其他主流社区的个人开始意识到来自反社区的COVID-19指导,然后他们悄悄地对其进行审议,可能在私人团体或WhatsApp等应用程序中进行互动,或者与其他人离线交流。 到了2月中旬,他们觉得有能力制作并与类似社区分享他们自己的COVID-19指南。 同时,他们只接受了来自亲社区的最低限度的最佳科学指导(深蓝色曲线接近于零)。 他们没有强烈倾向于与其他亲社区建立更多的联系,可能是因为他们已经从其他中立社区获得了指导,这些社区有着相似的兴趣(例如养育子女),他们认为他们可以认同甚至更信任他们。
这些发现还表明,在2020年很早就出现了一个错失的干预机会。尽管在2020年1月,作为指导发射器,对反政府组织提供更多直接信息的可能性上升(红色曲线, 图4C)考虑到他们的积极反对和可能的反弹,这可能是不可取的, 据观察,2020年2月,其他育儿社区作为指导发起者的崛起(淡蓝色曲线)表明,来自公共科研机构的最佳科学COVID-19指南可能是围绕当时育儿社区内的热门话题量身定制的(可以从他们的页面上读到),因此使用地图按比例引入 在里面 图1B.
使用 公式2如果对其他类型的潜在干预措施也有疑问,那该怎么办。 例如,所有中立类别的全面干预是否会降低非亲社区对COVID-19指南的后续高峰值暴露,以及随后在2020年的持续性( 图4C)? 任何干预措施的真正影响最终都必须经过经验检验。 然而,比较性讨论可以从一个附带的数学方程中获益,该方程再现了总体规模的曝光动态,而且非常透明,因此可以简单地洞察这种“假设”情况。
方程式2在所有中立者、赞成者和反对者的总水平上代表这样一个方程,正如它的更近似版本所给出的一样 公式1. 图3(C和D)确认 公式2在这一总体水平上与经验观察到的暴露动态有很好的一致性。 更近似的说法是, 公式1,也产生了可接受的一致性,但正如预期的那样,拟合优度统计值较低,因此未显示出来。 利用全数据集估计由于每条曲线的点数而产生的数学模型参数; 使用 k -第S5节讨论了估算模型参数时的折叠交叉验证和保持验证集。相比之下,零模型的结果是 图3(A和C)显示发生了什么 图3(B和D)如果使用的是随机的经验数据。 观察到的这种空模型的不一致性是值得注意的,这不仅是因为它的预测与经验数据相差甚远,还因为零模型的构造提供了一个相当苛刻的比较:而不是随机化(洗牌)所有类型的节点[这确实产生了与中的曲线非常不同的曲线] 图3(B和D)],我们只在类型内随机(洗牌),也就是说,我们分别在anti、pro和12个中性子类别中的每一个进行随机洗牌。 因此,这个空模型在每个子类别中包含的节点数量与经验网络完全相同:因此,对于空模型,网络在视觉上看起来与真实模型相同,因为类别的颜色被保留,但节点名称被洗牌。 重复此操作1000次可得到中所示的频带 图3(A和C),代表平均值和1标准差。 这些波段与经验数据相差甚远(详见补充资料和数学及数据复制文件)。 这表明了实际链路和整个网络在确定在线曝光动态中的重要性,即所观察到的动态不是每种类型节点数量的简单结果。 这也表明 公式2是捕捉经验网络的真实节点链接特征,而不是简单地反映相对的子群体规模,因此,在解决关于在线曝光的问题时,确认了了解真实网络的重要性。
我们现在可以用这个数学方程来探索假设干预。 因为我们只是在探索定性的结果,所以我们采用了 公式2(即。, 公式1)因为它的行为是完全可以解决和理解的,而不需要任何计算机。 图5(A到D)显示对未来行为的预测 公式1使用电流的粗略估计 R ( t ), B ( t ),和 G ( t )初始条件和不同耦合情况下的值(详见第S6节和图S13至S15)。 基于目前对疫苗和口罩佩戴的犹豫不决,我们假设公共科研机构在促进最佳科学指导方面已达到其最大能力; 因此, B ( t )保持不变。 图5A显示了当anti、pro和neutral之间的未来耦合都是正的(即,正反馈)时会发生什么: G ( t )在达到较高值之前最初达到峰值。 在 图5B,neutral和pro具有负耦合(即负反馈):这导致 G ( t )明显升级。 在 图5C,所有联轴器均为负: G ( t )明显下降。 在 图5D,中性粒子和反离子有唯一的正耦合: R ( t ) → 0,但是 G ( t )在很长一段时间内保持高位。 因此,这些不同的预测未来为比较不同可能干预措施的利弊提供了一个框架。
图5 对当前系统的干预预测。
( A 到 D )我们模型最粗略的形式所预测的未来结果的四类( 公式1). 初始条件粗略模拟当前情况(第S6节和图S13至S15显示了详细信息和代码)。 (A) 所有耦合项都是正的。 (B) 耦合项 G ( t )以及 B ( t )是否定的。 (C) 所有耦合项均为负。 (D) 唯一的正耦合项是 G ( t )以及 R ( t ). ( E )的重新规范化版本 图1D其中,给定类型的节点被聚合成具有相应加权大小/质量的单个超级节点。 这个在线宇宙的中心用不同的定义显示:空间中心(黑色的“x”标记)、按度数的中心加权(紫色的x标记)和按簇数加权的中心(绿色x标记)。 ( F )移除反(红)超节点对(E)的影响:亲(蓝)超节点仍然不在新宇宙的中心。
在查看器中打开
为了结束我们的分析循环,这些数学预测可以从 图1使用重整化的物理技术,其中反、亲和12个中性子范畴的社区各自聚合成自己的社区“球”(见 图5E). 图5F然后显示了从中移除anti的影响 图5E,因此,模仿 图5D在哪儿 R ( t ) → 0.比较只在短时间内有效,因为我们不允许整个网络在切断所有反链接后进行调整或重新布线。 图5F表明亲社区仍然不会坐在这个网络世界的中心,因为与中立的子类别社区,特别是运动社区(深绿色球)的多方面互动。 事实上,中立者和专业人士都在 图5F大体上与 图5D在哪儿 G ( t )仍然很高,可与 B ( t )尽管 R ( t ) → 0
讨论 我们的研究结果表明,在COVID-19流感大流行正式宣布之前,反社区就开始占据主导地位,而中立社区(如育儿)随后更接近极端社区,因此对其内容高度敏感。 早在2020年1月,育儿社区就首次从反社区获得了COVID-19指导。这一直持续到官方宣布大流行之后,育儿社区感到有足够的信心开始在对话中加入自己的指导。 自始至终,亲社区的指导仍然很低,这与育儿社区寻求其他来源相一致。
为了补充我们的实证分析,我们开发了一个简单的生成性数学模型,该模型在系统层面上捕捉了发出和/或接受指导的群体之间的相互作用。 它可以方便地探索假设情景,因此,可以粗略预测不同干预策略的临界点行为反应。 网络映射和模型的结合表明,除了从系统中删除所有极端元素之外,还有更多可能的方法来改变对话。 结果 图5(D和F)表明消除所有极端因素甚至可能不是最合适的解决方案。 在任何情况下,这种清除都可能被认为是严厉的; 它们与开放式参与的理念背道而驰,而且可能会破坏用户数量最大化的商业模式。 图5(D和F)显示了删除反间谍对亲和中立社区的影响。 在 图5F,我们看到pro并不位于系统的中心(即,系统中心的不同测量值不包含在pro超级节点附近或内部),并且系统中心位于pro和一个中立社区(运动)之间。 在 图5D,我们看到 R ( t ) → 0, G ( t ) → 0也同样发生,这意味着反内容的移除可能会刺激中性社区的自我移除,这表明这些自移除的中立社区接触最佳科学COVID-19指导的机会可能更少。 亲社区增加他们与其他社区的联系将对 图5(E和F)将其他超级节点拉向专业人员,并将系统中心转移到专业社区附近。 通过消除反社区与其他社区的联系来减少反社区的影响,也有助于将系统中心从反政府组织转移到其他社区 图5E。因为我们的模型可以在不同的尺度上进行解释,包括社区社区,因此它可以应用于具有内置社区功能的多个平台,并且可以用来处理除COVID-19和疫苗接种之外的更普遍的在线错误信息问题。
当然,我们的研究也有局限性,这意味着有机会进一步研究。 我们被限制在研究人员可以阅读的语言页面上; 因此,我们错过了来自普通话、印地语和阿拉伯语等语言的更多见解。 此外,Facebook可能是全球领先的社交网络( 57),其用户可能不能代表某个国家的人口。 这是一个开放的问题,我们的结果如何推广到那些使用互联网比例低。 例如,在巴基斯坦和伯利兹,Facebook是领先的社交网络( 57); 然而,只有17%和47%的人使用互联网( 68). 此外,暴露动态可能会受到组织或政府使用的所谓混沌剂的小团体的影响( 61). 然而,我们注意到,社交媒体社区倾向于对类似巨魔的行为进行自我监管。 另一个局限性是,还有许多其他的社交媒体平台可以进行此类辩论。 个人可能正在接受他们在Facebook上看到的COVID-19指南,并在其他任何社交媒体网站上进行讨论。 然而,我们相信,类似的行为会出现在任何社区能够发展的社交媒体平台上,而Facebook确实是其中最大的一个。
材料和方法 数据收集和分类的详细信息 这里的方法遵循我们先前的工作( 62). Facebook页面由我们数据中的节点组成,每个链接代表一个页面向其成员推荐另一个页面的情况。 这就避免了需要识别个人账户信息,这是Facebook公共API服务条款所禁止的。 这个过程首先是以某种方式讨论疫苗/疫苗接种的人工识别页面种子,然后,这些页面与其他页面的连接被索引。 这些网页是在2018年和2019年通过使用涉及疫苗的关键词和短语搜索Facebook页面来识别的。 研究结果通过人类编码和计算机辅助过滤器进行审查,然后,至少两名不同的研究人员对每个节点进行独立分类。 当有分歧时,他们进行讨论,在所有情况下都达成了一致意见。 这个过程又重复了两次,以获得候选节点的最终列表以及它们之间的链接。 为了对页面进行分类,对页面的帖子、“关于”部分和自我描述的类别进行了审查。 为了被归类为赞成或反对,最近25个帖子中至少有2个必须涉及疫苗接种辩论或页面标题或关于部分的自我识别页面是支持还是反对疫苗接种。 为了被归类为中立,最近25个帖子中有5个必须提到疫苗接种辩论,但该页面没有明确表示支持或反对立场,或者About部分明确宣布该页面在辩论中是中立的, 或者说,最近25个页面中没有一个是关于疫苗的,但是这个页面自称是一个非政府组织、一个事业、一个社区或一个草根组织。 因此,我们的数据集只包含Facebook用户。 我们的目标人群不仅包括那些专门发布疫苗信息的人,还包括非营利组织、公众人物、政府组织、医疗公司、当地企业等。当然,我们可以定义不同的节点和链接, 而我们的数据集最终是某个更大的“正确”网络的不完美样本。 为了帮助缓解这种情况,我们多次重复了手动识别页面初始种子的过程,目标是通过包括以不同语言发布的页面、侧重于不同地理位置的页面以及来自多个国家的经理的页面(第S2节),使种子尽可能多样化。 只有那些文章是用研究人员可以阅读的语言写的,例如英语、法语、西班牙语、意大利语、荷兰语和俄语。 判断一个帖子是讽刺的还是讽刺的,假的,还是像恶棍一样的( 61)即使对学科专家来说也是一项非常困难的任务; 现在还可以免费、完全现成的机器学习语言模型来生成真实的疫苗错误信息( 69). 然而,这些社交媒体社区倾向于对机器人或巨魔般的行为进行自我监管。 量化这些帖子的真实性和意图这一极其困难的任务将作为另一项研究的主题。
为了确定谁在发射,谁在接受COVID-19指导,我们首先必须确定哪些帖子明确讨论了它。 对于每个帖子,帖子消息、描述、图像文本和链接文本都被合并到一个字符串中,在这些字符串中,情况将被忽略。 然后我们制作了一个字符串列表来搜索这些帖子,例如,“电晕病毒”,“covid”,“19ncov”和其他术语。 以及非英语语言(“vírus”用于葡萄牙语,virus不仅用于英语,还用于意大利语、西班牙语、法语等)。 因此,我们的方法捕捉到故意的拼写错误,忽略标点符号,在单词之间添加空格以避免过滤,并覆盖除英语之外的其他语言。 然后,我们通过使用过滤器筛选出那些与COVID-19相关的帖子,并利用这些信息来确定哪些页面在某个时候发出COVID-19指南 t 。有了这些信息,我们能够生成网络的过滤结构(例如。, 图1A)其中一个链路只在给定时间存在,如果它所连接的节点之一当时正在生成COVID-19制导。
闂傚倷鑳堕幊鎾绘倶濮樿泛绠插ù锝堟閻牓鏌ㄩ悤鍌涘
婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婇柍瑙勫劤娴滈箖鏌i悢鐓庝喊婵℃彃婀遍埀顒冾潐閹稿摜鈧稈鏅濋埀顒勬涧閵堟悂寮崒鐐村€锋い鎺嶇劍閻﹀酣姊虹拠鎻掝劉缂佸甯″畷婵嬪箳濡も偓缁€澶愭煟閺冨倸甯舵潻婵囩節閻㈤潧孝婵炶尙濞€瀹曟垿骞橀幇浣瑰兊閻庤娲栧ú銊╂偩閾忓湱纾介柛灞剧懅椤︼附淇婇锝囩煉鐎规洘娲熼、鏃堝川椤栵絾绁梻浣瑰缁诲倿鎮ч幘婢勭喓鈧綆鍠楅悡娆愮箾閼奸鍤欐鐐达耿閺屾洟宕堕妸銉ユ懙閻庢鍣崜鐔肩嵁瀹ュ鏁婇柣锝呮湰濞堟悂姊绘担钘変汗闁烩剝妫冨畷褰掓惞椤愶絾鐝烽梺绉嗗嫷娈曟い銉ョ墦閺屾盯骞橀懠顒夋М婵炲濯崹鍫曞蓟閺囥垹骞㈡俊銈咃工閸撻亶鏌i姀鈺佺仭濠㈢懓妫楀嵄闁圭増婢橀~鍛存煟濞嗗苯浜惧┑鐐茬湴閸婃洟婀侀梺鎸庣箓濡瑧绮堢€n喗鐓冪憸婊堝礈濮橆厾鈹嶉柧蹇氼潐瀹曟煡鏌涢幇銊︽珖妞も晝鍏橀弻銊モ攽閸℃瑥鈪靛┑鈽嗗灠椤戝寮诲☉銏犵闁瑰鍎愬Λ锟犳⒑鐠囧弶鍞夊┑顔哄€楃划姘舵焼瀹ュ懐顦ㄥ銈嗘尵婵兘顢欓幒妤佲拺閻犲洠鈧櫕鐏侀梺鍛婃煥妤犳悂鍩㈤幘璇茬闁挎棁妫勫▓銉ヮ渻閵堝棛澧紒顔肩焸閸╂盯寮介鐔哄幈濠电偛妫欓崝鏇㈡倶閳哄偆娈介柣鎰级閸犳﹢鏌熼姘毙х€殿噮鍣e畷鎺懳旀担瑙勭彃
10x Genomics闂傚倷绀侀幖顐﹀磹閻熼偊鐔嗘慨妞诲亾妤犵偞鐗犻垾鏂裤€掓刊鐖剈m HD 闂佽瀛╅鏍窗閹烘纾婚柟鍓х帛閻撴洘鎱ㄥΟ鐓庡付闁诲繒濮烽埀顒冾潐濞叉粓宕伴幘鑸殿潟闁圭儤顨呴獮銏℃叏濮楀棗澧┑顔煎暣濮婃椽宕ㄦ繝鍌滅懆濠碘槅鍋呯划宥夊Φ閺冨牆绠瑰ù锝囨嚀娴犮垽姊洪幖鐐插姉闁哄懏绮撻幃楣冩焼瀹ュ棛鍘遍棅顐㈡搐椤戝懏鎱ㄩ埀顒€鈹戦悙瀛樼稇婵☆偅绮撴俊鐢稿箛閺夊灝宓嗛梺缁樶缚閺佹悂鎮℃担铏圭=濞达絽鎲″﹢鐗堜繆閻愯埖顥夐摶鐐烘煕瑜庨〃鍛矆閸℃稒鐓曢柍鈺佸暈缂傛岸鏌嶈閸忔稓鍒掑▎鎾虫瀬鐎广儱顦伴弲鎼佹煥閻曞倹瀚�
濠电姷鏁搁崑娑樜涙惔銊ュ瀭闁兼祴鏅滃畷鏌ユ倵閿濆骸浜為柍缁樻閹鏁愭惔鈥崇缂備椒鑳跺▍澧俰st闂傚倷绶氬ḿ褍螞濡ゅ懏鏅濋柨婵嗘川缁犳柨顭块懜闈涘婵☆偅蓱閵囧嫰骞樼捄杞扮捕缂傚倸绉崇欢姘跺蓟濞戙垹鍐€闁靛ě鍐f嫛婵犵數鍋涢悧濠囧储椤ョSPR缂傚倸鍊烽悞锔剧矙閹烘鍎庢い鏍仜閻掑灚銇勯幒鍡椾壕濡炪倧缂氶崡鎶藉箖瑜斿畷顐﹀Ψ閵堝棗濯伴梻渚€鈧偛鑻晶鏉戔攽閳ユ剚鍤熼柍褜鍓ㄧ紞鍡涘礈濮樿泛姹查柍鍝勬噺閸婂灚绻涢幋鐐垫噧濠殿喖鍟撮弻娑㈠籍閹炬潙顏�
闂傚倷绀侀幉锟犮€冮崱妞曞搫饪伴崨顓炵亰闂婎偄娲︾粙鎺楀吹閸曨垱鐓熼柟閭﹀墻閸ょ喖鏌曢崼鐔稿唉妤犵偞鐗犲鍫曞箣閻樻鍞堕梻浣告啞閻熴儱螞濠靛棭娼栧┑鐘宠壘鎯熼梺闈涱檧缁茬厧霉閻戣姤鐓熼柣妯夸含閸斿秶鎲搁弶鍨殻闁诡喓鍎甸弫鎾绘晸閿燂拷 - 濠电姷鏁搁崕鎴犲緤閽樺鏆︽い鎺戝閻鏌涢埄鍐$細妞も晜鐓¢弻娑㈠焺閸愭儳姣€闂佸湱鍎ら幐楣冦€呴悜钘夌閺夊牆澧界粔鐢告煕鎼淬垹鐏ラ柍钘夘樀楠炴﹢顢涘顐㈩棜婵犵數鍋為崹鍫曞箹閳哄倻顩叉繝濠傚暟閺嗭箓鏌i弮鍥仩缁炬儳銈搁弻娑㈠焺閸愵厼顥濋梺鍛婃⒐鐢繝骞冨Δ鍛嵍妞ゆ挾鍋樺Σ鎰版⒑缂佹ḿ鈯曢柣鐔濆洤绠悗锝庡枛缁犳煡鏌熸导瀛樻锭闁诡喕绶氬娲川婵犲倻顑傛繝鈷€鍕垫疁鐎殿喗濞婇幃銏ゆ偂鎼达綆鍞规俊鐐€栭弻銊╂倶濠靛牏鐜绘繛鎴欏灪閻撴瑩鎮归妸銉Ц闁稿﹤顭烽幃鐑藉閵堝棛鍘卞┑鐐叉閿氶柣蹇嬪劜閵囧嫰顢曢姀鈺佸壎閻庤娲滄繛鈧€殿喕绮欓、鏍敃閿濆懏璇為悗娈垮枟閹倿寮幘缁樻櫢闁跨噦鎷�
婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婃い鎺嗗亾鏉╂繃绻濋悽闈浶㈤悗姘煎櫍閹本鎯旈妸锔惧幘閻庤娲栧ú銈嗙濠婂牊鐓曢柣鎰摠鐏忥箓鏌熼挊澶娾偓濠氬焵椤掑﹦绉甸柛鎾村哺椤㈡棃濡舵径瀣化闂佽澹嬮弲娑欎繆閾忓湱纾奸柕濞у喚鏆梺鐟板槻閹冲酣銈导鏉戠闁靛ě鈧崑鎾寸節濮橆厾鍘搁柣搴秵閸嬪嫭鎱ㄩ崼銉︾厸鐎光偓閳ь剟宕版惔銊ョ厺闁哄啫鐗嗛崡鎶芥煟濡寧鐝慨锝呭閺岋絾鎯旈姀鈶╁闂佸憡姊圭敮鈥崇暦濠靛鍋勯柣鎾冲閵夆晜鐓ラ柣鏇炲€圭€氾拷