本文是一篇计算机论文,本文在经典传染病模型的基础上,考虑了现实社交网络平台对账号传播谣言信息的检测能力,加入了隔离状态,提出了 SIOR 模型。同时还引入饱和函数来描述谣言传播治理过程中,系统检测传播谣言节点的能力水平,建立带有饱和控制函数的谣言模型,并分析了该模型下节点状态的转换过程。
第一章 绪论
1.1 研究背景及目的
如今互联网技术飞速发展,使得上网成本降低,人们可以通过手机、笔记本电脑、掌上电脑等工具随时随地浏览社交网络中的信息,同时也能随心所欲地发布自己喜欢的信息到朋友圈,微博等社交平台。在网络规模的快速扩展下,每一时刻都会产生庞大的信息量,对于这些信息的流通,促使了网络社交平台的崛起。平台为用户减少了遍历信息的时间,让人们可以更加高效地获取信息[1]。
互联网将人与人之间的距离拉近,让人们享受到网络交流的便利,使得越来越多的人进入到网络世界之中。截至2020年5月,全球互联网用户数量已经达到46.5亿人,占比达到全球人口的60%,且超过半数为移动平台的用户。在我国,根据中国互联网络中心(CNNIC)发布的第47次《中国互联网络发展状况报告》中提到,截至2020年12月,我国的网民规模达到9.89亿,互联网普及率达到70.4%,其中手机网民规模有9.86亿,网民中使用手机上网的人数占比达到99.7%,这表明了我们的日常生活已经离不开网络,每一时刻都有人从网络中获取到不一样的信息[2-4]。
一方面网络的发展为我们的生活带来巨大便利,但同时也给我们带来了潜在的危机。网络谣言就是其中之一。谣言是一种信息,是对于事实描述有所偏差的信息,它类似于其他网络上的信息,具有传播性,而且对于某些特定的人群,其传播的更有效率。在目前社交网络平台的环境下,谣言传播主要是通过网络中网民之间的交流。谣言传播达到足够规模后,会对网络环境的稳定性或是社会治安带来一定的威胁[5],因此需要研究谣言传播模型,分析谣言在网络中的传播规律,了解谣言传播的特性以及传播规律,通过谣言传播过程中的变化规律,找出控制其传播的因素,这有助于谣言的控制与治理。另一方面,对于谣言传播过程的研究也有助于谣言源头的寻找,通过识别出谣言传播的源点,可以很大程度的减少谣言产生的威胁,达到控制风险的目的[6]。
1.2 研究现状
1.2.1 谣言传播模型的稳定性研究现状
谣言是人类相互交流过程中可能发生的一种社会现象,而当今社交网络已经发展的到相当庞大的规模,每天都有许多的消息要通过社交网络进行传递,这为谣言的传播提供了便利的条件。谣言的传播会给社会安定带来巨大的威胁[7],因此,许多的学者开始关注控制谣言传播的研究。现有的研究主要是通过数学模型以及仿真实验来研究谣言传播的过程,并取得了较多成果。Daley等[8]提出了DK模型,这是较为早期的谣言传播模型,他们划分了3种节点状态,未接触谣言者,传播谣言者以及不传谣者,并且通过随机过程去分析谣言传播的过程,最后借助微分方程的形式描述了谣言传播的规律。后来Maki等[9]改进了DK模型,提出了MT谣言传播模型,他们认为只有初始的传播者在传播谣言后会停止传播,并且使用马尔可夫链的方法描述了谣言传播过程。由于这两个模型只能描述谣言传播过程而无法数学求解,后来的学者进一步研究,在建立模型上结合传染病学的知识 , 提 出 了 Susceptible-Infected (SI), Susceptible-Infected-Susceptible(SIS), Susceptible-Infected-Recovered(SIR)等模型[10-12]。Zanette等[11]在小世界网络中研究SIR模型下谣言传播的过程,他们把节点状态分为易感状态,感染状态和免疫状态,建立了SIR平均场方程并对传播过程进行分析,得出谣言传播存在临界值的结论。Nekovee等[13]在无标度的复杂网络中研究谣言的传播过程,通过实验验证了不同参数设置会影响谣言的传播。
近年来,学者们通过对谣言传播模型的扩展并运用数学建模的方法继续研究谣言传播过程。Zhao等[14]在谣言传播模型中考虑了遗忘率,在经典传染病模型的基础上,提出了一种新的状态加入的传播模型Susceptible-Infected-Hibernator-Removed (SIHR),表示节点可能因为某些因素而忘记了谣言,如果有某些事件发生会唤醒忘记的谣言,重新变为感染者的状态。并且通过实验仿真说明了遗忘率对谣言传播过程的影响。夏玲玲等[15]考虑了谣言传播中的潜伏期,提出了Susceptible-Exposed-Infected-Recovered(SEIR)模型,通过平均场方程得出传播的阈值,并对模型进行了稳定性分析。王筱莉等[16]考虑了具有怀疑机制的谣言传播模型,提出了Susceptible- Infected-Quarantine-Recovered(SIQR)模型,给出了该模型的平均场方程并进行了数值仿真实验,结果显示提高网络中知道真相人的数量,可以降低网络中谣言的影响力。Zhou等[17]提出了具有时滞的谣言传播模型,通过实验分析了该模型平衡点的存在以及稳定性。
第二章 理论基础
2.1 传染病模型
2.1.1 传染病模型简介
传染病模型是一种基本的数学模型,主要是研究传染病的传播速率、传播的范围、传播的路径等问题。用于指导社会对传染病进行有效的预防与控制。早在上个世纪,Kermack等[37]提出仓室模型后,学者们陆续将各种传染病模型引入到计算机网络信息安全领域中,研究网络中的计算机病毒、恶意程序、谣言等信息的传播动力学问题,总结出许多的数学模型。例如,根据节点的不同状态,提出了以下几种经典的传染病模型:SI(Susceptible-Infected)、SIS((Susceptible-Infected-Susceptible) 、 SIR(Susceptible-Infected-Recovered) 、 SEIR(Susceptible-Exposed-Infected-Recovered),其中节点状态有:易感染状态(Susceptible,记作S状态)、感染状态(Infected,记作I状态)、免疫状态(Recovered,记作R状态)以及潜伏状态(Exposed,记作E状态)。下面具体介绍这几种模型。
2.1.2 SI 模型
SI模型是最经典的传染病模型,将所有节点状态分为易感状态和感染状态。假设在谣言传播过程中不考虑节点的接入或退出的情况,所有的易感状态节点都可能被感染为感染状态,随着谣言的开始传播,易感状态的节点会以一定的概率被邻居的感染状态节点感染,继而转换为感染状态,且一旦状态改变则无法复原,传播过程简记为 S I 。
2.2 稳定性定理
稳定性分析是谣言传播动力学的一个重要内容。通过微分方程的基本理论,分析模型达到平衡点时的稳定性是研究谣言传播动力学的重要思路。
2.2.1 系统稳定性概述
在动力学系统中,系统稳定性指的是在节点状态不断变化的系统中,随时间的变化最终恢复到平稳的状态,则称系统是稳定的;如果系统不能回到平稳状态,则称系统是不稳定的。在谣言传播过程中,系统中的节点状态随时间不断变化,最终会收敛某一种状态,通常称为平衡点。一般的谣言传播模型中会有两个平衡点,一个是感染状态消失的无病平衡点,达到这种状态的系统,感染节点全部消失,即谣言被消灭;另一个是局部的有病平衡点,系统最终处于收敛后,谣言不会消失而继续以一定比例存在于系统中。
复杂网络是一种高度复杂性的网络,具有自组织、自相似、小世界、无标度中部分或全部性质的网络,它介于规则网络与随机网络之间,由若干组成部分组合而成,各个组成部分之间存在相互依赖关系。复杂网络的应用十分广泛,目前学者们普遍都在研究复杂网络中的小世界网络以及无标度网络。
无标度网络(Scale-free network)是由Reka Albert等[47]提出的BA无标度网络模型,其网络中有少量的Hub节点拥有大量的连边,即邻居节点,而大部分的节点的度很小,节点的度服从幂律分布,如图2.4所示。当网络中有新节点要加入时,会优先与度值高的节点进行连接,这种特性在社会网络中也很常见,比如,微博网络中,流量大的账户,其具有的粉丝量巨大,新加入的用户都会优先关注这些大V。无标度网络是通过其增长性以及优先连接性构成的。
第三章 基于扩展传染病模型的谣言传播稳定性分析................. 16
3.1 引言 ....................................... 16
3.2 谣言传播模型 ..................................... 17
第四章 基于扩展传染病模型的谣言溯源研究................................ 28
4.1 引言 ................................. 28
4.2 传播模型 .............................. 29
第五章 总结与展望........................... 44
5.1 论文总结 .................................... 44
5.2 未来展望 ........................... 45
第四章 基于扩展传染病模型的谣言溯源研究
4.1 引言
在第三章中为了更加贴合实际情况,考虑系统对传播谣言节点的封禁隔离能力,扩展经典 SIR 传染病模型提出 SIOR 模型。本章将在此谣言传播模型的基础上简要修改,并研究单一源节点的谣言溯源问题。本章将基于最优信息传播过程给出计算谣言源点的估计器,并且针对 SIOR 模型验证该估计值近似于网络拓扑中的 Jordan 感染中心。根据 RI(Reverse Infection)算法,提出一种针对 SIOR 模型的反向信息传播算法,用于识别出网络拓扑图中的 Jordan 感染中心。最后在不同的网络进行模拟对比实验,验证该算法优于传统的中心性算法,同时在 SIR 模型与 SIOR 模型中进行实验,分析考虑隔离状态加入后对溯源准确率的影响。
第五章 总结与展望
5.1 论文总结
随着社交网络的日益普及,微信、微博、Facebook 等社交网络媒体飞速发展,如今成为人们生活必不可少的社交平台。这些社交网络平台为我们带来了便利的同时,也带来了一些麻烦,网络谣言就是其中之一。在当今的社交网络上充斥着五花八门的谣言,有些谣言会导致对个人的利益受损、影响金融证券市场稳定、导致社会混乱等问题。所以,分析谣言的传播过程并找出谣言传播的源头对于遏制谣言的传播扩散有十分重要的意义[51-52]。本文主要研究工作如下:
1. 本文在经典传染病模型的基础上,考虑了现实社交网络平台对账号传播谣言信息的检测能力,加入了隔离状态,提出了 SIOR 模型。同时还引入饱和函数来描述谣言传播治理过程中,系统检测传播谣言节点的能力水平,建立带有饱和控制函数的谣言模型,并分析了该模型下节点状态的转换过程。本文使用微分方程的形式构建了 SIOR 模型中各状态的转换方程,并通过计算求出了该模型的基本再生数以及稳定点。本文使用雅可比矩阵的方法证明了该模型达到平衡点时的局部稳定性。接下来本文进行了数值仿真实验,验证了模型达到稳定点时的稳定性,并验证在不同饱和函数参数的设定下,会影响谣言传播达到稳定点的速率以及峰值。最后本文在小世界网络中对谣言传播的过程进行模拟,试验结果表明,在复杂网络的模拟过程中,SIOR 模型的传播过程符合稳定性分析的结果。
2. 为了进一步研究如何控制谣言的传播,本文在 SIOR 模型的基础上进行谣言源点的溯源研究,通过分析节点状态的转换关系并结合马尔可夫链,描述了离散时间下谣言传播过程的节点状态变化。通过分析一般溯源问题的解决方案,本文基于最优信息传播过程简化了传统极大似然估计的计算问题,并通过 3 个定理描述了最优信息传播过程的源点近似于拓扑结构中的 Jordan 感染中心,再对定理进行了证明。本文还基于 RI 算法提出了针对 SIOR 模型的反向信息传播算法,用于找出拓扑结构中的 Jordan 感染中心。最后通过在不同的网络数据集中进行模拟实验,结果表明该溯源方法在不同的网络环境下均优于其他中心性溯源方法,并且考虑在 SIR 模型下进行对比实验,结果显示考虑了隔离状态的加入,有助于谣言源节点的检测。
参考文献(略)