代写计算机论文范本:基于区块链和联邦学习的数据共享模型探讨

发布时间:2023-11-20 17:02:06 论文编辑:vicky

本文是一篇计算机论文,本文针对大规模医疗数据的存储与共享问题,将联邦学习和区块链结合已经是一种潮流趋势,相关研究人员和学者利用这两大技术已经解决了很多棘手的问题。

1绪论

1.1课题背景与意义

随着人口老龄化和慢性疾病的不断增加,医疗健康领域需要更加高效、精准和安全的数据共享和分析方法,以实现更好的医疗服务和病人护理。然而,医疗数据的隐私保护和安全性是实现这一目标的关键挑战之一。

由于医疗健康大数据的特殊性,当今各方面因素都限制了智慧医疗的发展。其中最严重的问题的就是医疗健康数据存储和隐私泄露问题,当数据遇到攻击者,遭到数据的隐私泄露,对病人和医院机构都会带来极大的危害。

举例来说,2019年中,绿谷网络统计分析了全球数千个在线医疗服务,结果显示2400多万份患者数据信息可以轻易地在互联网上被访问和下载[1]。患者数据的信息详细记录了患者在医疗机构的隐私信息,网络攻击者很可能利用这些隐私数据在网络上发布个人相关图像,就这信息来损害个人声誉,或者关联其他数据进行网络钓鱼和伪造社交活动,或者利用就诊报告中患者信息的身份证号码来盗取身份等目的。此外,医疗健康领域还面临着大数据共享的问题。由于各大医疗机构采用的信息系统不一致,其相关医疗健康数据结构无法统一,医院之间无法进行有效的信息交流,各个医院会出现严重的“数据孤岛”现象。同时,医疗机构如果擅自泄露患者的个人隐私数据,将承担严重的法律后果和经济风险,因此导致相关医疗机构并不愿意和主动共享数据。

区块链是一种去中心化、不可篡改、安全可靠的分布式账本技术,能够提供数据存储和交换的安全性和透明度。在医疗健康领域,区块链可以用于建立医疗数据的去中心化存储和管理机制,从而实现医疗数据的安全共享和访问控制。联邦学习是一种分布式机器学习方法,属于隐私计算方向,通过联合多方数据进行模型训练来保证本地的数据隐私。在医疗健康领域,联邦学习[2]可以用于整合多个医疗机构的数据,提高模型的预测能力和鲁棒性,同时避免数据隐私泄露的风险。因此,基于区块链和联邦学习的架构设计可以实现医疗数据的安全共享和分析,从而为医疗健康领域的研究和实践提供新的思路和解决方案。

1.2国内外研究现状

1.2.1区块链技术研究现状

区块链技术是目前流行的分布式数据库加密技术,逐渐被应用于医疗、物联网、供应链管理等领域。本文将介绍区块链技术的研究现状,包括其发展历程、技术特点、应用领域等方面。

区块链技术的发展历程:区块链技术最早由中本聪[3]于2008年提出,区块链技术最早的应用案例是比特币交易。随着比特币的发展,区块链技术也逐渐被人们所关注。随着技术的更替和发展,以太坊在2014年初发布了基于区块链技术的智能合约平台,该平台为今后的区块链技术发展提供了坚实的基础。此后,区块链技术在金融、物联网、供应链管理等领域得到了广泛的应用,其发展呈现出了快速增长的态势。

区块链技术的技术特点[4]:去中心化、可追溯、不可篡改是区块链技术最鲜明的特点。其中去中心化的架构特点表示没有特定的中心管理机构,每个节点都是平等的,拥有权限和任务。这种分布式的结构可以保证数据的可靠性和安全性。其不可篡改的特点是指一旦数据被记录在区块链上,就无法被修改或删除。这种特点可以保证数据的完整性和可信度。其可追溯[5]的特点是指区块链上的数据可以追溯到其源头,从而保证数据的可追溯性和溯源性。

区块链技术的应用领域:区块链技术在金融、医疗、物流等领域已经得到广泛应用,文献[53]介绍了目前研究区块链技术在医疗领域的应用场景,包括电子病历管理、药品溯源、医疗保险支付等,并对这些应用场景的优缺点进行了分析。文献[48]通过一个基于区块链技术的货物跟踪应用案例,探讨了区块链技术在物流领域的应用。作者介绍了区块链技术在物流领域的优点,如提高货物跟踪的可靠性和透明度,并讨论了区块链技术在物流领域的实际应用中可能面临的挑战。文献[49]探讨了区块链技术在政府领域的应用,分析了区块链技术在政府信息共享和透明度方面的潜在优势,并讨论了在实际应用中可能遇到的挑战和障碍。文献[50]讨论了区块链技术在教育领域实际应用中可能面临的挑战,如技术实施、隐私保护和标准化等方面。

2相关理论与技术

2.2区块链技术

2.2.1区块链技术架构

区块链是由一系列数据块组成的分布式分类账,用于定期的保存交易[25]和数据的记录。如图2.1所示,区块头和区块体构成了完整区块。交易数据总是以哈希值的形式记录在新创建的块中,哈希值包含来自之前所有块的摘要信息(哈希),和新数据合并成一个可以允许任何同行网络轻松识别和验证的新创建块。一旦数据被写入,该区块被立即封存,并成为一个链上的永久谱系,如果在这个过程中,使用链中所有以前保存的块的散列值连续写入新块,并且严格按顺序以数字形式添加到链中,那么这个链可能是无限长的。此外,Merkle树中任何数据的变化都会引起Merkle根的变化,所以理论上想要篡改任何存储信息极其困难,几乎不可能执行。

区块链可以看作是一个可以存储信息的去中心化数据库。从技术架构上看,它具有以下几个关键特点:

(1)分布式账本:所有的信息副本都由被称为矿工的网络参与者共享,他们无需集中的管理机构就可以通过既定的规则去验证这些信息。如果一个交易发生,将会创建新的区块并按照顺序连接到区块链上。

(2)智能合约:基于商定[26]的规则划分交易者的权力和义务,通过取代传统纸质合约的方式建立了机器之间的信任,可以完全控制资产移动以及防止参与方之间的各种纠纷,使交易更加准确。

(3)去中心化:没有必要信任任何第三方,因为该链的状态是由大多数同意该智能合同的参与者决定的。因此,可以以有限的成本、时间和安全的方式自动执行交易。

(4)共识信任:分布式系统中的不信任节点之间必须使用确定性的方法独立地去验证交易并快速有效地达成一致意见并保证区块内容的准确性,同时一定程度上确保系统交易的速度。

(5)数据加密:加密技术(例如,安全哈希算法SHA-256)主要用来在脱离第三方担保的情况下,实现区块链节点的数字签名环节,从而能够对数据进行追踪和身份验证,并且一旦交易被验证和记录,块数据就不能被篡改。

(6)可追溯性:区块链是以块作为单位进行存储,然后按照顺序将带有时间戳的区块链接组成。时间戳属性使交易数据条理清晰的存储在区块中,用户可以利用该属性对交易数据进行调查追踪。

2.3联邦学习技术

2.3.1联邦学习原理

联邦学习是近年来流行的多设备共同参与建模的机器学习方式。在联邦学习中,允许数据提供者在设备上根据数据请求者发布的任务训练机器模型。然后,数据提供者将局部模型更新而不是原始数据传至中央服务器进行全局聚合。2016年由谷歌研究人员首次提出了联邦学习框架[35],旨在打破数据隔离的同时又能确保多设备的数据隐私。在FL之前,需要将训练数据在终端设备进行收集并传输到集中数据中心之后进行数据培训。这是一种会严重侵犯用户隐私的行为,因为这种方式允许拥有完善技术的大型科技公司从广泛的用户数据中分析并获取有价值的信息,通过构建个性化机器学习模型,为消费者提供定制化服务[50]。而在联邦学习中,各数据拥有者不必发送源头数据就可以利用这种方法协作训练学习模型,这使得它成为优化隐私问题的可靠方法,也意味着网络中的节点之间存在共享智能。

典型的FL(如Google FL)由一个中央服务器[36]和多个节点组成,如图2.4所示,中央服务器即任务发布者用来维护全局学习模型,多个节点即数据拥有者迭代执行FL。每一次的FL中,任务发布者会根据FL任务来选定节点。然后,选定的节点开始运行FL迭代。首先,训练节点从中央服务器上下载初始化的全局模型。其次,节点利用自己的局部数据集训练,从而使初始模型进行本地更新,并将更新的梯度上传,具有很高的通信效率。最后,当中央服务器收集所选节点上传的所有本地模型更新时,它会运行联邦平均(FedAvg)算法[51],该算法将所有本地更新进行加权平均,以获得一个聚合的新全局模型。若新全局模型精度满足系统中设定的阈值,则停止FL迭代;若未满足,则继续执行上述流程直到获得满意的全局模型。

计算机论文怎么写

3基于联邦学习与区块链的数据安全共享.............................18

3.1引言..............................18

3.2系统模型...................................18

4基于模型评分的改进PBFT高效共识算法.......................30

4.1引言...................................30

4.2共识算法流程.....................................30

5结论......................46

5.1总结...............................46

5.2展望........................................46

4基于模型评分的改进PBFT高效共识算法

4.2共识算法流程

4.2.1整体思路

图4.1展示了MEPBFT共识算法的总体架构,包括本地模型更新和准确率计算、共识小组建立以及共识过程三个主要部分。本文所提出的MEPBFT共识算法相较于传统的PBFT算法具有以下优势。

(1)传统的PBFT共识算法在网络中节点数量达到一定规模后,性能会急剧下降,因为在每个阶段需要将信息广播给所有节点。为了解决这个问题,本算法将节点分为共识小组节点和候选节点。共识节点主要任务是参与进行共识过程,而候选节点主要任务时监督本次交易是否可信,并接收和查询区块,通过建立共识小组,MEPBFT中的共识流程仅在共识小组中运行,能够有效地解决在参与节点数量增多时性能瓶颈问题。通过在联邦学习中本地训练效果较好和声誉值较高的节点计算得到的综合评价往往越高,因此,本算法根据综合评价来筛选候选节点加入共识小组,对于共识过程中出现异常行为的节点,将会被移出共识小组,由候选节点取代。

(2)传统的PBFT共识算法参与的节点数量固定,针对本文提出的医疗健康数据共享方案,当任务发布者发布的任务变更时,参与的节点会及时更新,一旦有新的节点加入区块链网络中,整个网络需要重启,这样不利于本方案的运行。本算法通过在每个节点增加一张节点状态信息表实现了动态添加新节点而无需重新启动整个网络的功能。其中包含网络中所有节点的信息,如地址、状态和类型等。这个状态表可以实现节点的动态加入和退出。

计算机论文参考

5结论

5.1总结

本文针对医疗健康大数据的场景下参与数据共享的数据源不可靠、医疗健康数据质量参差不齐、可扩展性差、共识效率低等问题进行分析,通过将区块链和联邦学习技术集成来提高数据共享方案的安全性和效率。其中主要针对如何保障联邦学习数据源可靠性以及如何通过改善合适的共识协议来提高区块链在数据共享中的性能进行制定方案。本文的主要创新点集中在第三章和第四章,相关的内容如下:

(1)论文的前两章主要是根据国内外学者的研究内容总结了医疗健康数据共享的研究现状以及研究意义,对本文中使用的联邦学习、区块链、共识算法、边缘计算这几大关键技术在数据共享中的意义和作用分别进行了阐述。同时分析了目前数据共享研究存在的缺陷,并引出了下面具体的创新方案。

(2)本文提出了一项安全的医疗健康数据共享方案,该方案基于区块链和联邦学习技术,旨在提高共享数据的可靠性,将医疗健康数据共享问题转化为数据训练和模型传输问题,节省了传输带宽。采用基于双重主观逻辑模型的声誉估计方法对数据质量不同、声誉等级不同的医院进行量化,用来筛选联邦学习的可靠数据提供者。还利用区块链的特性来存储参与联邦学习的医疗机构的声誉评价和模型参数。最后通过实验分析,与现有的方法相比,本文方案可以更好地检测出低质量数据来源以及提高训练精度。

(3)本文提出了一种基于模型评分的MEPBFT共识优化方法,旨在提高医疗健康场景下区块链在数据共享过程中的共识效率。相较于传统PBFT共识算法,该方案根据本地节点的模型准确率和声誉值结合计算的综合评价方案来构建共识小组;同时,通过引入授权节点维护节点信息表,使得新加入的节点可以实时加入。本方案简化了共识流程,具体分为5个阶段,提高了区块链网络的共识效率和系统性能。在上述区块链架构基础之上,本文进行了相关测试,并与传统PBFT共识算法进行比较,对其吞吐量、时延、容错性、带宽等性能进行评估。测试结果表明,基于MEPBFT的改进容错算法相比较传统PBFT算法具有更高的效率和更好的可扩展性。该算法在医疗健康场景下具有广泛的应用前景。

参考文献(略)

提交代写需求

如果您有论文代写需求,可以通过下面的方式联系我们。

代写计算机论文

热词