本文是一篇计算机论文,本文提出了一种高度可扩展的新型数据中心网络拓扑结构,基于该结构研究了其直径、连通度、不相交路径和路由等方面的性质。
第1章绪论
1.1研究背景与意义
随着云计算、大数据、人工智能等信息技术的迅速发展,数据中心已成为支撑现代信息社会的重要基础设施之一[1]。数据中心网络作为数据中心的核心组成部分,其性能和可靠性直接影响着数据中心的整体运行效率和服务质量[2]。为了应对不断增长的数据流量和不断变化的应用需求,传统的数据中心网络拓扑结构已经难以满足对高可扩展性、低时延、高可靠性等方面的需求。因此,针对新型数据中心网络拓扑结构及性质的研究具有重要的理论和实践意义。
物联网(IoT)和移动互联网的迅速发展正带来数据创建和数据量的爆发式增长,因此数据中心网络承载着日益增长的数据传输和处理任务,面临前所未有的性能和可扩展性挑战[3]。传统的数据中心网络拓扑结构往往难以满足高效、可靠、安全、低延迟等多方面的需求。因此,对新型数据中心网络拓扑结构进行深入研究显得尤为迫切和重要[4]。这项研究旨在探索和设计更加适应大规模数据传输和处理的网络结构,以提高数据中心网络的性能、可靠性和安全性。通过优化网络拓扑结构,可以有效减少数据传输时的延迟,提高网络的带宽利用率和吞吐量。同时,新型拓扑结构的研究也有助于降低网络故障和攻击的风险,增强数据中心网络的鲁棒性和安全性,为数字化时代的信息基础设施构建提供有力支撑。
1.2国内外研究现状
为了提升数据中心网络的性能,国内外学者对数据中心网络拓扑结构及性质进行了大量研究。互连网络的拓扑结构可以看作是一个图结构,其中图中的结点表示处理器,边表示链路。交换机透明化后的数据中心网络也可以用图进行表示,其中图中的结点代表数据中心网络中的服务器,图中的边代表数据中心网络中服务器和服务器之间的链路。因此,在本文中若无特殊说明对结点、处理器和服务器不加以区分,对边和链路也不加以区分。下面主要介绍了数据中心网络拓扑结构、安全信息模型以及容错路由等方面的国内外研究现状和研究成果。
1.2.1新型数据中心网络拓扑结构
数据中心网络不仅是数字经济发展的支柱,也是各种以数据中心为基础设施的新技术发展的基础。因此,学术界和工业界都非常关注和重视数据中心网络的性质。为了更好地推动数字经济的发展,近年来学者们提出了许多新型数据中心网络拓扑结构。
传统数据中心网络主要是以交换机为核心的,如FatTree[9–11],Monsoon[12],Portland[13],Elastic Tree [14],FBFLY[15],Jellyfish[16],F10[17],Aspen Tree [18],Diamond[19]和Criso[20]。这些以交换机为核心的数据中心网络往往存在构造成本高、通信过程中单点负载过重和网络拥塞等问题。尽管Al-Fares等人[9]提出的FatTree结构,很好地解决了核心层负载过重的问题,但其扩展性仍受限于交换机端口的数量,使得以交换机为核心的数据中心网络无法满足当前爆发式增长的数据处理需求。因此,新型数据中心网络通常是以服务器为核心进行构建的。
第2章相关知识
2.1基本概念和符号表示
互连网络的拓扑结构可以看作是一个图结构,其中图中的结点表示处理器,边表示链路。交换机透明化后的数据中心网络也可以用图进行表示,其中图中的结点代表数据中心网络中的服务器,图中的边代表数据中心网络中服务器和服务器之间的链路。
3.2.2容错路由方案
不同的网络结构具有不同的网络规模、网络直径和交换机数量。因此,在衡量网络的建设成本时,很难说一个网络结构比其他网络结构更好。在本小节中,使用文献[66]中的成本模型来比较BCube、BCCC、DCell、DPCell和HSDCell 的建设成本。基于文献[66]中的成本模型,主要考虑交换机、服务器端口和服务器核心的价格。文献[66]中的成本模型假设每个端口的价格是固定的,并且交换机端口和服务器端口的价格与其端口数量线性相关。在本章中,比较了40 Gbps交换机和40 Gbps服务器端口的价格。根据文献[24]中的实验数据,单核可以处理10 Gbps的工作量。因此,每个服务器需要4个核来处理40 Gbps的工作量。根据市场数据,每个40 Gbps交换机端口的成本是2000美元,每个40 Gbps服务器端口的成本是600美元,每个服务器核心的成本是280美元。
第3章新型数据中心网络拓扑结构HS-DCell ...................................15
3.1 HS-DCell 网络结构.....................................15
3.1.1 HS-DCell 的结构.......................................15
3.1.2 HS-DCell 的关键特征..........................................19
第4章交换超立方体中的自适应容错路由......................43
4.1交换超立方体的性质........................................43
4.2改进的局部安全信息模型和不安全系数.................................43
第5章不完全SDCCP中的自适应容错路由.............................53
5.1改进的双层安全信息模型及不安全系数.................................53
5.1.1网络结构........................................53
5.1.2故障处理解决方案...............................54
第5章不完全SDCCP中的自适应容错路由
5.1改进的双层安全信息模型及不安全系数
在本节中,首先给出了网络结构中的一些新定义。其次,为同时存在服务器故障和链路故障的网络提供了一个故障处理解决方案,以简化网络研究的复杂性。然后,提出了一个改进的双层安全信息模型。最后,在改进的双层安全信息模型的基础上,提出了不安全系数的概念,推导了不安全系数的计算公式。
5.1.1网络结构
故障处理方案具体操作如下:如果LSDCCP中的一个服务器发生故障,会将连接到此服务器的所有链路均视为故障链路。基于此方案,可以对L-SDCCP进行纯故障链路分析。此外,通过结合故障处理后的LSDCCP,还可以获得IG中的故障情况。总之,与仅解决由服务器发生故障或链路发生故障引起的问题的安全信息模型相比,这种解决方案更具通用性,也更符合实际情况。
第6章总结与展望
6.1总结
数据中心网络的拓扑结构直接影响着数据中心的性能和效率,因此设计高性能的数据中心网络拓扑结构至关重要。首先,在本文中提出了一种高可扩展性的新型数据中心网络拓扑结构,并从连通度、不相交路径和容错路由等方面对其性能进行了分析。然后,又在交换超立方体和不完全SDCCP上研究了基于安全信息模型的自适应容错路由算法。本文具体研究成果如下:
1.提出了一种新型数据中心网络拓扑结构。实验结果表明,与其他主流的数据中心网络拓扑结构相比,本文提出的新型数据中心网络拓扑结构在可扩展性、构建成本、传输时延、容错性和服务器端口利用率等关键性能指标上具有明显的优势。
2.定义了一个能够同时考虑服务器和链路发生故障,并能够准确评估出服务器不安全系数的安全信息模型。与现有的安全信息模型相比本文提出的模型更可靠、准确性更高,同时也更符合实际应用的需求。
3.通过将安全信息模型与容错路由算法相结合,分别设计了基于交换超立方体和不完全SDCCP的自适应容错路由算法,该算法总能在源服务器和目的服务器之间,选择不安全系数最低的服务器进行传输,减少了重传的现象,降低了数据的传输时延。另外,本文设计的容错路由算法不仅适用于规则网络还适用于异构网络,提高了容错路由算法的效率和普适性。
参考文献(略)