代写电子商务论文范文:烟花算法的改进及其在聚类的推广

发布时间:2023-03-21 22:36:30 论文编辑:vicky

本文是一篇电子商务论文,本文主要研究了烟花算法的两个内容,主要针对烟花算法的有关现状,特别是该算法的局限性,提出一些改进策略,并应用数据聚类,提高算法的有效性,进一步拓展该算法的应用。

第一章 绪论

1.1 研究背景与意义

人类在实际应用过程中会面临很多决策的问题,理想情况下的决策过程是基于方案的各种已知信息。但是,在实际问题中,问题本身就很复杂,精确决策和主观臆断来确定最佳方案一般是不可能的,所以人类经常建立模型来近似处理现实问题,其实质是将这些问题转换为最优化问题。

最优化问题的实质是NP难问题,主要是找到问题变量的最佳方案,达到优化适应度函数的目的。求解最优化问题的方法主要是精确求解类算法以及启发式算法。精确求解类算法虽然能获得问题的精确解,但在解决比较复杂、大规模的问题时,由于NP问题特性带来的计算爆炸[1]可能会出现计算成本大、陷入局部最优的现象。故,很多学者将启发式算法应用到各种复杂的问题。启发式算法优化方案在在现实生活问题中应用十分广泛,如投资组合决策问题、分布式计算机系统中处理器和数据库的分配、无人机任务分配问题、货运装载、加密设计等[2]。

启发式算法是基于“优胜劣汰、适者生存”的自然现象模拟而来的,可分为基于局部搜索算法、进化算法和群智能算法三大类[3]。其中,群智能优化算法具有简单性、灵活性、遍历性而备受关注,在理论和应用方面具有重要的学术价值和现实意义。

烟花算法[4]是近年来提出的一种比较新颖的群智能优化算法,它是一种模拟烟花爆炸产生火花这一自然现象的新型群体智能算法,具有随机性、爆炸性、鲁棒性等特点,因为其独特的爆炸机制能够在比较复杂的环境下随机迭代搜索寻找最优解,成为一种用于求解复杂优化问题的全局概率搜索手段。研究烟花算法的发展,众多研究者们提出了许多有关烟花算法的改进和应用。

1.2 国内外研究现状

1.2.1 群智能算法

由于计算复杂理论的发展以及工业应用的迫切需要,一大批科研工作者投入到群体智能算法的研究中,以便为人类更好的服务。群智能算法[5]是指在简单个体之间通过互相协作能够解决复杂问题,而这种能力是简单个体不具备的。根据研究对象的不同,群智能算法可分为生物群体智能算法和非生物(人工)群智能算法,生物群智能算法是一种模拟生物群体集体智慧的计算智能算法,如,细菌觅食算法(BFA)[6]模拟大肠杆菌在人体肠道内吞噬食物的行为;标准粒子群算法(SPSO)[7]模拟鸟群寻找食物的过程;蝙蝠算法(BA)[8]模拟蝙蝠捕食的过程;蚁群算法(ACO)[9]模拟蚂蚁在寻找食物过程中的路径行为,即寻找最短路径;当然,还有萤火虫算法(FA)[10]、布谷鸟算法(CS)[11]、蛙跳算法(SFLA)[12]、鲸鱼优化算法(WOA)[13]等。非生物群智能算法是一种模拟日常的自然现象的计算智能算法,如水滴算法(IWD)[14],模拟水流在河道流动的过程;磁铁优化算法(MOA)[15],模拟磁场中例子的受力过程;台风成因优化算法(TOA)[16],模拟台风的形成过程;还包括烟花算法(FWA)[4]等。

可以看出,一直以来,学者们在群智能算法方面的努力一直未断过,但是现有研究成果及方法远远不能满足实际应用的需求。烟花算法(Fireworks Algorithm,FWA)是一种比较新型的群智能优化算法,最初为求解复合函数的全局最优化问题,具有较强的全局搜索和局部搜索能力,并且具有易实现、分布式计算机制、强鲁棒性、扩展性良好以及随机性等特点。但在实际应用中,用标准的FWA算法无法有效地解决某些问题,亟待提出具有收敛速度更快、收敛精度更精确、鲁棒性更稳健的改进FWA算法。

第二章 相关理论概述

2.1 烟花算法概述

在2010年,Tan等人从中国传统节日中燃放烟花爆炸这一现象得到灵感而提出烟花算法,该算法是模拟烟花在空中爆炸,形成爆炸火花散落在周围,爆炸火花继续爆炸的过程。该算法包含了烟花、爆炸火花以及高斯变异火花,进而构成烟花种群。烟花算法在此基础上建立了数学模型,烟花的每一次爆炸可以看作是在搜索空间进行一次寻优的过程,经过一定的迭代之后,直到符合实验迭代条件,则停止迭代,寻找到最优解。其更新迭代主要由爆炸算子、变异算子、映射规则、选择策略几个操作完成。

2.1.1 爆炸算子

爆炸算子包括爆炸强度、爆炸幅度和位移操作,是烟花算法的核心操作。爆炸强度主要描述的是烟花在空中爆炸时散落在周边的火花的数目。每当烟花爆炸时,每个烟花都会生成与之对应的子代火花种群。通过烟花的适应度值好坏可以 获取火花的数目,进而说明烟花质量的好坏。如果烟花的适应度值越好,表明烟花的性能越好,其爆炸强度越大,产生的爆炸火花数目越多且分布密集;反之,适应度值越差,则爆炸强度越小,产生的爆炸火花数目越少且分布稀疏。

2.2 聚类算法概述

随着大数据的迅猛发展,海量的数据中隐藏着重大的商机,但是数据中往往是一些高维度、质量不高的冗余数据,这就需要进行数据分析。聚类算法是数据挖掘中常用的手段之一,其主要思想是将数据集划分为若干类别,使得同一个类别的数据尽可能的相似,而不同类别的数据尽可能差异化,目的是基于相似度的基础上来对数据进行划分的。另外,衡量数据集相似度的评价一般采用距离的计算方式。典型的聚类算法可包括样本数据准备、数据预处理、特征选择和特征提取、相似度计算以及聚类效果评估与分析。有关聚类算法的框架图如图2-2所示。

电子商务论文怎么写

2.2.1 聚类算法的种类

数据挖掘来源于多个学科,包括数学、计算机技术、统计学和经济学,因此,受到很多学者的关注,并广泛应用于故障识别[63]、图像处理[64][65]、文本归类[66]、网上学习[67]等多个实际领域。而聚类分析是数据挖掘中常用的手段之一,一般只适用某种特定情况的数据,还没有通用的适合各种数据的聚类算法。

第三章 改进的烟花算法 ........................... 23

3.1 烟花算法的特性分析 ................................... 23

3.1.1 烟花算法的优点................................. 23

3.1.2 烟花算法的缺点.......................... 24

第四章 改进的烟花算法在聚类的应用 ................................ 41

4.1 ARK算法设计 ............................. 41

4.1.1 编码方式和适应度函数设计........................... 42

4.1.2 ARK算法流程以及框架 ....................... 43

第五章 总结与展望 ........................... 58

5.1 论文总结 .............................. 58

5.2 不足与展望 ................................. 59

第四章 改进的烟花算法在聚类的应用

4.1 ARK算法设计


前面第一、第二章均有介绍关于聚类算法的相关背景和知识,在第二章介绍了K-means算法如何划分数据及其基本流程。ARK算法核心思想是聚类问题转化为优化问题,首先需要明确该算法的聚类中心编码方式和目标函数。ARK是一种分段聚类算法,在本文中,改进的烟花算法作为一种搜索策略,利用目标函数适应度值来获取训练样本的近似最优聚类中心(决策变量)。将此聚类中心作为K-means算法的初始聚类中心,将测试样本划分至与自己距离最近的聚类中心点,来验证测试样本中的获取的标签与原测试样本标签是否一致,具体如下:

ARK算法具体可阐述为两个部分,改进的烟花算法和K-means算法。算法首先接收实验数据集,采用划分数据集方式中的留出法(hold-out) ,该方式采用分层采样(stratified sampling)思想,按照比例(8/2)分为训练集和测试集,然后根据标签的个数ck,将这两者分别划分为ck个簇,K-means算法从改进的烟花算法获取训练样本近似最优聚类中心,并利用该聚类中心验证测试样本获取的标签是否与原来测试样本标签一致,以此获取准确度。

改进的烟花算法主要是接收K-means的训练集,然后计算适应值,获取该训练样本的近似最优聚类中心。数据集的属性数目表示维度大小,训练集的每个维度最小值和最大值分别表示改进烟花算法的搜索空间每个维度的边界。

电子商务论文参考

整体而言,ARK算法的核心思想就是从训练样本中寻找近似最优聚类中心,然后利用测试样本验证获得的聚类中心。ARK算法在获取训练样本的近似最优聚类中心的过程中具有随机性和自适应性,比传统具有确定性的划分方式获取的聚类结果更好。

第五章 总结与展望

5.1 论文总结

作为一种全局优化的元启发式优化算法,自2010年提出来,烟花算法以其良好的优化性能受到了学者的广泛关注。事实证明,烟花算法在许多标准测试函数和应用中整体性能优于几种较先进的群智能算法。

总览全文,本文主要研究了烟花算法的两个内容,主要针对烟花算法的有关现状,特别是该算法的局限性,提出一些改进策略,并应用数据聚类,提高算法的有效性,进一步拓展该算法的应用。现从以下几个具体方面对本文研究内容及所做工作进行总结:

(1) 对群智能优化算法的研究背景进行简要介绍,并从而引出烟花算法;然后从算法的理论研究、优化改进和应用三个方面出发,详细总结了烟花算法的国内外研究现状;最后,给出本文的主要研究内容与结构安排。

(2) 对烟花算法和聚类算法,特别是K-means的相关知识进行全面梳理总结。首先,对烟花算法的主要组成及算法流程进行介绍。

(3) 针对烟花算法的局限性,提出了一种自适应爆炸半径的改进烟花算法(ARFWA),引进了粒子群优化算法记忆机制,全局最优gBest和每个烟花爆炸对应生成的爆炸火花最优个体的集合spBest,利用其位置信息来求解烟花的爆炸半径,使得烟花算法能够自适应调整步长;为避免烟花算法陷入“早熟”状态,对gBest进行变异算子处理来增加种群的多样性。

(4) 将ARFWA算法与K-means结合,应用于数据聚类。聚类算法中K-means具有对初始聚类中心敏感以及全局搜索能力不强的问题。将改进的烟花算法作为K-means寻找训练样本近似最优聚类中心的搜索策略,提出了一种ARK(自适应爆炸半径的改进烟花算法与K-means的混合聚类算法)。

参考文献(略)

提交代写需求

如果您有论文代写需求,可以通过下面的方式联系我们。