代写电子商务论文范本:基于图神经网络和用户评分行为特征的网络水军检测思考

发布时间:2023-12-17 19:37:31 论文编辑:vicky

本文是一篇电子商务论文,本文就电商平台恶意用户识别问题首先提出一种基于用户评级模式和评级偏差信誉排名方法。接着,提出一种基于用户评分偏好和偏差的通用指标,来补充现有的信誉排序算法。

第一章绪论

1.1研究背景及意义

21世纪以来,随着我国计算机技术、网络安全和物流运输的不断完善,使得电子商务经济迎来了爆发式增长。尤其是近些年新冠疫情爆发,一方面,人们的出行受交通管制等影响,使得线下购物行为无法实施。另一方面,随着直播带货等新型卖货形式的产生,使得人们逐渐倾向在线购物这一行为。而随着这些现象的发生,进一步刺激了我国电子商务平台的发展,例如:京东、淘宝、亚马逊和拼多多等[1]。据我国统计2021年电商平台营收数据显示:亚马逊共收入25190.29亿元,同比增长37.62%。京东共收入9515.93亿,同比增长27.59%。阿里巴巴共收入7172.89亿元,同比增长40.72%。

不幸的是,随着电子商务经济的增长,其巨大的利润使得电商平台成为一些不法分子攻击的目标。一些商家为了自身利益,往往会雇佣大量刷客来有目地控制目标商品的排名,这种行为也被称为刷单。刷单是指商家为了提高(降低)目标商品的排名,雇佣大量的刷客给出虚假评价的作弊行为[2]。刷客在接收商家的刷单任务后,会首先模拟正常消费者对商铺进行浏览,之后再进行下单和给好评(差评)等一系列操作。这种行为不仅扰乱了其他用户的判断力和购买力,而且严重影响了在电子商务平台的公信力和市场秩序。此外,目前电商欺诈还存在“薅羊毛”、黄牛抢购和海外代购等行为,据Statista公布的2022年数据显示:全球因电子商务欺诈造成经济损失估计达到410亿美元,比2020年同比增长200亿美元左右。预计到2023年,由电商欺诈造成的损失将进一步增长到480亿美元。因此,如何找出这些虚假评论对电子商务平台发展变成至关重要。

电子商务论文怎么写

1.2国内外研究现状

1.2.1基于虚假评论的欺诈检测研究现状

由于恶意用户为了在短时间内达到操纵目标商品的排名,往往会给出虚假的购物评价,这与正常用户购物后给出评价,在细节和语义方面都存在细微差异。因此,研究者们可以通过用户的评级评论识别恶意用户。

(1)基于评级的分析方法

由于评论者的评级在某些方面间接表达了使用者的意图和想法,一些学者们提出了基于评论者评级分析的欺诈检测方法,这类方法是利用统计模型来构建用户信誉体系。商品的真正质量取决于用户客观且真实的评价[5][6]。最初,研究者们认为衡量商品最直接的方法,就是用该商品所获评级的均值表示。但在现实生活中,真实用户的评级往往比恶意用户的评级更令人信服。考虑到这一方面,Laureti等人提出了一种基于迭代细化的方法(IR)[7],该方法根据用户的判断能力和商品的质量进行排序,若用户的评分与商品质量的均方误差越大,则被分配的信誉值越低。同时,Zhou等人提出了一种基于用户评分相关性的信誉排序方法(CR)[8],通过该方法,用户的信誉分数由他(她)的评级向量和相应商品的加权平均评级向量之间的相关系数迭代确定,接着不停迭代更新,直至给出最佳的用户信誉分数和商品质量。然而,这种方法想要在算法准确性和评级网络规模之间达到平衡仍然具有一定的挑战性。之后,Gao等人先提出了一种基于组的排序方法(GR)[9],并在其基础之上引入迭代思想,提出了一种基于迭代分组的排序方法(IGR)[10]。这两种方法都来自一个简单而有效的假设,即用户的信誉分数是由用户评级组的加权大小决定的,然后根据其评级相似性对其进行分组,若用户的评级总是与绝大数人的评级相似则越可信。这类方法在识别可疑用户的评级效果显著,但当恶意用户数量过多时,算法的准确性和鲁棒性不可避免地出现了下降。Lee等人假设可以用Z分数衡量用户评级模式下的统计显著性,提出了一种基于偏差的排序方法(DR)[11]。

第二章论文相关理论知识

2.2信誉机制相关概念及研究

信誉机制是本文研究课题的一个重要理论基础,本节将会介绍信誉机制的相关概念和基础知识。

2.2.1信誉机制相关概念

信誉机制(reputation mechanism)是一种通过记录和评估用户行为来建立用户信誉度指标,并根据此指标进行奖惩措施的机制。在信誉机制中,信誉度指标通常以数值或等级的形式表示用户的信誉值。该值随着用户行为的改变而动态变化。良好的行为会增加用户信誉值,而不良行为则会降低其信誉值。信誉机制的核心是建立用户信任和安全的环境,以提高交易的可信度和安全性。信誉机制在当代社会中被广泛采用,特别是在电子商务领域中备受关注和应用。在电子商务中,信誉机制可以用于评估买家和卖家的信誉度,以提高交易的安全性和可信度。在一些在线拍卖和团购网站中,信誉机制也被广泛使用,以评估用户的信誉度并促进交易的安全和信任。此外,社交网络中也存在信誉机制,以防止恶意行为和欺诈行为的发生。

在电子商务领域中,目前已有多种信誉模型[55-57],这些方法的区别在于如何在不同的信任条件下计算每位用户的信誉值。在信誉系统应用和实体信誉评估领域,对信任和信誉有很多不同的定义。信任和信誉是相互依存的,两者都建立在成员之间过去的行为基础之上。社会学角度定义信任为对受托人未来行为的赌注,而信任是指一种在人际关系或社会交往中形成的情感或信念,表现为对他人或某个实体的认可和依赖[58]。在电子商务平台中,用户的信誉通过直接或潜在的推荐信息进行计算,被定义为实体对期望方式自然反应的信心评估。但是这种情况,往往缺乏市场的监管和控制[59]。

2.3图神经网络相关概念及研究

2.3.1图神经网络的相关概念

为什么有图神经网络?传统的神经网络通常是处理结构化数据,例如图像、文本和表格数据等。然而,很多实际应用中的数据是非结构化的,例如社交网络、蛋白质结构、分子化合物等。这些数据往往是图形结构的,由节点和边构成,传统的神经网络难以有效地处理这类数据。因此,出现了图神经网络。

图神经网络是一种专门用于处理图形结构数据的神经网络模型。它能够有效地处理节点和边之间的关系,具有对拓扑结构的建模能力。图神经网络的发展,一方面受益于深度学习和神经网络的兴起,另一方面则是应用需求的驱动。在过去几年中,图神经网络已经被广泛应用于社交网络分析、化学分子设计、推荐系统等领域,取得了很多成功的应用案例。随着数据规模和模型复杂度的增加,图神经网络的研究和应用前景将会越来越广阔。

2.3.2图神经网络的基本性质

图神经网络(Graph Neural Networks,GNNs)是一种用于处理图数据的机器学习模型,具有以下基本性质:

(1)可以处理任意类型的图数据:图神经网络能够处理各种类型的图数据,包括有向图、无向图、带权图、异构图等。这使得图神经网络在许多领域如社交网络分析、化学分子设计、推荐系统等具有广泛的应用。

(2)基于局部信息更新全局表示:图神经网络是一种迭代的模型,其更新节点或边的表示是基于其局部邻居的表示,通过多次迭代逐步传递并汇聚信息得到整个图的全局表示。这种基于局部信息的更新方式使得图神经网络在处理大规模图数据时具有高效性和可扩展性。

(3)具有可学习的参数:图神经网络中的模型参数是可学习的,通过在训练过程中调整模型参数,可以提高模型的性能。在训练过程中,图神经网络能够自动学习特征表示,从而提取出数据中的重要信息。

第三章 基于用户评分行为的电商平台恶意用户识别 ........................ 18

3.1 电商平台恶意用户的评分因素分析 ........................ 18

3.2 基于用户评级模式和评级偏差信誉排序方法 ...................... 18

第四章 基于对抗性数据增强方法改善电商平台恶意用户识别 ........ 40

4.1 动机 .............................. 40

4.2 CARE-GNN 模型介绍 ........................ 41

第五章 总结与展望 .................................. 49

5.1 工作总结 ................................. 49

5.2 未来展望 ............................... 49

第四章基于对抗性数据增强方法改善电商平台恶意用户识别

4.1动机

随着互联网的迅速发展,欺诈行为在数字化时代变得越来越常见。例如,在金融领域,信用卡欺诈、账户盗窃等不良行为对用户和企业造成了严重的经济损失。在电商、社交媒体等领域,虚假评论、虚假广告等欺诈行为也对用户体验和企业声誉造成了威胁。因此,构建高效的欺诈检测模型对于保护用户权益、维护网络安全至关重要。近年来,欺诈检测模型通常基于机器学习和深度学习技术,通过对用户行为和交易数据进行建模,识别潜在的欺诈行为。然而,现有的欺诈检测模型面临着一系列挑战。数据不平衡是一个普遍存在的问题,即欺诈行为在真实数据中往往占比较小。这导致模型在训练过程中难以充分学习到欺诈行为的特征,从而影响模型的性能。其次,欺诈行为较为隐蔽和多变,真实的欺诈样本相对稀缺,导致模型难以建模和检测新的欺诈形式。因此,如何在欺诈样本稀缺的情况下,优化欺诈检测的准确性和鲁棒性,是本文在此章节的一个研究重点。为了解决这个的问题,本文绍了一种基于图数据增强FLAG方法改善电商平台恶意用户识别的方法,并选取了目前较为先进的CARE-GNN欺诈检测模型进行了实验对象。

电子商务论文参考

第五章总结与展望

5.1工作总结

本文主要贡献可以归纳为以下几点:

(1)本文提出了一种基于用户评级模式和评级偏差的信誉排序方法。通过分析用户评级模式和评级偏差,该方法能够识别潜在的欺诈用户,并对用户评级进行修正,从而提高评级的准确性和鲁棒性。尤其在对随机用户的检测上表现良好,能够有效地应对随机用户的欺诈行为,提高欺诈检测的精度,并能完成对商品真实质量的评估。

(2)本文提出了一种基于正常用户和欺诈用户评级偏好和偏差的通用指标,来补充现有的信誉排序算法。该指标通过对正常用户和欺诈用户的评级偏好和偏差进行深入分析,该指标可以更好地刻画用户行为的差异,从而提高欺诈检测算法对可疑用户的识别效率。此外,这一指标的应用为今后的研究提供了新的思路,可以帮助改进现有的欺诈检测算法,提高其对复杂欺诈行为的识别能力,并解决传统欺诈检测算法遭受大面积欺诈用户攻击导致模型鲁棒性快速下降的问题。

(3)本文还介绍了一种利用对抗数据增强方法来提高欺诈检测模型的鲁棒性和精度,以基于图神经网络的CARE-GNN模型为实验对象。采用对抗样本生成器产生具有对抗性的样本,从而增强CARE-GNN模型的分类效果和精度。实验结果表明,该方法在数据集上均取得了较好的性能表现,有效增强了欺诈检测模型对可疑用户节点的鲁棒性。此外,该方法也增强了欺诈模型对可疑节点的识别精度,并且能够在原始数据集上进行无监督的数据增强,避免了额外标注数据的成本和难度。

参考文献(略)