代写计算机论文选题:基于知识图谱和图神经网络的冷启动推荐方法思考

发布时间:2024-05-02 21:12:48 论文编辑:vicky

本文是一篇计算机论文,本文对解决推荐系统冷启动问题进行比较深入的研究,针对推荐系统冷启动问题,总结和分析了这一领域的最新研究进展,而知识图谱作为一种辅助信息被广泛应用在各种领域,尤其是在推荐系统方面,因为知识图谱可以为推荐提供一个良好的补充,并提供可解释性、多样性的推荐结果,还有知识图谱可以提供实体,使未交互过的用户和物品以此进行高阶连接。

1绪论

1.1研究背景及意义

随着互联网的不断发展,人们获取信息的方式越来越多样化和个性化。在这个过程中,互联网应用程序大量涌现并被越来越多的用户使用,在为用户带来更好的消费、娱乐等体验的同时,也带来信息过载这个问题。因为网络数据呈爆炸式增长,大量的数据充斥在人们面前,所以如何获取、利用有效的数据,为用户提供高质量的信息,提升应用程序的竞争力和用户的粘性,使其在同类互联网应用中具有竞争力,成为互联网公司广泛关注的问题。而推荐系统作为一种重要的信息过滤和推荐工具,被成功应用于众多互联网公司[1]。包括电子商务推荐(Amazon、淘宝、京东)可以根据用户的购买历史和搜索记录向其推荐相关产品,提高销售量和用户满意度;电影和视频推荐(Netflix、抖音、快手)、音乐推送(Pandora、Last.fm)可以通过推荐系统为用户推荐个性化的电影、音乐和节目,提高用户留存率和付费率;以及Facebook等社交媒体可以利用推荐系统推荐用户可能感兴趣的朋友和内容,增加用户粘性和活跃度。

推荐系统虽然已经广泛应用在实际生活中的很多场景,但是仍然面临着一些问题,当推荐系统的数据严重匮乏,用户以及物品的历史行为信息不足,没用充足的可用数据就会导致其推荐效果和推荐质量严重的下降,这种情况称为冷启动问题。冷启动问题对推荐系统的性能和用户体验产生了极大的影响,因此解决冷启动问题成为长期存在推荐系统研究领域的重要问题之一。近几年随着图神经网络以及知识图谱技术的高速发展,有研究者意识到可以通过图神经网络结合知识图谱技术来解决推荐系统冷启动问题。知识图谱可以将不同实体之间的关系以图的形式进行表示,采用图构建知识图谱和数据之间的关联,是一种直接且有效的将知识图谱实体和数据结合的方式,从而为推荐系统提供了更为丰富的信息,有效缓解冷启动问题。受益于图神经网络技术在信息传播和推理上的优势,图神经网络技术可以迭代的聚合高阶信息,尤其是结合知识图谱的图神经网络方法,能将知识图谱中的先验知识被有效地引入到传播任务中。通过这些方法,可以缓解推荐系统中的冷启动问题,提高推荐系统的性能和用户体验,为个性化服务的发展提供有力支持。

计算机论文怎么写

1.2国内外研究现状

1.2.1传统推荐算法

推荐系统通过对用户的历史行为进行分析,精准的为用户推荐更加符合其需求的产品或服务,针对不同用户实现个性化的服务。推荐系统及相关技术可以根据用户的历史行为、偏好、社交网络等多种因素,为用户个性化地推荐产品、服务或信息,从而提高用户的满意度和体验度。推荐算法的优势主要体现为以下3个方面:

(1)解决信息过载问题

随着互联网的快速发展,人们获取信息的方式越来越多样化和便捷化,但同时也带来了信息过载的问题。推荐系统可以通过个性化的过滤和推荐,帮助用户快速找到自己感兴趣的信息,缓解信息过载的问题。

(2)满足用户个性化需求

随着用户的个性化需求不断增加,传统的信息检索和推荐方式已经难以满足用户的需求。推荐系统可以根据用户的历史行为、兴趣偏好、个人特征等信息,为用户提供个性化的推荐服务,推荐符合其需求的产品或服务,从而提高用户的满意度,满足用户的个性化需求。

(3)商业利润

在电商、社交网络等领域,一个好的推荐系统可以得到相当可观的商业利润。因为通过推荐系统,企业可以更好地理解用户需求,提高用户满意度和忠诚度,从而在市场份额竞争中占据更有利的位置,因为好的推荐系统会增加用户的粘性,从而增加应用中用户的数量。推荐系统可以根据用户的购买历史和行为,为用户推荐相关的产品或服务,从而增加商品销售额。

2相关工作

2.1基于知识图谱和图神经网络的推荐算法

近几年随着深度学习的高度发展,有研究者意识到可以通过结合知识图谱以及图神经网络技术,深度学习技术来解决推荐系统冷启动问题,比如图神经网络技术,可以迭代的聚合高阶信息,能够有效缓解冷启动问题,但是仅仅根据用户历史行为推荐与用户喜欢物品相类似的物品,不可避免出现信息不足的、推荐结果不好的问题。基于图神经网络的方法虽然能够聚合高阶信息,一定程度上缓解推荐冷启动问题,但有些不足。Hao等人提出了PTGNN[48],一个基于预训练图神经网络解决冷启动问题的推荐算法的启发,文中提出尽管图神经网络(GNNs)的发展采用了高阶协作信号来缓解问题,但冷启动用户和物品的嵌入没有明确优化,并且在GNNs的图卷积过程中冷启动邻居没有被处理,处理冷启动节点的冷启动邻居节点的噪声是至关重要的。Bian等人[52]提出了去噪用户感知记忆网络DUMN,论文认为用户物品交互存在一定的噪声。如点击行为中存在一定的误点击,而未点击中也有可能包含用户比较感兴趣的物品。虽然能从显式和隐式反馈中可以更好地学到用户偏好的演变。因为冷启动节点容易受到噪声的影响,图神经网络在高阶传播信息时,目标冷启动物品节点有交互的冷启动用户邻居,会给目标冷启动节点带来噪声的影响,当基于图神经网络推荐方法遇到冷启动问题时,节点在图中邻居很少,那么可增加边或增加节点来丰富图的结构。

近年来许多学者提出了将辅助信息与图神经网络结合的推荐算法[31-33]。但是这些方法存在一定的不足,不能很好地识别冷启动节点的冷启动邻居节点,在高阶传播的过程中,容易受到冷启动邻居节点邻居带来噪声的影响,不能达到较佳结果,无法很好地解决推荐冷启动问题。Wang等人[23]提出了一种端到端的基于知识图谱和图神经网络的推荐模型KGAT,它提出一个将用户-物品交互矩阵与知识图谱实体结合而成的协同知识图。之后又通过嵌入传播直接聚合用户与物品之间的高阶关系,根据注意力机制区分相关邻居,最后又通过用户以及物品嵌入的点积,得到了目标用户采取该物品的概率。

2.2基于对比学习的推荐算法

近年来,对比学习[34-40]作为Self-Supervised Learning(SSL)的一种实现方式,产生的背景是为了解决"标注稀少或无标注"的问题。对于推荐系统来说,不缺标注数据(用户反馈),推荐样本丰富,是个假象。推荐系统有海量样本不假,但是对于新用户和新物品的偏见也相差悬殊。一方面20%的热门物品占据了80%的曝光量,剩下80%的小众、冷门物品没有多少曝光机会,自然在训练样本中也是少数、弱势群体,样本中的用户分布也有天壤之别。另一方面,任何一个app都有其多数、优势人群,比如社交app中的年轻人,或者跨国app中某个发达地区的用户。相比之下,也就有少数、劣势人群在样本中“人微言轻”。

因此,在推荐系统中引入对比学习,来解决“少数人群+冷门物品,数据样本少”的问题,其用武之地,就是推荐系统的消除偏见,减少用户、物品间存在的噪音,而且在推荐场景下,对比学习是作为辅助训练任务出现的。用户、物品之间的相似性是推荐算法的重点关注。而对比学习关注的是用户与用户子图,物品与物品子图之间的相似性,一般只在训练阶段发挥辅助作用。

Yang等人[53]提出了基于知识图谱的对比学习模型(Knowledge Graph ContrastiveLearning for Recommendation,KGCL),提到了知识图谱里存在稀疏性和噪声问题,使得物品之间的实体依赖关系偏离了对其真实特征的反映,从而降低了准确度。提出了两个观点,一方面,实体的长尾分布导致基于知识图谱的物品表征的监督信号变得稀疏。另一方面,实际应用中的知识图谱往往是有噪声的,比如知识图谱的链接中也包含了很多物品和实体之间弱关联甚至不太相关的噪音连接信息。所以说有必要解决冷启动节点遇到的噪声问题,从而解决推荐冷启动问题。

3 融合知识图谱与预训练的物品冷启动推荐方法 .............................. 22

3.1 引言 ....................................... 22

3.2 推荐模型 .............................. 22

4 融合知识图谱与关系感知对比学习的冷启动推荐算法 .................. 36

4.1 引言 ............................ 36

4.2 推荐模型......................... 37

5 总结与展望............................ 52

5.1 全文总结 ..................................... 52

5.2 研究展望 ............................................... 53

4融合知识图谱与关系感知对比学习的冷启动推荐算法

4.1引言

近年来,知识图谱作为一种辅助信息被广泛应用在各种领域,尤其是在推荐系统方面,因为知识图谱可以为推荐提供一个良好的补充,并提供可解释性、多样性的推荐结果,虽然这些基于知识图谱的方法通过多跳聚合高阶信息来提高目标节点嵌入质量来解决冷启动问题。但是本文通过分析,并认为这些基于知识图谱的方法仅侧重于从数据层面提高推荐性能(即利用实体关系提供高阶协作信号),但他们大多数都忽略在冷启动场景中,由于冷启动节点质量不高,使得带来的噪音会干扰目标节点的问题。并且基于知识图谱的方法在多跳聚合高阶信息时,很容易受到交互带来的噪音的破坏[34,41],尤其在冷启动的情况下受到影响更大。一方面,由于用户提供的大多数反馈都是隐式的(例如,点击、浏览),而不是显式的(例如,评分、喜欢/不喜欢),用户物品交互容易存在一定的噪声,如点击行为中存在一定的误点击,而未点击中也有可能包含用户比较感兴趣的物品。举例来说,比如目标用户误点了一个物品,此物品不是用户所喜欢的,如果这个用户是一个冷启动用户,平常很少买东西,推荐系统会推荐给这个冷启动用户不喜欢的相似物品,这就会对推荐结果产生较大的误导,尤其是在冷启动(包括物品冷启动以及用户冷启动)的情况下,会产生不准确的结果。另一方面,实际应用中的知识图谱往往是有噪声的,比如知识图谱的链接中也包含了很多物品和实体之间弱关联甚至不太相关的噪音连接信息。所以有必要减少冷启动节点减受到的噪声,提高冷启动节点的嵌入质量,挖掘用户潜在的兴趣,从而缓解推荐冷启动问题。

计算机论文参考

5总结与展望

5.1全文总结

本文对解决推荐系统冷启动问题进行比较深入的研究,针对推荐系统冷启动问题,总结和分析了这一领域的最新研究进展,而知识图谱作为一种辅助信息被广泛应用在各种领域,尤其是在推荐系统方面,因为知识图谱可以为推荐提供一个良好的补充,并提供可解释性、多样性的推荐结果,还有知识图谱可以提供实体,使未交互过的用户和物品以此进行高阶连接。本文先总结近年来基于知识图谱与图神经网络的推荐算法,并分析了这些方法如何利用知识图谱来改进推荐结果,并在这些方法中发现了一些不足,他们大多数都忽略了冷启动邻居节点和噪音干扰问题。冷启动节点容易受到噪声的影响,噪声主要可能是由交互过的冷启动邻居节点、用户误点击或弱相关的知识图谱实体带来的。减少冷启动节点遇到的噪声问题,会提升冷启动节点的嵌入质量,更好地挖掘用户的潜在兴趣,从而解决推荐系统冷启动问题。因此本文提出以下两个算法:

(1)提出了一个融合知识图谱和预训练的物品冷启动算法依据用户物品二部图和知识图谱构造协同知识图,生成用户、物品初始嵌入,根据自注意力学习器来构建元嵌入,减少目标冷启动节点受到冷启动邻居带来的噪声问题。其次在一阶传播时,针对物品非完全冷启动问题,采用元聚合器聚合目标物品、邻居以及额外的元嵌入来重构物品的嵌入;针对物品完全冷启动问题,仅通过实体节点来重构冷启动物品的嵌入。

(2)提出了融合知识图谱与关系感知对比学习的冷启动推荐方法,可以解决推荐冷启动问题。方法步骤如下,提出了一种节点丢弃增强算子,然后通过这种增强方式生成两种子图,并通过对比学习最大化同一节点不同视图之间的一致性,最小化不同节点的一致性,作为预训练任务来增强冷启动物品和用户的嵌入。还设计了一个基于GRU的注意力更新门机制,来更好的聚合物品邻域的协同特征表示和知识特征表示增强冷启动物品嵌入。提出一个自适应负采样器,利用知识图谱带来的高阶信息为用户自适应的采样高质量的硬负样本,优化模型训练,挖掘用户的潜在兴趣。

参考文献(略)