面向知识库和个性化的对话系统关键算法计算机研究

发布时间:2020-07-16 21:02:17 论文编辑:vicky
本文是一篇计算机论文研究,本文提出了一些新的解决方法,在 Seq2Seq 模型中融合常识知识库和个性化文本信息,从而提高生成回复的信息含量和个性化程度。本文根据相关文献资料,对现有的面向知识库和个性化的开放域生成式对话系统进行了介绍,并在此基础上提出了两种新的模型。

第一章  绪论

1.1  研究背景与意义
对话系统(Dialog System)是一种利用自然语言来模拟人类对话的计算机程序,它的发展历史最早可以追溯到上个世纪 60 年代。1950 年,“人工智能之父”图灵在《计算机器与智能》[1]一文中提出了图灵测试(Turing Test)的概念,其具体定义为“让一些测试人员在不知情的情况下与一台机器进行聊天,经过多次测试后,如果有超过 30%的测试人员无法判断得到的回复是来自人还是机器,则判定该机器通过了图灵测试并且具有人工智能”。此后,作为图灵测试具体实现方式之一的对话系统成为了人工智能领域中一个十分具有挑战性的热点研究问题,众多研究人员开始尝试使用各种方法研究建立对话系统。
一般来讲,对话系统根据功能的不同可以分为两大类:任务型对话系统(Task-Oriented Dialog System)和开放域对话系统(Open-Domain Dialog System)。任务型对话系统只针对特定领域的用户输入给出回复,主要用于协助用户完成任务,例如餐厅预订、公交线路查询以及设备控制等。苹果公司的 Siri(Speech Interpretation & Recognition Interface)是任务型对话系统的一个典型代表,它是应用在苹果手机、iPad 等产品上的一个语音智能助手。Siri 通过与用户之间的交互从而使用户能够更加方便快捷地处理日常事务。例如,用户可以通过声控或文字输入的方式来搜寻餐厅、电影院等生活信息以及进行查询天气、设置闹钟和播放音乐等操作。任务型对话系统面向具体任务,输入和输出有限,实现起来相对简单,但是与某个特定任务相关的对话数据集的规模通常比较小,因此难以通过数据驱动的方式对模型进行训练,而且前期需要手工制定规则来解决冷启动问题,使得对话系统的构建变得昂贵和耗时。此外,每个任务型对话系统都是为了完成某一特定任务进行设计和训练的,所以导致该类对话系统难以向平行任务领域迁移。
.....................

1.2  国内外研究现状
关于对话系统,早年的研究主要集中在基于模板匹配的方法上[4,5],该方法需要预先通过人工来设定对话的场景,然后再针对每个场景编写特定的对话模板。此类对话系统收到用户消息时,将套用已有的模板并根据用户消息中的具体内容对模板中的一些具体参数进行填充,然后向用户返回回复。这种方法可以生成比较流畅合理的回复,但是对于不同的对话场景都需要人工预先构建相对应的模板,因此限制了该方法的可移植性。
随着互联网的蓬勃发展,人们的日常活动与互联网的联系变得更加紧密。截至2019 年 6 月,中国网民规模达 8.54 亿人,互联网普及率达 61.2%[6]。人们在享受移动互联网提供的服务的同时产生了大量的聊天数据,这为对话系统的研究提供了丰富的对话语料,此时基于检索方式的对话系统较为流行。近几年得益于深度学习的崛起以及计算机硬件性能的提升,研究人员开始利用深度学习技术来研究生成式对话系统,并取得了突破性的进步。
1.2.1  开放域生成式对话系统研究现状
表 1-1 总结了基于模板、基于检索和基于生成的对话系统的优缺点,由此可以看出,基于生成的对话系统更适用于开放域对话。
表 1-1  基于模板、基于检索以及基于生成的对话系统的优缺点总结
.............................

第二章  对话系统的发展以及相关技术

2.1  引言
对话系统是人工智能领域的一个重要挑战,随着人工智能的兴起,关于对话系统的研究也越来越火热。近年来,深度学习技术发展日渐成熟,以对话语料为基础使用神经网络对话模型进行对话学习逐渐成为对话系统的主流研究方法。深度学习的概念源于对人工神经网络(Artificial Neural Network,ANN)的研究,人工神经网络是一种通过模拟人脑神经元网络来对数据进行分析学习的神经网络模型。所谓的深度学习是指具有较多层数的神经网络,例如含有多个隐藏层的前馈神经网络(Feedforward Neural Network,FNN)就是一种深度学习结构,通常这种结构具有更好的学习特征表示的能力,能够拟合任意复杂的函数。
接下来,本章将简述对话系统的发展历史并着重介绍对话系统中常用的深度学习模型,力求做到简洁而全面。
.........................

2.2  对话系统的发展
第一个真正意义上的聊天机器人于 1996 年由 Joseph Weizenbaum 设计开发,名为 Eliza[53],它被定位为一个精神诊疗医师,可以同人们聊心理方面的问题。Eliza的设计非常简单,首先从用户的输入中提取关键词,然后根据关键词去匹配预定义的规则,最后执行正则表达式替换操作并返回给用户合适的回复。然而 Eliza 回复的范围和质量都受到预定义规则的限制,而且时常复制用户输入中的关键词进行反问,所以显得非常笨拙。
20 世纪末,受 Eliza 聊天机器人的启发,一个更加聪明的聊天机器人 Alice(Artificial Linguistic Internet Computer Entity)诞生了。Alice 在 1995 年由 Richard S. Wallace 开发,它使用人工智能标记语言 AIML(Artificial Intelligence Markup Language)来定义对话模板。Alice 的基本思想是预先建立一个离线的对话模板库(包括问句模板和回复模板),对于用户的输入语句,首先在问句模板中找到相匹配的问句,然后按照对应的回复模板生成回复。Alice 曾三次获得人工智能的最高荣誉——罗布纳奖(Loebner Prize),这一奖项是由科学家 Hugh G.Loebner 设立的,被用于奖励与人类回复无差别的计算机程序。但是 Alice 最终没能通过图灵测试,部分原因是 AIML 语言的局限性使得利用该语言构建的对话系统的功能受限,比如不能维持与用户之间的长期对话等。
随着移动互联网的普及以及智能终端设备的兴起,微博、微信等各种社交媒体百花齐放,逐渐成为人们日常生活中不可或缺的一部分。与此同时,众多科技行业的知名企业也纷纷开始投入巨资研发应用在各种智能终端设备以及社交媒体上的对话系统。例如阿里巴巴集团在 2015 年发布的人工智能购物助手 AliMe[54],它可以轻松地与不同场景下的不同人群进行对话,并且能够实现与用户对话的连续跳入跳出和主动引导等复杂对话功能,以满足用户在购物和售前售后服务等典型场景中的个性化需求。2017 年百度公司推出对话式人工智能系统 DuerOS,发布和搭载 DuerOS 的设备可以让用户以自然语言对话的交互方式在不同场景下实现指令控制、信息查询、寻址导航、日常聊天、智能提醒等多种操作。类似的商业产品还有谷歌的 Google Assistant 以及微软的 Conrtana 等。
表 2-1  常用激活函数的对比
...........................
 
第三章  结合知识库的开放域回复生成模型研究 ............................... 25
3.1  引言 ...................................... 25
3.2  数据集和数据预处理 ................................. 25
第四章  面向个性化的开放域回复生成模型研究 ...................... 50
4.1  引言 ........................... 50
4.2  任务的描述与定义 ............................. 51
第五章  总结与展望 ..................................... 70
5.1  本文工作总结 ............................... 70
5.2  未来研究展望 ................................. 70

第四章  面向个性化的开放域回复生成模型研究

4.1  引言
构建像人一样的对话系统一直是人工智能的一个长期目标,其中一个主要的挑战是如何让对话系统在多次对话中呈现出一致的个性,以便能够赢得用户的信任[39]。近几年,人们对于研究面向个性化的开放域回复生成模型越来越感兴趣,以使对话系统生成的回复具有一致性。
目前开放域回复生成算法主要使用 Seq2Seq 模型,然而标准的 Seq2Seq 模型在个性化回复生成任务上存在以下缺点:(1)模型缺少对于个性化信息的编码与解码,即模型生成的回复中不考虑任何个性化信息;(2)容易产生通用回复,对话数据集中存在大量枯燥无味的回复使得模型学习后生成的回复比较单一;(3)回复缺乏一致性,因为对话数据通常来自众多不同的说话人,导致模型无法学习到统一的语言行为模式。为解决以上三个问题,本章提出了面向个性化的开放域回复生成模型 PersonalDlg(Personal Dialog Model),该模型通过引入一些以自然语言形式描述的个性化文本信息来生成与这些个性化信息一致的回复。模型的训练流程如图 4-1所示。
图 4-1 PersonalDlg 模型的训练流程
...........................

第五章  总结与展望

5.1  本文工作总结
近年来,随着互联网和社交媒体的快速发展,开放域对话系统在人们的日常生活中发挥着广泛的作用,它不仅可以满足用户的交流需求,也能为用户提供情感支持,因此研究开放域对话系统具有一定的意义,也是当下的研究热点之一。然而目前的开放域对话系统很少关联外部知识信息,导致对话系统缺乏对于用户输入的理解,从而无法生成具有信息量的回复。除此之外,如何将带有个性化信息的对话数据提供给对话系统,并利用这些信息生成多样化、个性化的回复也是一项重要的挑战。
基于上述问题,本文提出了一些新的解决方法,在 Seq2Seq 模型中融合常识知识库和个性化文本信息,从而提高生成回复的信息含量和个性化程度。本文根据相关文献资料,对现有的面向知识库和个性化的开放域生成式对话系统进行了介绍,并在此基础上提出了两种新的模型。 以下是对本文工作内容的总结:
(1)调研并梳理了开放域生成式对话系统的相关文献,介绍了现有开放域生成式对话系统的研究现状,特别是面向知识库和个性化的开放域生成式对话系统的研究现状。
(2)对对话系统的发展历史和相关技术进行了介绍,主要涉及深度学习技术中的循环神经网络、循环神经网络的变体以及 Seq2Seq 模型和带有注意力机制的Seq2Seq 模型。
(3)提出了一种结合知识库的开放域回复生成模型。该模型利用输入语句中包含的实体词,通过在知识库中进行知识推理,从而增加对于输入语句的理解。在编码器阶段,不是单纯的在每个编码时刻将对应的知识图向量与词向量拼接起来作为输入,而是考虑不同知识图与当前输入以及用户回复的关系,再赋予不同知识图不同的权重,使模型可以忽略那些不重要的知识图。此外,在测试阶段模型通过使用检索回复来帮助解码器选择合适的知识图。
参考文献(略)