本文是一篇计算机论文,本文提出了一种端云协同智能的知识追踪方法,该方法通过结合面向移动终端的知识追踪方法和端云协同智能知识追踪方法两方面的研究,解决了现有知识追踪方法存在的问题,如计算模式和模型性能方面的问题。
第一章 绪论
1.1 研究背景及意义
在全球化加速推进和信息化迅猛发展的背景下,面向2030的教育核心是助力人的全面、自由、个性化发展, 更加重视学生的个性化和多样性。信息化时代对人的知识、能力、价值观提出了更高的要求, 传统工业革命时代的规模化教育体系已无法满足现代信息社会对教育服务的个性化需求,教育改革创新正处在“十字路口”。
当前,个性化学习已成为世界各国教育创新改革的重点。英国政府于2007年1 月发布的《2020愿景:2020年教与学评议组的报告》,描述了2020年实现个性化学习的教育愿景; 2008年,美国国家工程院评出人类在21世纪面临的14大科技挑战, 明确提出推进个性化学习的目标[1]。2016年,Science杂志报道了美国国家科学基金会未来发展的6大科研前沿,其中包括大数据支持下的学习评价机制创新与基于人-机互动前沿的学习环境创新[2]。我国政府2010年发布的《国家中长期教育改革和发展规划纲要(2010~2020年)》中提出“关注学生不同特点和个性差异, 发展每一个学生的优势潜能”,鼓励个性化发展,为每个学生提供“适合的教育”的观念;《教育信息化十年发展规划(2011~2020 年)》也提出, “努力为每一名学生和学习者提供个性化学习、终身学习的信息化环境和服务; 面向全社会不同群体的学习需求建设便捷灵活和个性化的学习环境”。
随着互联网和信息技术的迅猛发展,涌现和积累了海量的教学资源。海量的教学资源也为个性化学习带来新的机遇和挑战。对于学生而言,面对海量学习资源会遇到选择困难、碎片化学习、学习进度控制难等问题;教师对于学生的学习需求、学习效果难以进行准确评估。知识追踪方法通过分析学习过程和学习行为,能够精准识别学习者的个性特征,动态监控学习过程,实时预测学习趋势,有效评价学习结果,给予学习者个性化的干预和自适应的指导。因此,知识追踪成为个性化学习关键问题。
1.2 国内外研究现状
知识追踪是一种应用于智慧教育领域的技术,通过分析学生的历史答题序列来预测学生在知识点或试题上的掌握程度,从而为学生推送更适合的课程或习题,以实现个性化学习。
目前,国内外的知识追踪研究主要分为两个方向:一是基于模型改进方向,通过对现有知识追踪模型进行改进或提出新的知识追踪方法,以提高预测准确度;二是基于特征添加方向,通过添加学习者的学习特征、题目的语义特征等与学习相关的特征,以更好地模拟真实学习环境。
1.2.1基于模型改进方向的知识追踪研究现状
较早被提出的传统机器学习模型是贝叶斯知识追踪(Bayesian Knowledge Tracing, BKT)[3]。它利用贝叶斯定理来更新学生对知识点掌握程度的概率分布,可以将该模型看作是一个含有隐变量的马尔科夫模型(Hidden Markov Model , HMM)[4]。该方法假设每个学生都有一个掌握知识点的概率分布,当学生回答一道题目后,该概率分布会根据回答结果进行更新。
随着深度学习的广泛应用,循环神经网络模型开始被应用到知识追踪领域。2015年Chris Piech等人[5]提出了基于长短期记忆神经网络模型的深度知识追踪(DKT)模型。DKT模型可以对学生的历史做题序列进行处理和表示,并动态地追踪学生对知识点的掌握程度的变化。与贝叶斯知识追踪模型相比,该方法在多个指标上都有显着改进。
第二章 相关技术和理论
2.1 知识蒸馏
知识蒸馏(Knowledge Distillation[26])作为一种迁移学习方法应运而生,旨在通过教师模型的知识传递,改进学生模型的性能和效率。在知识蒸馏中,通常会有一个教师模型和一个学生模型。教师模型通常是一个较大、复杂的模型,具备较强的泛化能力和表达能力,能够产生更准确的预测结果。学生模型则是一个较小、简化的模型,具备较高的计算效率和推理速度,但在表达能力方面可能有所限制。知识蒸馏的训练过程可以分为两个阶段:预训练阶段和蒸馏阶段。在预训练阶段,教师模型通常使用大规模的训练数据进行训练,以获得较为准确的预测结果和丰富的知识表示。该阶段的目标是让教师模型尽可能地捕捉输入数据的各种特征和规律。在蒸馏阶段,学生模型通过观察教师模型的预测结果来学习知识。具体而言,学生模型的训练目标包括两部分:一是拟合教师模型的预测结果,即使学生模型在相同的输入上产生类似的输出;二是拟合原始训练数据的标签,以确保学生模型能够学习到数据的真实标记。
另外,知识蒸馏还可以应用于跨模态学习和迁移学习。在跨模态学习中,教师模型可以是一个在一个模态(例如图像)上训练得到的模型,而学生模型则可以在另一个模态(例如文本)上进行训练,通过知识蒸馏将图像模态的知识迁移到文本模态中,提升学生模型在文本任务上的性能。在迁移学习中,知识蒸馏可以将一个在源领域上训练得到的教师模型的知识传递给一个在目标领域上进行训练的学生模型,从而加速目标领域模型的收敛并提升性能。
2.2 注意力机制
注意力机制(Attention Mechanism)是一种重要的深度学习技术,在自然语言处理、计算机视觉、推荐系统等领域得到了广泛应用。它的基本思想是根据输入数据的不同部分,赋予它们不同的权重或关注程度。通过引入注意力机制,模型可以有效地捕捉输入数据中的重要信息,从而提高模型的性能和泛化能力。
注意力机制最早是由Bahdanau等人[27]在机器翻译领域中提出的,它是一种对序列信息进行建模的方式,将输入序列中的每个位置映射为一个向量,再通过一个特定的函数计算输入序列中所有位置的权重,最后将所有位置的向量进行加权平均,得到最终的输出向量。
随着注意力机制在深度学习中的成功应用,越来越多的变种被提出。其中,自注意力机制(Self-Attention)是一种应用广泛的变种,它可以在不同任务中进行迁移学习,同时可以处理变长的输入序列。自注意力机制通过对输入序列中每个位置之间的关系进行建模,从而计算每个位置的权重,以此来表达序列中的重要信息。Transformer模型中的自注意力机制就是其中一种典型的应用。
第三章 面向移动终端的智能知识追踪方法 ......................... 21
3.1 引言 ....................................... 21
3.2 问题定义 .................................... 22
第四章 端云协同智能知识追踪方法 .......................... 33
4.1 引言 ................................... 33
4.2 端云协同智能方法 ...................... 34
第五章 总结和展望 ................................. 42
5.1 总结 ....................................... 42
5.2 展望 .................................... 42
第四章 端云协同智能知识追踪方法
4.1 引言
传统中心化的计算模式要求将所有数据(包括课程信息、学习视频、音频、习题 试卷、每个学生的学习笔记、每个学生知识点、学习时长和学习轨迹等等)传输到在云计算中心中,在数据中心对数据进行分析和挖掘。
传统知识追踪方法流程如下:
(1)用智能终端设备(如手机、平板电脑、笔记本电脑等)访问云端教学资源。
(2)用智能终端设备进行学习。
(3)学习过程中,智能终端设备会记录学生的行为数据,如学习时长、观看视频的进度、练习题的答案等,并将这些数据上传到云端。
(4)云端的学习行为数据被存储在相应的数据库中,数据中心对这些数据进行分析和挖掘,以获得学生的学习状态和学习能力信息。
(5)数据中心利用挖掘出的学习状态和学习能力信息,进行个性化学习资源推荐,并把资源推送给学生。
第五章 总结和展望
5.1 总结
本文提出了一种端云协同智能的知识追踪方法,该方法通过结合面向移动终端的知识追踪方法和端云协同智能知识追踪方法两方面的研究,解决了现有知识追踪方法存在的问题,如计算模式和模型性能方面的问题。
具体地,该方法采用了基于Transformer编码器模型和基于TinyBert的知识蒸馏方法,引入了更多的输入特征,如同一问题的尝试次数特征、回答当前问题前花费的时间(Elapsed time)特征和两个连续问题之间的时间间隔(Lag time)特征,以提高模型性能。本文还使用基于TinyBert的知识蒸馏方法对模型进行了压缩,以便在移动设备上高效地运行。
采用端云协同智能知识追踪方法方法,以解决数据隐私、实时性和终端数据异构性等问题。在实验中,证明了端云协同智能的知识追踪方法相比于传统的知识追踪方法,能够在降低数据隐私泄漏风险的前提下,不影响实时性,且模型准确度趋近于集中式训练模型,AUC值仅低于集中式训练模型1.1%。因此,我们认为该方法可以有效地应用于移动端的知识追踪场景。
参考文献(略)