代写计算机论文案例:面向站点的共享单车短时需求预测探讨

发布时间:2023-12-22 23:54:12 论文编辑:vicky

本文是一篇计算机论文,本文以区域共享单车短时需求量准确预测为目标,以预测算法-LightGBM算法为基础,研究有效且可行的区域共享单车短时需求量预测方法。

第一章绪论

1.1研究背景及意义

中国共享单车的发展历程可以大致划分为三个时期。2007年—2010年为发展第一时期,单车模式与国外发展的公共自行车模式一致,其运行主要由政府主导并分城市管理。这一时期的共享单车多为有桩单车,设计简单且无定位系统,因此很容易失窃和损坏。2010年-2014年为第二时期,有桩单车依旧占据为主要市场,但企业经营开始出现。2014年至今为第三时期,由于物联网与移动互联网技术的加持,无桩单车彻底取代了有桩单车。因为在共享单车上配置了移动互联锁、定位装置等功能让新一代共享单车在使用、存放和管理上,性能有了诸多显著的提升,极大的改善了用户的使用体验,满足了人们寻车、开锁、还车等简单快捷的要求,因此深受大众欢迎[1]。

截至2016年底,来自比达咨询的《2016中国共享单车市场研究报告》表明,国内使用共享单车的用户整体已高达1886万人,而在2017年,这个数字还将持续快速的增加,在年末估计达到5000万人。2017年8月,ofo小黄车企业在全世界150座城市内对共享单车进行了部署,为数十亿使用者,提供了累计20亿次的交通服务;同年摩拜企业也在国内外不同的城市为上亿用户提供共享单车服务,投放了600多万的共享单车,平均每天为用户提供2500万次骑行服务[2]。

计算机论文怎么写

1.2国内外相关研究

1.2.1共享单车需求量预测

在共享单车需求量预测过程中,常用的方法有两种:一种是以空间特征因素分析为基础,另一种是以时间特征因素为基础。根据共享单车借出和归还影响特征因素进行空间特征因素分析[5],并以此为基础建立模型,对共享单车需求量进行预测。Faghih-Imani等[6]在分析了气象资料、时间、单车基础设施状况、土地利用和周围环境等特征对站点共享单车进、出流量的影响后,构建了一个多层次回归模型,用于蒙特利尔地区公交单车进、出流量的预测。Noland等[7]对纽约市公共自行车的基础设施、出行流量、用地状况等多种因素对自行车出行需求量的影响进行了分析,并提出了贝叶斯负二进制条件下的自动下降模型,用于对不同地区的自行车需求量进行预测。Jian等[8]采用马尔可夫(Markov)模型,设计了一种新的子类别梯度启发式方法来求解各个站点的进出速率,从而在此基础上对各个站点的自行车总数进行实时的预测。现有研究主要关注于大规模的市区公共自行车出行,缺乏充分利用共享单车出行数据中存在的空间和时间关联信息,从而提升出行数据的预测精度。因此,吴瑶等[9]在西安市以中心城市作为研究对象,利用多变量Logit(Multiple Logit)理论,针对城市中共享单车的借还与停放车辆的需求,利用单车周转速度与泊位轮换速度,对站点的单车与停车桩进行了初步的估算,并提出了系统完整的单车总量估算方法。基于自行车出租数据,温惠英等[10]运用迭代的回归模型,并将土地利用情况、人口和建筑面积等要素纳入到模型中,实现了对单车市场的准确预测,提高了模型的精准度。

根据时间特征对共享单车市场进行动态预测分析,主要利用历史数据规律建立模型。时间特征预测法分为两种类型:一种是传统的,一种是深度学习的。其中,传统时间特征预测模型过于简单,但难以解决复杂的问题。因此,近年来基于深度神经网络的交通数据处理方法已被越来越多地用于交通流量预测和出行需求预测。与传统的时序分析方法不同的是深度学习模型通过神经网络来描绘数据之间的复杂度,在处理数据模型方面更具优势。我国学者在Eman神经网络的理论框架下,解小平等[11]对其进行优化,构建一个基于不同站点的公共自行车出行的预测模型,并进行仿真实验,验证了其可行性和有效性。

第二章相关理论与技术

2.1集成学习相关理论

在对共享单车短时需求量进行预测时,常用的是RF,GBDT,XGBoost等机器学习中的回归方法。以上是具有代表性的集成学习算法,已被国内外学者用于各种不同的工作,所以这个部分将介绍集成学习部分相关的理论。

2.1.1 DT基本原理

DT(Decision Tree)是LightGBM的基本学习方法。DT在进行回归分析时,主要通过对一系列特征的所属区间进行连续判断,不断将样本空间划分为两个子空间,进而构建一棵具有决策属性的二叉树,最终实现是通过利用任意样本的特征来遍历二叉树就能得到对应预测值的目的。DT解决回归问题的关键环节是计算按照不同特征和阈值来划分样本空间的误差,最终搜索到误差最小的分割点。

2.1.2 GBDT算法基本原理

梯度提升决策树(Gradient Boosting Decision Tree,GBDT)是一种常用的集成学习算法,它是一种具有高效率和高精度等优点的算法。该算法将多个决策树组合起来进行预测,其核心思想是通过迭代的方式不断拟合数据集的残差,每次迭代都训练一个新的决策树来对残差进行拟合,最终得到多个弱分类器的加权组合作为最后的预测结果。

.2贝叶斯优化算法

贝叶斯优化(Bayesian Optimization,BO)是它通过构建一个代理模型(surrogatemodel)来逼近真实目标函数,然后利用该代理模型进行采样和迭代优化。核心思想是通过构建先验分布和后验分布的方式,在每次迭代中选择具有最大可能性来优化目标函数的输入值。先验分布可是对输入空间的先验知识,而后验分布则是利用新采样数据更新后得到的分布。在每次迭代中,贝叶斯优化会根据当前对目标函数的估计,计算出哪些区域可能包含全局最优解,然后在这些区域进行采样。这个过程会持续迭代,直到找到一个满意的优化结果或者达到预定义的停止条件为止。

高斯过程(Gaussian Process,GP)是贝叶斯优化中常用的代理模型之一。它是一种基于概率分布的非参数模型,可以对任意维度的输入空间上的函数进行建模。高斯过程假设目标函数在任意一组输入值上都服从一个高斯分布,也就是正态分布。这个分布由两个参数描述:均值和方差。高斯过程的核函数用来描述这个分布的协方差结构,即不同输入值之间的相关性。

在执行贝叶斯优化时,高斯过程会根据历史采样点构建出一个代理模型,并据此计算出下一个采样点的期望值和方差。期望值较大的点被认为是更有可能接近目标函数全局最大值的点,因此会被选为下一个采样点。同时,方差较大的点则代表着当前代理模型对该点的预测不确定性较大,因此也具有一定的探索性。通过反复迭代这个过程,高斯过程可以逐步精确地逼近真实的目标函数,从而实现优化的目的。

第三章 基于贝叶斯优化 LightGBM 的共享单车预测模型 .............. 17

3.1 共享单车出行数据预处理 .................................. 17

3.1.1 数据来源 ....................................... 17

3.1.2 数据转换与分析 ...................................... 18

第四章 共享单车管理系统的设计与实现 .......................... 31

4.1 系统应用领域介绍 ......................... 31

4.2 应用可行性分析 ............................... 31

第五章 总结与展望 ................................... 41

5.1 总结 ................................................. 41

5.2 展望 ............................................ 42

第四章共享单车管理系统的设计与实现

4.1系统应用领域介绍

共享单车管理系统是对区域内面向站点的的共享单车进行管理,因为每个站点所位于的城市功能分区是不一样的且自行车的借还规则的也有自己的特征,这就要求我们对它进行更多的探索。

共享单车管理系统主要由系统管理、日志管理、数据监控、需求量预测和单车调度这五个部分组成。系统管理包括了对用户的管理、共享单车数量的管理、用户租借管理等。当前,我国城市共享单车市场中存在大量的共享单车,而共享单车的需求量极易受时间与空间的制约,并呈现出强烈的空间与空间关联与动态关联。因此,共享单车管理系统可以在各个区域的车站,对共享单车需求量进行精确、有效的短时预测,这样不仅可以对单车管理系统进行优化,还可以提高其对单车的科学调配能力。同时还能够缓解城市交通,改善城市的生态环境,对各个区域内的公共自行车进行更多的投放,进而能够更好的提升共享单车的利用效果,还可以极大的改善公共自行车的市场运营状况,对公共自行车产业的可持续发展有着重要的影响。

计算机论文参考

第五章总结与展望

5.1总结

在现代社会,共享单车是一种既环保又方便停靠还能锻炼身体的交通方式。由于人们的出行通常会受外界环境等因素的干扰,因此会经常出现站点内的共享单车过多而造成堆积或者过少不能及时满足人们需求的现象。因此,共享单车企业必须要对站点内共享单车数量进行精准的预测,从而对站点内共享单车进行合理分配。而目前针对时空特征对共享单车需求量影响的研究较少,而这会大大的影响共享单车需求量预测的准确性。因此本文从时空特征出发,使用LightBGM算法的回归模型对共享单车短时需求量进行实时预测。

首先对数据集中的数据进行预处理,其次分析数据集中的每个特征因素对共享单车需求量的影响,并根据特征之间的相关性提取出主要的影响特征因素。然后根据这些特征因素研究回归模型的算法,并最终选择LightGBM回归算法对共享单车需求量进行预测,最后使用贝叶斯优化算法对lightGBM算法的超参数进行调优组合,使得本文的模型性能达到最优。研究工作主要如下:

(1)通过处理骑行记录,挖掘站点用车需求模式,研究与之相关的时序和空间特征因素。其次,采用斯皮尔曼(spearman)相关系数对不同特征因素之间关联程度进行计算和分析,然后提取对共享单车短时需求量影响显著的特征因素。

(2)研究集成学习的系列回归预测模型RF、GBDT和XGBoost,关注其改进过程。在此基础上,以预测算法-LightGBM为基础,针对共享单车时序与空间特征对区域单车分布的影响,通过使用贝叶斯算法对LightGBM超参数进行优化,构建基于贝叶斯优化的LightGBM共享单车短时需求量预测模型。最后,通过与随机森林、XGBoost机器学习模型进行对比分析,利用均方根误差(RMSE)、绝对误差的平均值(MAE)和平方相关系数(R2)对所构建预测模型的性能进行评估。

(3)将本文构建的基于贝叶斯优化的LightGBM共享单车短时需求量预测算法与具体实践相结合,设计并实现了共享单车管理系统的实际应用。

参考文献(略)