基于大数据的停电感知预测模型分析探讨

发布时间:2022-01-19 22:03:40 论文编辑:vicky

本文是一篇计算机论文,本文针对电力行业实际问题,通过对客户侧电力大数据进行研究,从如何降低停电客户频繁投诉这一痛点出发,以“规划场景→数据建模→客户画像→优化评估”为思路主线,归集 95598 热线、电力微信、社会联动(12398、12315)、营业厅等渠道业务数据,通过对比各项大数据研究算法,得出最适用的数据处理方法,构建停电感知大数据分析模型。


1  绪论


1.1 选题背景

近年来,随着信息技术的不断发展,各行各业信息化不断深入,促使传统行业的服务模式向多元化发展。我国的能源互联网技术与智能电网建设的迅速发展,以云计算和物联网为代表的新一代互联网技术,在电力行业中得到了广泛应用,电力行业数据资源也经过了一段急剧增长期,形成了一定的规模。在日新月异的当下,作为传统行业的老大哥,电力行业对大数据的应用将推动整个电力行业的各项水平的进步,而满足多元用户的用电需求,实现用户科学用电,势必成为电网发展趋势[1]。

在数据价值愈发重要的大形势下,国家电网公司顺应党中央、国务院决策部署的“大数据”发展战略号召,积极开展大数据应用创新实践,充分挖掘数据价值,创新驱动公司发展。2015 年起,国家电网各网省公司分批试点停送电服务响应大数据工作,进行客户停电信息与客户诉求的相关性分析,取得了一定的成效。但受限于大数据分析方法和工具的缺乏,在处理海量数据的精确性、全面性上仍存在一些问题,无法精确、全面挖掘客户停电诉求的特性与各维度的关联性。

随着深化电力体制改革、放开售电侧市场的趋势不断发展,供电服务水平和服务风险防控提出了更高的要求。纵观某省 2015-2018 年客户停送电相关诉求的数据趋势(含 95598、电子渠道、社会联动等渠道数据),客户对频繁停电的投诉、对计划停电安排不合理和停电时间长的意见诉求占比较大,且未见明显改善。从第三方满意度测评看,停电次数多是持续 5 年客户不满意点,且故障抢修及计划停电时间长在供电质量主题中满意度排名最末。在大数据试点基础上,亟需借助大数据平台和数据挖掘分析方法,提前感知停送电服务的风险源,对外加强故障停电服务补救策略和优化计划停电安排,对内提升营配协同管理水平。

本文旨在通过对客户侧电力大数据进行研究,构建停电感知大数据分析模型,建立数据分类及指标阀值预警,有的放矢采取服务补救措施,同时优化配网改造计划,从而有效避免客户投诉,全面提升客户服务水平。


1.2 国内外研究现状

我们都知道,大数据有这么四个特征:量大、多样、低价值密度与速度。相应的,电力行业的大数据也具有这么四个特征:一是数据体量大,主要体现在:电力行业本身具有的调度系统、采集系统、电网自动化系统具有十万级的采集点,至于配网则可达千万级的采集点,从这些采集点可以看出,电力行业的数据体量十分惊人;二是数据类型繁多,主要体现为:采集点采集回来的实时数据、历史数据、文本数据多媒体数据等,可按时间序列、不同维度等进行数据的排列、组合,组成各类结构化、半结构化数据以及非结构化数据,数据类型繁杂;三是价值密度低,主要体现在:所采集回来的数据皆为电网运行、用户用电等的正常数据,单位数据内能够挖掘出的数据价值低,换句话说,很难在海量数据中一眼挖掘出明确对自身有用的数据;四是处理速度要求高,主要体现在:电网运行数据、用户用电数据等都是实时数据,我们需要在很短的时间内做出计算、分析,才足以支撑数据使用者做出正确的决策,例如,在碰到电网运行数据异常时,需要很快的判断出哪一个方面的数据存在问题,该去对哪一个区域的设备进行检修等,才可以保证故障影响不进一步的扩大。下面我们来分别看一下国内外企业客户侧电力大数据的研究情况[2]。

1.2.1 国外供电企业客户侧电力大数据研究情况

说到电力行业的大数据应用,就不得不提洛杉矶电力地图(LA 电力地图)。它是一个集美国加州大学洛杉矶分校(UCLA)、加州可持续发展社区中心、洛杉矶水电及政府规划研究办公室等多方之力共同开发的电力行业大数据应用。它的主要表现形式为一副加州地图,但是在地图上,将洛杉矶各个街区平均收入、建设时间、占地面积等信息与各个街区层级的月均用电量融合在一起,以一个数据视图的形式,让应用使用者准确的了解洛杉矶社会各群体的用电习惯信息,从而为应用使用者(例如城市规划人员、电网监测人员等)提供了直观有效的负荷预测依据。事实上,洛杉矶店里地图还可以帮助使用者更为直观的了解到该如何进行能源投入以及资源的再分配,切实提高能源效率并为制定公共政策提供相关支撑。


2  研究思路与方法


2.1 研究思路

本文以“规划场景→数据建模→客户画像→优化评估”为思路主线,归集 95598 热线、电力微信、社会联动(12398、12315)、营业厅等渠道业务数据,提炼停电客户标签库,建立停送电业务主题分析模型,识别对因停电敏感而存在较高投诉举报等风险的客户群体,实施差异化服务策略,减少客户投诉、提升客户满意度。

客户停电感知预测模型研究,通过分析停电下不同客户的行为特征,反映其对停电的敏感程度差异,用大数据技术量化客户停电敏感。本文将历史数据中表现过停电敏感行为的客户作为正样本,未表现过停电敏感行为的客户作为负样本,提取样本客户的档案信息、台区停电信息、客户停送电诉求信息等特征,采取分类算法,抓取停电敏感客户特征,运用大数据技术建立预测模型,预测未来停电时客户表现出停电敏感行为的概率。

通过建立客户停电感知预测模型,预测电力客户对待停电现象的不同敏感程度,找出敏感客户,尝试从区域分布、诉求特性、停电特性、用电特性等维度刻画敏感客户的特性。通过应用客户停电感知预测模型,实现“频繁停电投诉风险识别”、“计划停电安排优化”和“故障停电服务补救策略”三大热点场景分析。

计算机论文怎么写


2.2 研究方法

本项目先后使用信息增益法、主成分分析、卡方检验、Apriori 算法和随机森林等 5 种统计分析方法进行建模模拟,进行效果比对。

2.2.1 信息增益法

信息增益是一种有效的特征选择方法[15],一个特征的增益表示有无这个特征对分类问题的影响的大小,即该特征存在时,能够对分类系统带来信息量的多少。在信息增益中,确认是否重要的标准主要由这个特征给分类系统带来信息量的值来决定的,也就是说,某个特征能给分类系统带来的信息量越多,则该特征越为重要。

2.2.2 主成分分析

主成分分析(Principal Component Analysis,PCA)的核心是一种数学变换,它的主要思想是把特定的一组值通过数学方法(即线性变化)转成另一组值,新产生的这组值根据一定的数学方式进行排列,例如,按照方差递减的顺序进行排列。需要注意的是,在主要成分分析中,需要保持这组值的总方差不变,这样才可以保证第一个值的方差最大,而这一个值,我们定义为第一主成分,相应的,第二大的方差即为第二个值,并且和第一个值不相关,我们定义它为第二主成分。按照这种方式递推,i 个值就相应的有 i 个主成分[17]。

2.2.3 Apriori 算法

Apriori 算法是一种最著名的关于布尔关联规则挖掘的频繁项集的算法,它的核心是基于两阶段频集思想的递归算法[18]。从分类上来说,这种关联规则是一种单维的、单层的布尔关联规则。值得注意的是,这里有一个频集(频繁项集)的概念,即所有支持度都比最小支持度大的项集。

Apriori 算法的主要思想是:首先找出所有的频繁项集,这些频繁项集的频度(也就是这些频繁项集出现的频率)最少需要和事先预想的最小度一致。然后需要进行一个强关联,这个强关联的规则的必要条件是它的支持度和可靠性必须最低。最后使用上一步中找到的频繁项集生成所需的规则。生成这些规则后,仅保留那些大于设定给出的最低可信度的值。


3  停电感知预测模型分析研究 ............................. 10

3.1 模型研究工具及环境 ..................................... 10

3.1.1 HDFS ................................. 10

3.1.2 Spark 并行框架 .................................. 11

4  停电感知预测模型应用 ......................................... 34

4.1  模型预测 .................................... 34

4.2  停电敏感客户特征画像 ..................................... 34

5  结论 ....................................... 39


4  停电感知预测模型应用


4.1  模型预测

选取一拥有百万级用电客户的某市供电企业进行试点,采用传统统计方法预测停电敏感客户的准确率要低于 10%。而应用停电感知预测模型,取 2017 年 6 月至 2018 年 9月的历史数据(剔除极端灾害天气月份相关数据)进行模拟,从模拟实验结果来看:整体查准率上扬,而 2018 年模型查准率超过了 98%,查全率均也超过 18%。详细如表 4-1 所示。

计算机论文参考

通过分析停电敏感客户的感知特征,我们可以对电网企业的停送电服务提前告知提供有力支撑,让主、配网停电计划愈发合理。同时,我们可以对抢修及停电安抚的策略进行优化,从而达到减少客户不良的停电感知的效果。


5  结论

本文针对电力行业实际问题,通过对客户侧电力大数据进行研究,从如何降低停电客户频繁投诉这一痛点出发,以“规划场景→数据建模→客户画像→优化评估”为思路主线,归集 95598 热线、电力微信、社会联动(12398、12315)、营业厅等渠道业务数据,通过对比各项大数据研究算法,得出最适用的数据处理方法,构建停电感知大数据分析模型,建立数据分类及指标阀值预警,开展客户停送电大数据场景应用分析,更加快速精准地分析响应客户诉求,有的放矢采取补救措施,同时针对性优化配网改造计划,从而有效降低客户停电投诉风险,全面提升客户服务质量。

后续可考虑从以下方面取得进一步提升空间:

一是继续完善客户停电感知预测模型。后续将进一步提高模型宽表的数据质量,优化模型特征参数,提升模型预测准确度;结合客户信用、客户价值、回访满意度、气象条件等标签,进一步完善客户标签库体系。

二是建设接入大数据分析平台。部署大数据的软硬件环境,汇集全渠道停送电数据,应用停电感知预测模型,在营销系统建立客户停电感知标签体系;在营销系统新增停电敏感风险看板,强化风险管控可视化程度。

三是加强研究成果应用实践。细化基于客户停电预测模型的应用场景,根据电网企业现有构架,明确应用结果的实施责任部门,根据建立的营配协同信息传递机制,评估应用实施效果,切实提升电网企业客户服务管理水平。

诚然,电力系统是一个复杂的系统,会对电力企业服务质量造成影响的因素还有很多,例如上级电源容量、基础设施建设、运维承载能力、政策指导意见、用电性质更改、企业经营变动等等。受写作时间及实践条件限制,本文所探讨的仅涉及客户停电感知预测模型的建立及验证这一小方面,如果下一步条件允许可以得到公司立项支持,结合电网实时运行数据及地理信息系统,借助大数据平台对其他因素加以综合考虑分析,将研判结果及时反馈给客服系统,再有针对性地传达给客户,应能进一步提升客户的服务体验,更好的履行供电企业的社会责任。

参考文献(略)

提交代写需求

如果您有论文代写需求,可以通过下面的方式联系我们。