基于深度学习的货架状态画像探讨与实现

发布时间:2022-02-07 11:15:15 论文编辑:vicky

本文是一篇计算机论文,本文使用五层 BP 神经网络进行预测。本文将两模型结合,并通过超市历史消费记录分析出货架状态,最后使用一个易操作的页面将结果形象地展示出来。为超市采购人员以及管理人员提供可靠参考,促进超市健康良好发展。


1 绪论


1.1 研究背景及意义

新零售时代里的智能超市在未来会像“网购”一样风靡开来。落户于杭州的第一家智能超市通过 RFID[1]电子标签、各类传感器和物联网支付技术来实现快速识别商品信息与自动扣款等行为,大大提升了顾客购物[2]的体验感。但是方便客户的同时,利用新型技术来管理超市已然是当前的研究重点。现在的“无人超市”基本规模都很小,在中型或者大型超市的智能化主要体现在结账买单,超市缺少智能化的管理。

现在仍然可以看到很多营业员在统计货架商品是否需要补货,查询系统才可知道指定商品的库存量,还有其它基本工作都是需要人工来完成,极大地耗费财力以及人力,在统计过程中还费时,且易出错。但如果管理员想实现超市利润最大化,就需要对货架状态[3]以及货架商品的销售情况等消息,只有这样才可以针对性地做出相应的措施来更好地管理所在的超市。那就需要使用新技术替代昂贵的人力,不仅降低了经营技术,还便于及时调整运营计划。

大家选择在超市购物,主要是因为超市商品种类很多,能够满足大家日常生活。一个货架上可以摆放多个种类的商品,且商品之间的样子差异巨大,没有规律可言。超市消费者有时候会遮挡商品且有可能受灯光强度的影响而导致拍摄的照片不清晰。基于以上多个原因,用传统的目标检测和图形分割技术很难检测到,效果并不会如意。除了外界环境以及人的原因影响测试结果,商品本身就存在缺陷,比如同样是一个巧克力,有可能品牌一样,但是由于克数不同导致其除了大小不一样,其余的多一样。也有可能出现同样一个颜色、尺寸但生产厂商不一样的现象。细微的差别有时候连人都分不清楚。如果采用常用的方式来提取商品特征,同样会满足不了人们的需求,识别率太低。

随着计算机相关技术的持续迭代,计算机网络中生成的大数据,以及神经网络的不断优化,深度学习获得了蓬勃的发展。从诞生以来,深度学习技术经过长时间的改进。现在很多领域都用到了深度学习技术,比如行人检测[4]、无人驾驶[5]、医学病情诊断[6]、人脸识别技术[7]、交通标志识别[8]、车牌号识别[9]等方面。要想了解货架的状态首先得清楚该货架上有哪些商品,识别商品自然离不开目标检测技术。当前使用最多的是基于深度学习的算法来实现物体的定位与分类。超市可以利用摄像头采集真实场景下的货架照片,再利用图像处理技术及其它技术,可以更为准确地确定货架商品种类。


1.2 国内外研究现状

与目标分类不同,目标检测包含两部分,首先需要判断是否包含目标物体,继而需要找出感兴趣的位置并用外接矩形框出。本小节将从两个大方面介绍目标检测。 1.2.1 传统的目标检测研究现状

(1)传统目标识别流程

识别货架上的商品类型的本质就是对货架上的商品进行物体检测。基于传统的目标识别流程如图 1-1 所示。

计算机论文怎么写

1)区域选择

需要在给定的图片中找到有可能存在的目标候选区域。为防止遗漏,一般会采用穷举的方式进行选择。穷举思想通常通过设置不同尺寸和不同比例的窗口在原始图像上以滑动窗口的方式来遍历,尽可能得遍历到图片的每个地方。显然在实际操作中,会出现窗口冗余并且时间复杂度也会跟高,速度方面就会差强人意。

2)特征提取

需要对第一步产生的区域进行特征的提取。但在真实场景下,目标会受光照、背景及本身等多个因素影响特征提取。该步所提出的特征将直接影响到后面分类是准确性。因此需要选择相对特征清洗的图片进行特征提取。


2 相关理论与算法


2.1 基于深度学习的目标检测算法

2.1.1 基于深度学习的目标检测算法

如图 2-1 所示,基于深度学习的目标检测[26]的分类实质是根据备选框的生成是否是一体化实现。Two Stage Framework 是有级联网络构成,主要为 R-CNN 系列网络。One Stage Pipeline 代表有 YOLO 系列和 SSD。

(1)双阶段的目标检测算法

假设输入一张图像,该图像中含有目标,但是机器不知道在哪里,他就要将目标有可能的出现的区域都找到,该过程称找出候选区域。找候选区域的过程中用到的算法一般是选择性搜索,另外很多人采用边缘检测的方法。两算法差异不大,随个人习惯使用。基于双阶段目标检测技术演进大体经过了 R-CNN 到 SPP-Net 再到 Fast R-CNN,在 Fast R-CNN的基础上进一步优化变为 Faster R-CNN。在 2017 年底,提出的新的卷积网络即 Mask R-CNN。该算法是 faster R-CNN 扩展,因此 Mask R-CNN 的算法原理与 Faster R-CNN 的算法原理有很大的相似性。

1)R-CNN

R-CNN[27]模型的提出打开了目标检测的新世界,使得 R-CNN 系列在之后的几年飞速发展。R-CNN 的工作原理是:首先通过选择性搜索方法提取特征图上近两千个候选框,依次将这些大小不同、比例不同的候选框进行预处理,产生统一大小的候选框,然后将这些候选框送入卷积神经网络进行目标物体的特征提取,最后 SVM 分类器对这些特征区域进行具体的分类和边框校准,来完成目标的分类与定位工作。

R-CNN 模型虽然说比传统的方法对于目标检测方面取得了很大的进步,但依然存在很多不足之处。如在用选择性搜索方法生成候选框这个过程是比较慢的,时间复杂度高。将不同的候选框进行裁剪时有可能会使信息丢失,不易之后的特征提取。


2.2 货架商品销售预测方法及选择

2.2.1 常见的预测方法

所谓的销售预测,就是根据以往的商品销售记录数据,分析多个维度的因素,准确地地预计和推测出未来一周、一月或者一年的销售情况。销售预测一直是研究热点,准确的销售预测,不仅可以给企业或者管理者提供管理的科学依据,便于及早地制定措施,避免商品堆积销售不出去导致过期造成巨大损失,还可以进行合理的人员工作安排,减少人力统计等费时费力效率低的问题出现并能大幅度提升企业的利润。常见的预测方法[33]可以大致分为两大类,如图 2-4 所示。

图 2-4 中所说的定性分析法往往在以往的销售数据的技术上,行业专家结合自身所学的知识,可观上分析出的一种预测结果,这结果一般是模糊的,顶多有个大体走向。定性分析法会因不同的专家经验对同一个历史销售记录分析出迥然不同的预测结果。因为结果受直觉的影响颇大,而每个专家的社会经验和直觉都不经相同。因此,一般不适用于连锁的中、大型超市作为商品销售预测方法。

相对于定性分析而言,定量分析的预测结果更具有科学性,其原因主要是因为通过分析大量的历史销售数据,用数学的方式计算而出来的,结果可以具体到销售数量。但结果的准确度受历史数据和不同的预测方法影响。该类方法适用范围广,可以用到小、中、大型超市,为超市经营者做出行之有效的营销策略提供科学依据。

两种类型的预测方法各有优缺点,不同场景下会采用不同的方法,如果历史数据少,而负责研究预测量的人不太懂数学理论知识的情况下,一般会采取定性分析法进行销量预测。而如果研究者数学理论知识广而且精通,在分析历史数据后,采用定量分析法进行销量预测。


3  货架商品目标检测算法改进及实现 .......................................... 15

3.1  目标检测 Mask R-CNN 算法原理 ..................................... 15

3.1.1 Mask R-CNN 算法网络结构 ...................................... 15

3.1.2  主干网络 ................................................ 16

4  货架商品状态分析与销售预测研究 ........................... 29

4.1  货架商品状态分析 ....................................... 29

4.1.1  货架商品状态字段说明 ................................ 29

4.1.2  货架商品状态数据获取 ........................................... 29

5  货架状态画像系统设计与实现 ................................................. 39

5.1  系统框架设计 ........................................... 39

5.2  功能模块设计 .......................................... 40


5 货架状态画像系统设计与实现


5.1 系统框架设计

图 5-1 从算法设计层和应用层体现了货架状态画像的架构图。在算法设计层中的货架商品检测模型中,选择了算法改进后的 Mask R-CNN 算法,实现过程可以简化为先采集超市货架图片,然后对哪些商品特征不明显的图片进行预处理,然后对模型进行构建与调优,最后实现货架商品的检测和分类以及商品数量统计等功能。在另一个销售预测模型中采用的是改进后的 BP 神经网络,该部分也介绍了实现销售预测的工程,需要先网络初始化,然后根绝隐藏层和输出层的输出结果,计算出误差,然后反向传播过程中不断更新权值和阈值,直到误差在预设范围内,完成销售预测。

计算机论文参考

最后应用层输入含有商品的货架图片,后台通过目标检测和货架商品销售预测获得货架商品的当前及未来状态、货架当前状态。其中货架目前状态包括了货架上需补货商品信息、货架上滞销商品信息、畅销商品信息。货架商品当前状态指的是商品的月销售量、标价、是否需要补货等信息。货架商品未来状态指的是该商品未来一周的销售趋势。


6 总结与展望


6.1 工作总结

随着大数据时代的来临,海量商业数据越来越有价值。而传统机器学习算法和深度学习技术的发展为海量商业数据辅助企业决策提供了技术支持。本文主要是将货架状态画像直观呈现。货架状态不仅仅指的是货架上是否需要补货,以及有哪些商品。还包含了各商品所在位置,以及各商品的基本信息以及商品未来的销售趋势。因此本文采集了超市真实场景货架照片并进行清洗及预处理,由于 Mask R-CNN 算法在小物体识别方面很有优势。分析了该算法的结构与工作原理,提出了改进算法并搭建了目标检测模型。为了能准确预测出商品的销售趋势,本文使用五层 BP 神经网络进行预测。本文将两模型结合,并通过超市历史消费记录分析出货架状态,最后使用一个易操作的页面将结果形象地展示出来。为超市采购人员以及管理人员提供可靠参考,促进超市健康良好发展。本文主要包括以下工作:

(1)文献调研及货架状态画像研究

首先,本文详细介绍了货架状态画像的背景与意义,调研了国内外相关研究现状。之后详细介绍了目标检测算法以及销量预测算法,并对本文所用算法相关理论基础进行了阐述,其中包括深度学习目标检测算法的发展以及常见销量预测算法,以及介绍了本文实验采用的深度学习框架。

(2)数据采集、清洗、预处理

在建立目标检测模型以及销量预测模型之前,首先采集了真实场景下的货架图片,以及超市历时销量数据,并进行数据清洗,根据需求对数据采用不同的方法进行预处理,为模型的建立和验证准备了高质量的数据。

(3)模型建立与实现

在上述工作的基础上,针对采集到的数据的不同特征,分别建立了目标检测模型与销售预测模型。本文采用了深度学习框架 PyTorch,利用真实数据对模型进行训练、测试和验证。本文通过分析 Faster R-CNN、原 Mask R-CNN 以及改进后的 Mask R-CNN 算法对货架商品识别与定位的速度和准确率,验证了提出的改进方法对提升商品目标检测速度的可行性。本文利用改进后的 BP 神经网络构建预测模型来预测货架商品未来七天的销售情况,将预测结果与真实数据进行误差分析,根据预测精度指标反映了销售预测模型是能较好地预测出商品未来的销售情况。

参考文献(略)

提交代写需求

如果您有论文代写需求,可以通过下面的方式联系我们。