卷积神经网络的关键技术范文

时间:2024-03-28 18:12:38

导语:如何才能写好一篇卷积神经网络的关键技术,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

卷积神经网络的关键技术

篇1

关键词:车牌;识别;专利;分析

引言

车牌识别技术[1-2]是指自动提取受监控区域车辆的车牌信息并进行处理的技术,其通过运用图像处理、计算机视觉、模式识别等技术,对摄像头捕获的车辆照片或视频进行分析,进而自动识别车辆的车牌号码。车牌识别技术可应用于停车场自动收费管理、道路监控等领域,在城市交通管理中发挥了重要作用。

1 中国专利申请情况分析

以CNABS专利数据库中的检索结果为分析样本,介绍车牌识别技术的中国专利申请量趋势以及重要申请人的状况。

1.1 第一阶段(2005年及之前)

在这阶段,申请量极少且申请人也极少,且针对的环境较为简单,处于技术的萌芽阶段,其中,专利CN1529276,通过车牌定位、字符分割和分类识别完成机动车牌号自动识别,其实现过程较为简单,具体细节描述较少。

1.2 第二阶段(2006年-2010年)

在这阶段的申请量比上一阶段有所增加,而且申请人数量相较之前也有增长,其中来自高校的申请量明显增加,反映出了高校研究者开始更加注重对研究成果的保护,这一阶段的专利所针对的环境场景更为复杂,识别准确率得到提高,对车牌定位、字符分割、字符识别等关键技术的研究更为深入。

1.3 第三阶段(2011年及以后)

在2011年之后车牌识别技术的专利申请量呈现快速增长,这一阶段车牌识别技术得到了更进一步的丰富,涉及的关键技术的解决途径也呈现出多样性,检测效率和精度也得到进一步提高,其中,专利CN104035954A,涉及一种基于Hadoop的套牌车识别方法,将云计算应用于车牌识别,使得与传统环境下不经过优化的方法相比具有^高的运行效率和加速比,可以有效地识别套牌车。

图2示出了中国重要申请人分布情况,申请量分布前十的申请人包括:电子科技大学、深圳市捷顺科技实业股份有限公司(捷顺科技)、浙江宇视科技有限公司(宇视科技)、信帧电子技术(北京)有限公司(信帧电子)、中国科学院自动化研究所(自动化研究所)、安徽清新互联信息科技有限公司(清新互联)、青岛海信网络科技股份有限公司(海信网络)、浙江工业大学、四川川大智胜软件股份有限公司(川大智胜)、上海高德威智能交通系统有限公司(高德威智能交通),从图2中可以看出,不同申请人的申请量差距不是很大,几乎保持在一个比较持平的状态。

电子科技大学在车牌识别技术的专利申请中,CN 101064011A提出一种基于小波变换的复杂背景中的车牌提取方法,可大大提高对晴天、雨天、雾天、白天及夜晚等环境的通用性和适用性,实现车牌的精确定位并提高车牌提取的准确度;CN 103455815A提出一种复杂场景下的自适应车牌字符分割方法,能快速、准确地搜索2、3字符间隔位置,实现自适应调整分割参数,使车牌字符分割稳定可靠,在复杂的环境中鲁棒性强,防止噪声干扰;CN 105005757A提出一种基于Grassmann流行的车牌字符识别方法,最大限度地利用了已获得的车牌字符信息以及同类字符之间的相互关系,对于车牌字符的成像质量要求更低,应用于复杂的环境中具有很好的鲁棒性和准确性。

2 关键技术分析

一个完整的车牌定位与识别系统,其前端包括图像采集和传输系统,末端还需要与数据库相连接。从定位到识别的核心算法上,主要包括图像预处理、车牌定位、字符分割和字符识别四大部分[3]。

图像预处理,是指通过对摄像头捕获的彩色图像进行预处理。常用的预处理方法包括图像灰度化、图像二值化、边缘检测等。

车牌定位,是指在经预处理后的车辆图像中,定位出车辆的车牌所在位置。常用的车牌定位方法包括基于纹理分析的方法、基于数学形态学的方法、基于边缘检测的方法、基于小波变换的方法和基于神经网络的方法等。CN 104298976A提出一种基于卷积神经网络的车牌检测方法,利用卷积神经网络完整车牌识别模型对车牌粗选区域进行筛选,获取车牌最终候选区域。

字符分割,是指将定位出的车牌区域图像分割成单个的字符图像。常用的字符分割方法包括基于轮廓的方法、基于投影的方法、基于模板匹配的方法和基于连通区域的方法等。CN 104408454A提出一种基于弹性模板匹配算法的车牌字符分割方法,基于弹性模板,通过插空进行模板序列形状的弹性调整,将车牌图片与理想模板进行匹配,获得全局最优匹配,确定字符位置,将分割算法作用于投影序列,实现对车牌字符的分割。

字符识别,是指对字符分割之后的单个字符图像进行识别,进而得到车辆的车牌号码。常用的车牌字符识别方法包括基于字符结构特征的识别方法、基于模板匹配的识别方法、基于神经网络的识别方法、基于模糊理论的模式识别方法和基于支持向量机分类识别方法等。CN 105975968A提出一种基于Caffe框架的深度学习车牌字符识别方法,以基于Caffe架构的深度学习为基础,解决了现有的车牌字符识别方法中对倾斜、断裂、相近字符识别精度不高的问题,大大提高了对于车牌字符的识别精度。

3 结束语

本文以车牌识别相关专利文献为样本,分析统计了该技术中国专利申请现状,并对车牌识别技术的关键技术进行简单分析。在经历了从无到有、从萌芽到飞速发展的阶段之后,车牌识别技术慢慢走向成熟,越来越多的企业和高校在车牌识别的研究上投入了大量的精力,也获得了丰硕的研究成果。

参考文献

[1]尹旭.汽车牌照定位研究综述[J].电脑知识与技术,2010,6(14):3729-3730.

篇2

1.人脸识别管理的优劣势分析

人脸识别技术是通过生物特征进行识别的技术,通过识别每个人的脸部特征,将采集的图像与系统的图像库信息进行比对,实现识别的目的。其有3个优点,一是非接触性,被考勤人员不需要和相关设备直接接触,而指纹采集和一卡通刷卡则必须接触设备;二是非强制性,只要出现在人脸采集的特定区域时,设备便会主动采集信息;三是并发性,若在特定区域同时出现多人时,可以将全部人脸信息记录。人脸识别技术也有缺点,一是容易受到光线环境的影响,若光线过强或严重不足都会影响人脸信息的采集;二是易受到头发、饰物遮挡的影响,有可能造成采集人像的不完整,导致比对信息失败。这些确定会在一定程度上影响数据采集的准确性,会造成比对结果的判断不准确,但随着人脸识别技术算法的不断更新,精确度也会得以提升。

2.人脸识别的关键技术

1)人脸关键点检测

人脸关键点检测是在人脸检测的基础上,自动确定人脸各关键点的位置,如眼角、瞳孔、鼻尖、嘴角等。不能忽视了初始状态对关键点检测的影响。采用基于深度初始化网络的人脸关键点检测算法,能够有效克服初始位置、人脸姿态、表情等因素对关键点检测精度的影响,从而得到人脸各关键点的准确位置。

2)人脸纹理正规化

将不同光照、姿态或表情的人脸,还原至良好光照、正面和无表情的人脸,减小待匹配人脸图片与信息库中人脸图片的差异,从而降低特征提取和识别的难度。在光照严重不足或太过强烈、角度过大、表情夸张的情况下,如果强行改变光照强度、旋转至正面人脸、还原至正常表情,必然会引入大量“非自然”信息,使得正规化的人脸产生畸变、扭曲和纹理缺失。这样不仅不会对人脸识别产生帮助,反而会降低其性能。可以借鉴人脸合成和生成对抗网络的方法,通过初始数据库的搭建、纹理正规化网络的构建以及网络的融合训练,实现一个端到端的、由数据驱动的纹理正规化网络和特征识别网络。它能够在提取深度特征的过程中,自适应地根据人脸识别的任务对人脸的纹理进行光照、姿态和表情的正规化,从而达到提高人脸识别性能的目的。

3)人脸特征提取

基于深层卷积神经网络,通过融合人脸多尺度特征信息,获取高层语义特征表达,提升人脸特征的区分性。促使同一个人的人脸特征表达具有更高的相似性,不同人脸的特征表达相似度更低。

4)人脸特征比对

针对人脸识别中经常遇见的跨场景人脸识别问题,如待验证照片与现场照片非同源、年龄跨度大、分辨率和角度差异明显等问题,采取自适应学习方法。通过算法缩小不同场景图像之间的数据分布差异,将不同场景的人脸图像映射到同一个具有更好表达能力的特征空间进行比较,从而保证同一个人的人脸特征表达具有更高的相似性分数,不同人脸的特征相似性分数更低。

3.人脸识别管理系统的功能模块

1)基础数据的获取

初始化数据是整个系统运行的基础,可以将学生的基本信息整体导入系统,特别是身份证的完整信息,包含证件照。给学生管理人员开放权限,可供查询、修改、删除数据等维护功能。基本信息中结构和属性字段比较简单的部分直接导入,对于哪个时间段是正常签到、迟到、早退、旷课、晚归等,需要进行单独标明。同时也需要将人脸识别设备和教室信息进行绑定,条件允许的情况下,各教室配备一台识别设备。若成本过高,则可考虑每层楼配备一台设备,将每层楼的教室信息与设备绑定。

2)教务系统的接入

考勤数据是基于每学期的课程安排和作息时间安排,在此之上增加学生的出勤状态。通过教务系统的接入,直接获取班级的排课情况,并将作息时间安排一并导入,则可通过数据的对接,实现考勤情况的记录。

3)识别数据日志

数据日志用于记录学生到教师或者宿舍楼的时间点,与基础数据中的导入的身份证照片、学号、班级等信息建立对应关系。因此,当人脸识别设备识别到信息是,便会登记采集数据的时间,通过与基础数据库的信息之间的绑定关系,记录下采集数据时的图像、学号、日期、时间、识别设备、教室等信息。

篇3

关键词: 车牌定位;图像处理;HSV颜色模型;边缘检测;数学形态学

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2016)32-0184-03

Vehicle License Plate Locating Method Based On Color Positioning and Edge Detection

WU Lei, WANG Xiao-fei, LI Yan*

(School of Information Engineering,Hubei University for Nationalities, Enshi 445000, China)

Abstract:License plate recognition technology is one of the key technologies of intelligent traffic management system, license plate location is the basis for the realization of license plate recognition. Fast, accurate and robust license plate location technology can give a great help to the license plate recognition. In view of the problem of license plate location, this paper proposes a color location method based on HSV color model and the edge detection method based on vertical edge detection. Combined with the use of the two methods not only to achieve a fast, accurate positioning, but also for the license plate recognition follow the character segmentation, character positioning and other steps to lay a solid foundation.

Key words:vehicle license plate recognition; image processing; HSV color model;edge detection; mathematical morphology

1 引言

S着当今社会经济的飞速发展,车辆的数量也变得与日聚增起来。高速增长的汽车数量和落后的停车场管理模式形成了鲜明的矛盾冲突。于是,智能车辆管理系统的实现变得尤为重要。实现智能车辆管理系统的核心内容就是能够自动化识别车辆车牌,而作为车牌识别核心技术的第一步――车牌定位技术的好坏极大程度上决定了车牌识别的性能。

目前车牌定位的实现方法大体分为两类,一类是基于灰度图像的车牌区域定位方法,另一类是基于彩色图像的车牌区域定位方法。前者主要有基于纹理特征法、基于数学形态学法、基于小波分析法等方法。后者主要有基于RGB颜色法、基于神经网络法等。本文结合两类不同的方法,先采用改良的RGB颜色法――HSV颜色模型来识别车牌,可以定位出大部分颜色鲜明的车牌,由于此方法受图片质量影响较大,我们在颜色法后采用边缘检测定位法,通过垂直边缘检测,将图片中垂直边缘较多的区域定位出来,两种方法的结合可以获得车辆图片中车牌所在的区域,判断出真正的车牌位置。

2 颜色定位

采用RGB颜色定位方法需要RGB的3个分量(Red分量--红色,Green分量--绿色,Blue分量--蓝色)共同确定一个颜色标准,我国大部分车牌都是蓝色,我们要从Blue分量中找到分量的阈值确定蓝色的范围,这本就不是一件容易的事。但是我们往往不只有3原色构成的车牌,遇到像黄色的车牌时情况会更加复杂,需要考虑Red分量和Green分量的配比问题。这些问题让单纯选择RGB颜色定位变得分外困难。

为了解决这些问题我们采用HSV颜色模型,如图1所示。HSV模型是根据颜色的直观特性创建的一种圆锥模型。与RGB颜色模型中的每个分量都代表一种颜色不同的是,HSV模型中每个分量并不代表一种颜色,而分别是:色调(H),饱和度(S),亮度(V)。

H分量是代表颜色特性的分量,用角度度量,取值范围为0~360,从红色开始按逆时针方向计算,红色为0,绿色为120,蓝色为240。S分量代表颜色的饱和信息,取值范围为0.0~1.0,值越大,颜色越饱和。V分量代表明暗信息,取值范围为0.0~1.0,值越大,色彩越明亮。我们可以从一种纯色彩开始,即指定色彩角H,并让V=S=1,然后我们可以通过向其中加入黑色和白色来得到我们需要的颜色。增加黑色可以减小V而S不变,同样增加白色可以减小S而V不变。这就意味着通过保持V,S不变来找表示颜色的H的范围,再反过来通过H的范围确定V,S的取值范围,从而可以确定出我们需要的颜色范围,如图2所示。

采用颜色定位我们首先需要将图像颜色空间从RGB转换为HSV,再遍历图像的所有像素,将满足HSV范围内的像素点标记为白色,其余部分标记为黑色。所得图片中白色部分为车牌位置。再采用闭操作,取轮廓等操作获取目标车牌。

3 边缘检测定位

边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点。而本文采用的是基于垂直边缘的检测方法。因为一般的车牌图片在没经过一定的处理之前车牌边缘都有很多垂直边缘,那么就可以以此来判定车牌的位置。

车牌定位准确率的高低与图片的好坏有着密不可分的关系,如图片的天气,环境等外界环境因素直接影响图片的识别率。所以在进行识别之前必须对车辆图片进行预处理,消除干扰并突出车牌特征。

这里对车辆图片进行车牌边缘检测定位的流程如图3所示:

3.1 高斯模糊

对车辆图片先进行高斯模糊就是把图片中某一点周围的像素色值按高斯曲线统计起来,采用数学上加权平均的计算方法得到这条曲线的色值,最后能够留下物体的轮廓。高斯模糊使图片变得更平滑,去除了干扰的噪声对后面车牌的判断打下了坚实的基础。

3.2 灰度化

将彩色图像转化成为灰度图像的过程称为图像的灰度化处理。彩色图像中的每个像素的颜色有R、G、B三个分量决定,而每个分量有255中值可取,这样一个像素点可以有255*255*255种颜色的变化范围。而灰度图像是R、G、B三个分量相同的一种特殊的彩色图像,也正因为如此,对图像的灰度化处理存在的最大争议就是图像信息的丢失,图像信息的丢失可能使得对车牌的识别变得更加复杂。但对于计算机而言,处理灰度化图像相比于处理彩色图像要更加容易,同时,现在已研究的很多处理图像的算法和技术仅支持对灰度化图像的处理,在现今的科技状况下对图像灰度化处理使我们更便捷地获取所需要的信息。但无疑,对彩色图像直接进行判断更符合人眼识别的规律,更趋近人工智能的本质,也是今后研究的方向与趋势。一般有以下四种方法对彩色图像进行灰度化处理:分量法,最大值法,平均值法,加权平均法。

(1)分量法:将彩色图像中的三分量的亮度作为三个灰度图像的灰度值,可根据应用需要选取一种灰度图像。

f1(i,j) = R(i,j)f2(i,j) = G(i,j)f3(i,j) = B(i,j)

其中fk(i,j)(k=1,2,3)为转换后的灰度图像在(i,j)处的灰度值。

(2)最大值法:将彩色图像中的三分量亮度的最大值作为灰度图的灰度值。

f(i,j) = max(R(i,j), G(i,j), B(i,j))

(3)平均值法:⒉噬图像中的三分量亮度求平均得到一个灰度值。

f(i,j) = ( R(i,j) + G(i,j) + B(i,j) ) /3

(4)加权平均法:根据重要性及其他指标,将三个分量以不同的权值进行加权平均。由于人眼对绿色的敏感最高,对蓝色敏感最低,因此,按下式对RGB三分量进行加权平均能得到较合理的灰度图像。

f(i,j) = 0.30 R(i,j) + 0.59 G(i,j) + 0.11 B(i,j))

3.3 Sobel算子

Sobel算子是边缘检测定位中的核心算法,用于检测图像的垂直边缘,便于区分车牌。

Sobel算子是一阶导数的边缘检测算子,在算法实现过程中,通过3×3模板作为核与图像中的每个像素点做卷积和运算,如下所示,其中A为原图像,然后选取合适的阈值以提取边缘。

许多学者已经提出了很多图像检测算子,如Sobel算子、Laplace算子、Canny算子等。比较常用的有Sobel算子和Laplace算子。Sobel算子求图像的一阶导数,Laplace算子则是求图像的二阶导数,在通常情况下,也能检测出边缘,不过Laplace算子的检测不分水平和垂直。

3.4 二值化

图像的二值化,就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。一幅图像包括目标物体、背景还有噪声,要想从多值的数字图像中直接提取出目标物体,最常用的方法就是设定一个阈值T,用T将图像的数据分成两部分:大于T的像素群和小于T的像素群,然后分别设置为黑白两种颜色,实现了整个图像的二值化。

3.5 闭操作

对二值化图像先进行膨胀运算,其次进行腐烛运算,此组合运算即为图像的闭运算。对二值化图像先进行腐烛运算,其次进行膨胀运算,此组合运算即为图像的开运算。闭操作可使轮廓线更光滑,但与开操作相反的是,闭操作通常消除狭窄的间断和长细的鸿沟,消除小的空洞,并填补轮廓线中的断裂。使用结构元素B对集合A进行闭操作,数学表达为:

这个公式表明,使用结构元素B对集合A的闭操作就是用B对A进行膨胀,然后用B对结果进行腐蚀。

3.6 取轮廓,筛选,角度与尺寸判断

经过上述一系列的图像操作我们可以得到一张包含许多独立图块的图像,取轮廓操作就是将图像中的所有独立的不与外界有交接的图块取出来。然后根据这些轮廓,求这些轮廓的最小外接矩形。尺寸判断操作是对外接矩形进行判断,以判断它们是否是可能的候选车牌的操作。经过尺寸和角度判断,会排除大量由轮廓生成的不合适尺寸的最小外接矩形。接下来需要对剩下的图块进行旋转操作,将倾斜的车牌调整为水平,为后面的车牌判断与字符识别提高成功率的关键环节。最后确定我们要识别的车牌的尺寸。

4 结论

本文提出了两种关于车牌识别中车牌定位的方法,采用改进的HSV颜色模型,准确,快速地对颜色鲜明的车牌进行定位,简化了车牌定位中一些图片处理和特征判断的过程。而另一种方法是边缘检测中垂直边缘定位的方法,垂直边缘的选择让此方法能获得更高的准确率,同时采用图像处理,数学形态学等多种算法强化了图片中的许多特征量,极大提高了垂直边缘的判断。

虽然采用两种定位方法的结合,极大提高了车牌定位的准确率,但仍然有不足之处,需要进一步完善。两种方法都需要较高的图片质量,大量的光暗区域和严重的雨雪天气都会对车牌定位的准确率产生较大的影响。还有如颜色定位中一旦车辆的颜色与车牌的颜色一致,那判断的准确率会大大降低。而第二种方法如果遇到大量垂直边缘的车辆也会造成较大的误差。

参考文献:

[1] 魏平顺.智能交通系统中车标图像识别技术研究[D].南京:南京理工大学,2013.16-25.

[2] 李侠.车标定位技术研究[D].大连:辽宁师范大学,2011,16-26.

[3] 张闯, 孙兴波, 陈瑶,等. 常用边缘检测技术的对比[J].传感器世界, 2013,19(11):20-23.