卷积在神经网络中的作用范文

时间:2024-03-29 11:12:39

导语:如何才能写好一篇卷积在神经网络中的作用,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

卷积在神经网络中的作用

篇1

关键词:深度学习;目标视觉检测;应用分析

随着计算机的普及,目标视觉检测也在计算机的发展中逐渐被应用。人们的生活越来越离不开计算机和电子设备,数据信息充斥着当代人的生活。随着人们生活质量的提高对电子设备要求越来越高,越来越精准。目标检测技术在人们的生活中,也发挥着很大的作用和价值。智能监控、机器人、自动定位、人脸聚焦、航拍、卫星等方面都应用了目标视觉检测的技术。在高层视觉处理和任务分析中,目标视觉检测技术也是基础。无论是分析行为、事件还是场景语义的理解都需要运用到目标视觉检测技术。因此目标视觉检测在各个方面都发挥着重大的作用,本文就深度学习在目标视觉检测中的应用和展望进行探讨。

一、深度学习在目标视觉检测中的进展

深度学习最早出自于人工神经网络。深度学习把多层感知器作为学习结构,组合底层特征进行高层的学习。作为机器研究的一个新领域,模仿人脑组建学习的神经网络。深度学习可以逐步自主的学习。而目标视觉检测在近几年出现了很多的问题,例如,类内和类间存在差异。即使通过训练也很难包含所有类内的特征描述模型。而且类内和类间的差异大小不一样这就给目标视觉检测的发展带来很大的阻碍。在图像采集的过程中,由于种种因素会导致目标物体被遮挡,因此,视觉算法的鲁棒性也需要进行整改。语义理解也存在着差异,对仿生和类脑角算法有一定的难度。而计算机的复杂和自适应性也比较高,需要设计高效的目标视觉检测技术,为了确保目标视觉检测的精准程度,还需要设计出自动更新视觉模型来提高模型在不同环境下的适应能力。随着深度学习的发展,深度学习对于目标视觉检测有很大的用处,可以极大地解决目前目标视觉检测技术出现的问题。因此很多专家开始把深度学习融入到目标视觉检测的发展当中,并进行研究。

二、目标视觉检测的流程和顺序

估计特定类型目标是目标视觉检测的关键,目标视觉检测的流程大致分为三步,区域建议、特征表示和区域分类。根据图一,第一步区域建议。目标检测需要获得目标的准确位置和大小尺度,在输入图像的时候找到指定的类型目标是其中一种区域建议。还可以通过滑动窗进行区域建议,投票、图像分割的区域建议也可以使用。滑动窗需要在输入图像的时候在子窗口执行目标来检测目标所处的位置。投票机制则通过部件的模型找到输入图像和模型在局部区域内的最佳位置,并最大限度地让所有局部区域匹配,利用拓扑的方式来得到最佳匹配。但是投票机制的区域建议计算代价会比较高。图像分割的区域建议则建立在图像分割的基础上面,是一个消耗时间和精力的过程,而且很复杂很难把整个目标分割出来。而深度学习在图像分类和目标检测中都有一定得进展,通过深度学习的表征和建模能力可以生成抽象的表示[1]。

图一,目标视觉检测流程

三、深度学习在目标视觉检测当中的作用

深度学习融入目标视觉检测推动了目标视觉检测的发展和研究。目标视觉检测和图像分类有一定的区分,目标视觉检测主要关注图像的局部信息,图像分类在意图像的全局表达。但是它们也有一定的互通性。首先从区域建议的方法来探讨深度学习在目标视觉检测中的作用。深度学习在目标视觉检测中的基本参考方法是Girshick等人提出来的R-CNN方法。R-CNN和CNN相联系,检测的精准度达到了53.3%,对比传统的方法有很大的飞跃。如图二所示,输入相关图像的同时进行选择性的搜索提取候选区,通过CNN网络来提取固定长度的向量,图像经过两个全连接层和五个积卷层得出一个4096的向量,最后把提取到的向量数据在向量机中进行分配。但是这样的方式还是存在很多的不足和弊端,因此Girshick对R-CNN和SPP-net进行了进一步的改进,图像进行一次卷积在特征图上进行映射送入Rol池化层,最后通过全连接层输出。同一幅画像的Rol共同相同计算机的内存效率更加高。通过softmax 的分类不仅省去特征的存储还提高了利用率。近年来,kin等人又提出了PVANET网络,数据的检测精准度达到了82.5%,在确保精准度的情况下还能使通道数减少,可以增加对细节的提取。

图二,R-NN的计算流程

早期还提出过无区域建议的方式,例如,DPM模型可以在目标的内部进行结构化的建模,不仅提高了检测的性能,也能很好地适应非刚体的形变。但是DPM模型的构建条件复杂,模型训练也比较繁琐,所以sermanet又进行研究提出了Overfeat的模型,避免图像块的操作出错,也能提高算法的效率。但是关于尺寸的识别还是存在着一定的问题,因此无区域建议还在不断的探索过程中。redmom提出了关于改进yolo模型的方法,成为yolov2,可以确保精准度和定位,提升了检测率。专家们还研制出一种新的训练算法,用数据来找到物体的准确定位,yolo模型通过这样的方式课题检测超过九千种物体[2]。

四、结束语

未来深度学习在目标视觉检测中都会得到继续的应用和进展,深度学习在目标视觉测试中依旧是主流的方向。深度学习通过它的优势可以获得高层次抽象的表达。但是深度学习的理论还不是特别的完善,模型的可解释性还不够强。因此深度学习模式还需要得到进一步的改进和完善,对模型的结构,训练等多加指导。大规模多样性数据集也比较匮乏,现在很多的目标视觉检测都在imagenet上进行训练,但是目标检测技术还需要进一步的完善和提高,达到最好的效果。深度学习在目标视觉检测技术中的应用还不够完善,任重而道远,还需要进一步的完善理论提高精准度。在未来,深度学习和目标视觉检测一定能够得到极大的进展。

参考文献