计算机视觉关键技术在通信工程的应用

时间:2022-06-18 02:57:06

导语:计算机视觉关键技术在通信工程的应用一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

计算机视觉关键技术在通信工程的应用

摘要:本文首先总结了计算机视觉领域的重要关键技术和典型算法模型,然后介绍了这些技术在通信工程领域内设备安装、施工验收、三维测量和天面核查等4种典型场景下的应用方案及实施效果,将为通信工程行业构建数字孪生网络提供有益探索。

关键词:计算机视觉;图像质检;全景图像;三维测量;目标检测

计算机视觉(CV)是指用计算机来模拟人的视觉系统,去实现人的视觉功能,以适应、理解外界环境和控制自身的运动。数据、算力和模型是计算机视觉行业发展的三大基石。2000年之后,数据量的上涨、运算力的提升和深度学习算法的出现促进了计算机视觉行业的迅猛发展。随着高性能智能终端的普及和影像采集设备成本的下降,通信行业逐渐在勘察、施工、优化和运维等领域积累了大量非结构化的图像数据。同时,图像处理器(GPU)的便利应用也为开展高强度并行计算提供了算力基础。

1计算机视觉领域的关键技术

1.1重要关键技术。计算机视觉技术发展迅猛,在通信工程领域应用价值较高的主要有图像分类、目标检测、图像分割、场景文字识别和图像生成5类。1.1.1图像分类。图像分类主要的研究内容是对图像进行特征描述。通常,图像分类算法通过手工特征或者特征学习方法对整个图像进行全局描述,并依据图像特征图的不同语义信息进行分类。该技术广泛应用于人脸识别、车辆识别、手写文件或印刷识别等场景。常用的图像分类模型包括AlexNet、VGG、ResNet、InceptionV4、MobileNetV3和ShuffleNet等。1.1.2目标检测。作为计算机视觉的一个重要分支,目标检测的任务是在一幅图像或视频中找到目标类别和目标位置。与图像分类不同,目标检测侧重于物体搜索,被检测目标必须有固定的形状和轮廓。而图像分类可以是任意目标包括物体、属性和场景等。目标检测已在人脸识别和自动驾驶领域取得了非常显著的效果,经典的检测模型有1.1.3图像分割。图像分割指的是将数字图像细分为多个图像子区域(像素的集合,也被称作超像素)的过程。图像分割的目的是简化或改变图像的表示形式,使得图像更容易理解和分析。图像语义分割是一个像素级别的物体识别,即每个像素点都要判断它的类别。MaskR-CNN就是一种经典的实力分割网络。1.1.4场景文字识别。场景文字识别分为两部分,首先通过目标检测来检测出目标区域,然后通过CRNN-CTC模型将网络特征转为文字序列。场景文字识别广泛应用于路牌识别和车牌检测等领域。1.1.5图像生成。图像生成是指使用对抗网络(GAN)根据输入的随机噪声或向量生成目标图像。生成器和识别器是对抗网络的重要组成部分。1.2典型算法模型近年来,计算机视觉领域的优秀算法层出不穷,以下介绍本文中研究使用的一些模型。1.2.1VGGNet2014年,牛津大学计算机视觉组和谷歌公司的研究员联合研发出一种新的深度卷积神经网络,即VGGNet,并获得当年ILSVRC分类比赛的亚军。VGGNet分为VGG16和VGG19,VGG16通过13层3×3的卷积网络和3层全连接网络构建,VGG19则通过16层3×3的卷积网络和3层全连接网络构建。VGG19被广泛应用于不同行业的图像特征提取领域。1.2.2ResNet101。深度残差网络(ResNet101)是过去几年中计算机视觉领域颇具开创性的算法。因其强大的表征能力,除图像分类以外,包括目标检测和人脸识别在内的许多计算机视觉应用都得到了性能提升。ResNet101是其中的一种网络堆叠方式,101层网络指全连接层数目。1.2.3SIFT。尺度不变特征转换(SIFT)是一种用来侦测与描述影像局部性特征的重要算法。SIFT算法主要用于处理两幅图像之间发生平移、旋转和仿射变换情况下的匹配问题。1.2.4MaskR-CNN。MaskR-CNN是一种简洁、灵活的图像实例分割框架,用于判断图像中不同目标的类别和位置,并可做出像素级预测。该算法不仅能够有效地检测图像中的目标,而且还能为每个实例生成一个高质量的分割掩

2通信工程中典型应用与效果

2.1设备安装方式检测。蓄电池是通信机房内的重要基础设施。按照设备属性和机房空间等因素,蓄电池的安装方式可分为卧式和立式两种。在局房设计时,需要因地制宜地制定安装方式。在施工验收时,需要关注是否按图施工。通常,安装方式的信息采集和现场核验都是人工判断并填注到相应信息系统中,填报错误时有发生。本文引入VGG19模型中的二分类法,基于常规勘察设计现场拍摄的蓄电池图像,设计出自动识别算法,如图1所示。测试表明,在仅需100张标注样本数据时,置信度即可达到0.95以上。同时,借助移动互联网手段,在图像信息采集终端中还可以实现实时识别及自动填写,如图2所示,从而提升现场查勘人员信息填写效率并降低人工填报错误率。2.2施工工艺图像质检。当前家宽装维人工抽检覆盖率低、成本高。人工质检依靠经验,存在漏检和错检的情况,结果不可靠。通过计算机视觉技术可构建家客智能化质检手段,对家宽装维质量进行跟踪监管,自动识别安装结果是否合格,提升质检效率,减少人工成本,改善安装质量,提升家客业务支撑水平,最终达到降本、增效、提质的愿景目标。以实际应用中效果较好的尾纤安装质检为例,传统的人工图像质检存在检测准确率低且人力成本高的问题,本文采用基于深度学习的图像识别技术,基于VGG19模型构建了相应的检测算法模块,如图3所示。如图4所示,基于66张尾纤布放样本图像,开展了二分类标注(图4左、中),随机挑取10张照片用于测试验证(图4右),置信度可达到0.954528,方法有效。2.3全景图像三维测量。三维全景是基于全景图像的真实场景虚拟现实技术,将相机环绕一周360°拍摄的一组或多组照片拼接成一个全景图像,也可通过一次拍摄实现成像。通过拼接,经过一系列数学计算可以得到其球形全景的立方体投影图。最后通过计算机技术实现全方位互动式观看的真实场景还原展示。本文设计并实现了一种基于SIFT算法的三维全景图像测量方案,如图5所示,基于该方案可以开展机房内设施和天面设施等场景的三维空间距离测量,3种试验场景下的验证误差均在5%以内,如图6所示。2.4天线数量目标检测。天面是5G网络建设的重要资源,也制约到5G工程建设进展。在日常勘测、优化及维护工作中,往往积累了大量的天面历史影像资料。通过引入图像检测算法,可以探索天面资源的自动核查方法。本文应用MaskR-CNN算法设计了基于天面照片图5基于SIFT算法和全景照片的三维距离测量方案的天线数量检测算法。首先,图像经过ResNet101和特征金字塔网络(FPN)结构,提取多层特征图,然后经过区域选取网络(RPN)微调特征图对应锚框(Anchor)的偏移量并且将锚框划分为前景和背景,之后将生成的感兴趣区域(ROI)经过排序,输出相同大小的感兴趣区域。如图7所示,在训练阶段,分类和掩膜两个分支同时进行。其中分类包括类别、置信度和边界框回归,掩膜分支则用于分割目标。在测试阶段,则是先经过分类分支,再经过掩膜分支。本文基于微软Coco技术来量化评估目标检测的效果,具体指标是所有交并比(IOU)阈值的平均精度(AP)、IOU阈值为0.5的AP(AP50)和IOU阈值为0.75的AP(AP75)。如图7所示,基于200套照片训练MaskR-CNN模型,另外挑选100张照片进行验证。结果AP为0.423,AP50为0.801,AP57为0.442。从而说明MaskR-CNN算法有着较强的鲁棒性,可以有效解决天线数量检测任务,如图8所示。

3结束语

计算机视觉是提升5G移动通信网络智能化水平的重要手段,本文引入图像分类、目标检测和图像分割等技术,结合设备安装方式等4种典型场景下的智能识别需求,提出并验证了基于计算机视觉技术的解决方案,为5G网络勘察设计及运营维护的智能化提出了新的研究思路。

作者:陆南昌 刘吉宁 姜书敏 黄海晖 赵培 单位:1.中国移动通信集团广东有限公司 2.中国移动通信集团设计院有限公司