计算机视觉教程范文

时间:2023-12-18 17:57:40

导语:如何才能写好一篇计算机视觉教程,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

计算机视觉教程

篇1

关键词:计算机视觉;教学应用;教学改革

计算机视觉是人工智能学科中的一门重要课程。随着相关应用在多个领域中的出现,越来越多的学生开始对这门课产生了浓厚的兴趣。如何让学生能够在整个课程中保持盎然的兴趣,并为有志于深入研究计算机视觉的学生指明方向,成为我们教师首先应注重的问题。

在实际的教学工作中,通过不断摸索总结,我们认为,以实际应用引导学生的学习兴趣,既满足了学生想了解计算机视觉实际应用的需求,又加深了学生对于算法的理解,把算法放在一个实际应用中,学生可以理解怎么用,为什么这么用。在这样的目标导引下,我们从选择教材开始,准备教学内容(包括合理的应用实例的选择)、制作PPT、探索教学方法,形成了目前以实际应用为主导的创新教学体系,非常受学生欢迎。在此,我们对这期间遇到的问题,解决方法、心得体会做一个总结和思考,希望能对同行有些许参考作用。

1选择教材

在我们这个专业,每年的上研率基本都保持在50%左右。在本专业的研究生阶段,也开设了双语教学的计算机视觉课程。另外,毕业后选择参加工作的同学也基本都进入和本专业非常相关的一些单位,所从事的工作,都是和在学校学习的知识密切相关。

因此,如何让这门课程的教学既兼顾本科毕业就参加工作的那部分同学,又兼顾继续深造的学生的需求,也是在这门课程讲授的过程中,需要特别注意的一个问题。对于本科毕业就要参加工作的同学而言,需要“广度”,需要了解计算机视觉这门课在各个领域中的应用,在实际中接触到相关的项目或工作时,能够知道去哪里可以找到自己需要的参考资料;而对于要进一步深造的同学而言,则需要一定的“深度”,为研究生阶段的研究打下基础。

全盘考虑到这些学生毕业之后的去向,我们选择了两本教材。一本是贾云得教授编著,科学出版社于 2000年出版的《机器学习》[2],这是一部顺应了时代与教学发展要求的教材,对计算机视觉中的基本概念、基本算法、基本算法的应用、经典应用进行了由浅入深的介绍。内容涵盖了所有经典的数字图像处理与机器视觉方法,也对一些已经得到非常好实际应用的方法,如光流法等作了简要介绍。另外还选择了一本英文原版的计算机视觉的经典著作,Ramesh Jain 教授等所著的《Machine Vision》[3],机械工业出版社于2003年出版。这是国内外非常推崇的一本计算机视觉著作,该教材条理清晰,深入浅出,对计算机视觉的基本原理、算法、应用的介绍非常详尽。

在教学中,我们采用了英文的PPT,但主要用的教材是贾云得教授的《机器视觉》,这样中英文对照讲解,一方面加深学生对教学内容的理解,另一方面也为学生今后阅读专业的英文论了相应准备。

2教学内容和工程实例的选取

2.1选取教学内容

本课程之前,大学二年级的本科生已开设数字图像处理课程,但所讲的基本原理和算法都非常浅显,所以在教学内容的安排上,分为两大部分:数字图像处理部分和视觉部分。数字信号处理部分主要讲解在视觉部分会用到的一些基本算法,为后面进入计算机视觉部分打基础。这部分约占总课时的1/3。视觉部分的课时也分为两部分:算法讲解与实例讲解。在算法讲解部分,对计算机视觉的基本算法、经典算法都做了深入浅出的讲解。实例部分则选择了经典的工业应用,让学生能够对所学算法进一步加以理解。

2.2选取适当的工程实例

就计算机视觉的教学内容而言,各个孤立的算法和方法对本科生来讲,有些抽象不好理解。如果在教学上仅仅通过老师在课堂上的讲解,很难让学生深入地理解相关的教学内容,而选择一个触手可及且简单好理解的工程实例往往就会达到意想不到的教学结果,学生可以把课堂上所学的枯燥理论与现实中活生生的事物联系起来,从而加深对教学内容的理解。

通过反复比对、反复论证,我们选择了在讲解基本原理和算法之后,在课程结束前,专门留出课时讲解手机制造这个例子。手机现在是人手一部,是这些年青学子再熟悉不过的事物了,通过对手机主板、手机键盘的制造过程的讲解,把所学的算法都融合进来,学生在觉得有趣的同时,不知不觉就加深了对所学算法的理解。

另外,在教学的过程中,我们还不断穿插其他学生耳熟能详的实例,如数码相机原理中的一些算法的讲解,我们和学生一起探讨应该怎么选择数码相机。再有,滤波器算法、在课堂上对Photoshop功能的演示,与所学算法关联起来,学生都很容易理解接受。

3教学点滴

3.1点睛之笔

在第一节课的讲述中,我们的重点不在于Marr理论,而是告诉学生:

人工智能就是要让计算机像人一样,能够会听、会看……

我们这门课程就是要让计算机“会看”,要像人一样会看。进而展示给学生一些我们精心挑选的图片,让学生自己判断,是不是自己的眼睛“骗了”自己,人眼和计算机看到的到底有什么不一样。

每次讲到这里,学生都会进行热烈的讨论,每个人都有不同的看法,每个人都有自己的坚持,不知不觉中,对这门课就产生了浓厚的兴趣,有了继续深入学习下去的愿望。在课堂讨论的最后,比较人眼对图片的判断以及计算机的判断后,让学生自己总结归纳,我们这门课到底要研究些什么,都有可能应用在哪些方面,然后对争议比较大的提议一一探讨。每到这个时候,大家的积极性就都被激发出来,在不断的争论与思想碰撞中找出正确的结论。

3.2拿身边的事物说“事”

计算机视觉课程的前半部分,多涉及到图像处理的一些常见算法。在讲授各种各样的滤波器和算子时,并没有针对各个滤波器和算子摆出一堆示例图片,让学生比较滤波前后的差异,从而很生硬地理解滤波器与算子的功能。取而代之的,我们首先以现在人手一台的数码相机为例提出问题,你为什么要选择你手里的这台数码相机?当初选这个品牌和型号时,你的考虑是什么?历年学生的回答几乎都是看网上测评,或者在网上看别人怎么说。这时列出我们收集到的各个品牌相机的测评报告,列出它们的优缺点,然后引导学生去思考,例如这个品牌的相机的缺点是照片发灰,不是很鲜亮,而另一个品牌的相机则绿的特别绿,红的特别红,为什么?那么有可能是哪部分的算法不够完善,为什么?

通过如此简单的对比,学生的积极性被完全激发。原来,数码相机这个几乎人人都有,大家都熟悉的“玩具”竟然和自己在课堂上学到的知识这么密切相关。

再有,就是利用学生们都熟悉的PS(Photoshop),演示现在所谓的“完美证件照”是怎么来的。为什么可以把疙疙瘩瘩的脸部皮肤变得光滑?在PS中,你就是点了一下鼠标,其实在后台,是加入了一个滤波器进行了滤波。各种这样的演示,学生都非常喜闻乐见。因为他们突然发现,原来那些事物,和我自己接触到这些看似枯燥的理论之间,还有这么深刻的联系。

还有一个很受学生欢迎的例子就是对于“鼓形失真”的讲解。我们的老师每次讲到这里,都不会简单告诉学生“鼓形失真”发生的原因是什么,应该怎么解决?老师都会问学生,明星为什么都一窝蜂去减肥?现在的女明星为什么都要去弄个“锥子脸”?课堂上就会出现一个小,男同学和女同学的看法各异,彼此之间开始争论不休。此时再趁热打铁地问学生,如果拿着相机,离自己的鼻子一公分,会拍出什么样的效果?有学生开始拿出手机对着自己和别人开拍,有的学生开始头头是道地分析。每到这种学生都开始热烈讨论的时候,就可以适时引导学生往正确的方向去,让他们自己找到正确的分析解决方法,往往这个时候,学生都会颇有成就感,对于问题的理解也会特别的深刻。

3.3选择合适的实际应用

在所有理论讲解结束后,我们会留出2~4次课讲述计算机视觉在工业上的应用。这些年来,对于手机制造这样一个工业应用,非常受学生欢迎。正如“数码相机”这个例子一样,现在学生都是人手一部手机,是大家再熟悉不过的东西。这个例子涉及到了在前面理论讲述中的大部分算法,如二值图像的处理、模板匹配、高斯滤波器等。学生通过对这个工业应用的理解,更进一步加深了对算法的理解。

以讲解手机键盘的制造过程为例,向学生提出和前面所讲内容相关的问题,引导学生自发思考,如为什么选择模板匹配法,而不是采用其他更复杂更精确的方法等等。每到这个时候,课堂气氛总是分外热烈,学生各抒己见,在不断争论中,更进一步加深对课本上枯燥理论的认识。

在这里需要注意的问题是一定要一步一步提出问题,循循善诱,引导学生一层一层地深入思考。如果问题的答案过于“深藏不露”,则有可能触发学生的抵触情绪,无法继续深入地思考。

4结语

通过多年的教学摸索,我们认为,在计算机视觉课程的讲述中,以实际应用引导学生这样的教学方法非常可取,而且也收到了很好的效果。另外,除了制定好的教学大纲,并选择合适的教材外,根据学校现在的时间情况,我们选择了多媒体手段辅助教学,充分利用Matlab和大屏幕投影等方方面面的优势,结合多种方法进行教学,对讲好计算机视觉这门课,非常有益。

参考文献:

[1] 林尧瑞,马少萍. 人工智能导论[M]. 北京:清华大学出版社,1989.

[2] 贾云得. 机器视觉[M]. 北京:科学出版社,2000.

[3] Ramesh Jain. Machine Vision[M]. 北京:机械工业出版社,2003.

[4] 蔡自兴. 智能控制原理与应用[M]. 北京:清华大学出版社,2007.

Innovation in the Course of Computer Vision

HAN Hong, JIAO Li-cheng

(School of Electronic Engineering, Xidian University, Xi’an 710071, China)

篇2

关键词:知识规则挖掘;城市公共交通;服务质量评价;遗传算法

中图分类号:TP301.6 文献标识码:A

1引言

知识规则挖掘就是从大量的、不完全的、有噪声的知识规则中,提取隐含在其中的、人们事先不知道的有用的知识规则的过程。知识规则挖掘方法[1,2,3]有多种,如机器学习、决策树、神经网络、粗糙集方法、遗传算法等。在这些方法中,遗传算法由于具有高度的鲁棒性和极佳的全局搜索能力而倍受众多学者的青睐。在城市公共交通服务质量评价知识规则体系中,由于评价指标较多,在进行知识规则挖掘时,使用遗传算法尤为有效。利用遗传算法进行城市公共交通服务质量评价知识规则挖掘,就是在已有的知识规则的基础上进一步进行优化,得到隐含在知识规则库中的、更为满意的、新的知识规则。

2城市公共交通服务质量评价指标体系构建

城市公共交通服务质量可以从硬件和软件两个大的方面进行评价。硬件方面包括道路公共交通网络和公交企业本身的设施投入;软件方面则主要指道路交通通行的实际水平与公交企业的软。上述方面还可以进一步细分,直至一些基础性的指标。结合综合评价加指标体系建立的方法,建立城市公共交通服务质量评价指标体系[4-6]。评价指标体系包括四个方面:公共交通网络、公交企业硬性投入、公共交通通行服务水平、公交企业软,具体评价指标有15个,如图1所示。

遗传算法是模拟生物界自然选择和自然遗传机制进化过程来求解复杂问题的全局随机搜索算法[7,8],它以编码空间代替问题空间,以适应度函数为评价依据,以编码群体为进化基础,以对群体中个串的遗传操作实现选择和遗传机制,建立起一个迭代过程。在这一过程中,通过随机重组编码位串中重要的基因,使新一代的位串集合优于老一代的位串集合,群体的个体不断进化,逐渐接近最优解,最终达到求解问题的目的。

由于传统遗传算法存在收敛速度慢、容易出现早熟收敛等缺点[9],本文采用文献[10]中的改进遗传算法(IGA),这种改进遗传算法的工作流程如图2所示。

4.3遗传算子

在本文使用的改进遗传算法中,遗传算子包括选择算子、助长算子、交叉算子和变异算子。选择算子采用两代竞争排序的选择方法来对遗传个体进行优选,遗传个体被区分为雄性和雌性两种不同的性别,把父代与子代的所有雄性个体与雌性个体分别进行重新排序,再按群体规模N分别从排序后的雄性个体集与雌性个体集中截取前N/2个优秀的个体进入匹配池,作为交叉操作的对象。助长算子用来对种群中的个体进行一定概率下的助长,助长操作在选择操作之后及配对操作之前进行,本文是采用基于个体适应度的助长。在交叉操作中,同性别个体之间是不能进行配对的,雄性个体只能同雌性个体进行配对,配对是按个体优劣顺序进行的,个体配对之后还要进行亲缘关系的检测,以保证个体之间的繁殖属于严格的远缘繁殖。在二进制编码方式下,变异操作就是以很小的变异概率从群体中随机选取若干个体,对于选中的个体又随机选取表现型编码中的某一位或多位进行数码翻转,即将1变为0或0变为1。

4.4新知识规则的检验

遗传算法运行结束后,要对挖掘出的新知识规则的有效性进行检验。一方面要检验新知识规则是否被知识规则库中已有的规则所包含,如果被已有的规则所包含,则新知识规则无效;另一方面是检验新知识规则是否与知识规则库中已有的规则相矛盾,如果与已有的规则相矛盾,则新知识规则同样无效。无效的新知识规则将被剔除,有效地新知识规则将被加入知识规则库中。

5实例

一城市公共交通服务质量评价知识规则库(部分知识规则)如表1所示,这个知识规则库即为测试数据集。表1的知识规则编码及适应度值如表2所示。

这二条新的有效的知识规则将被加入到城市公共交通服务质量评价知识规则库中,使知识规则库得以更新。

6结论

本文将一种改进的遗传算法用于城市公共交通服务质量评价的知识规则挖掘,提出了一种基于遗传算法的城市公共交通服务质量评价知识规则挖掘方法。实例表明,遗传算法在进行知识规则挖掘时是完全有效的,能够得到比知识规则库中已有的一些知识规则更优的知识规则。这为知识规则挖掘提供了一种重要途径。

参考文献

[1]刁力力. 数据挖掘与组合学习[J].计算机科学,2001, 28(7):73-78.

[2]Dasarathy, B.V Nearest Neighbor(NN)Norms. NN Pattern Classification Techniques[M]. Washington, D.C.: IEEE Computer Society, 1991.

[3]ZIARKO W. Rough sets, Fuzzy Sets and Knowledge Discovery[J]. New York: Springer-Verlag, 1994.

[4]邵祖峰. 基于神经网络的城市公共交通服务质量评价[J]. 城市交通,2005,7(4):178-180.

[5]张丽花, 张好智, 杨小宝. 基于乘客出行链的公共交通服务质量评价研究[J]. 公路与汽车,2011,7(4):48-51.

[6]邵祖峰. 城市公共交通服务质量评价神经网络模型[J]. 城市交通,2006,4(6):38-41.

[7]雷英杰,张善文,李续武,等. MATLAB遗传算法工具箱及应用[M].西安:西安电子科技大学出版社,2005.

[8]王小平,曹立明. 遗传算法——理论、应用与软件实现[M].西安:西安交通大学出版社,2002.

篇3

关键词:ARM OPENCV AdaBoost

近年来,功能各异的视频监控设备越来越多,但是,大多只能简单记录视频画面,将监控到的视频信息存储起来,而不能对所监控到的视频做一定的处理分析和预测。基于ARM的人脸检测系统,为我们的视频监控设备提供了一个视频处理的参考解决方案,在一定基础上加以扩充,可以完成人物识别,危险行为检测与报警等,使视频监控设备更加智能化。

1、视频监控的几项关键技术及发展方向

视频监控的关键技术主要有视频采集压缩算法、视频信号可靠地传输、信息存储调用的智能化与系统的集中管理等。视频监控技术发展方向为分布采集集中管理、高品质图象压缩处理、开放标准统一接口、统一认证以确保安全、操作人性化以及功能集成化、结构模块化和传输多样化。随着不断发展的网络技术,基于嵌入式技术的网络数字监控系统不再是处理模拟视频信号,而是把摄像机输出的模拟视频信号通过视频编码器直接转换为IP数字信号。

2、平台的搭建

ARM之所以应用广泛,是因为有较快得运算速度,较低的价格,开发人员也比较容易接触,程序较易移植过来等特点。EmbeddedLinux也是Linux家族的成员,支持广泛的硬件平台,如PPC、ARM、MIPS等,也继承了Linux的优点——开源、免费,同时也有广泛的应用软件支持,能够比较方便的移植操作系统与应用软件。

3、OPENCV简介

OpenCV是一个开源的计算机视觉库,采用C/C++语言进行编写,可以运行在Linux/Windows/Mac等操作系统上,同时还提供了Python、Ruby以及其他语言的接口。其设计目标就是执行速度尽量快,它采用优化的C语言编写,能够充分利用多核处理器的优势。除此之外,另外一个目标就是构建一个简单易用的计算机视觉框架,开发人员可以利用它更便捷地设计复杂的计算机视觉相关应用程序。其中包含的函数有500多个,覆盖了计算机视觉的许多应用领域,如工厂产品检测、医学成像、信息安全、摄像机标定、立体视觉和机器人等。

4、人脸检测的原理

人脸检测技术的研究要追溯到20世纪70年代,早期的研究主要致力于模板匹配、子空间方法、变形模板匹配等,近几年,集中研究基于数据驱动的学习方法,如统计模型方法,神经网络学习方法,统计知识理论和支持向量计算方法,基于马尔可夫[1]随机域的方法,以及基于肤色的人脸检测等。目前在实际中应用的人脸检测方法多为基于Adaboost[2]学习算法的方法。

Viola是AdaBoost算法的一种,主要基于积分图和级联检测器,其方法框架可大至分为以下三大部分:第一部分,使用Harr-like特征来表示人脸,并且使用“积分图”实现特征数值的快速计算;第二部分,使用Adaboost算法挑选出一些最能代表人脸的矩形特征,用弱分类器按照加权投票的方式,构造为一个强分类器;第三部分,为有效的提高检测速度,将训练得到的若干强分类器串联组成一个级联结构的层叠分类器。

人脸检测的目的就是从图片之中找出所有包含人脸的子窗口,对人脸的子窗口与非人脸的子窗口进行区分。第一步,在一个20*20的图片中提取出一些简单的特征(Harr特征),将白色区域内的像素减去黑色区域,因此在人脸与非人脸图片的相同位置上,有着大小不一样的数值,这些特征就是区分人脸和非人脸的依据。第二步,使用上万张切割好的人脸图片和上万张背景图片作为训练样本。训练图片一般都调到到20*20的大小。在这样大小的图片中,可供haar使用的特征数大概有1万个左右,然后通过机器学习算法也就是Adaboost算法挑选数千个有效的haar特征,用来组成人脸检测器。第三步,学习算法训练出一个人脸检测器后,便可以在各种各样的场合使用了。使用时,依次缩放图像比例,最后在缩放后的图片20*20的子窗口中依次判别是否是人脸。

人脸检测技术在门禁系统、智能监控系统中已经得到了很好的应用。另外,目前的笔记本电脑登录时,也陆续使用人脸识别技术作为凭证。同时,人脸检测算法也在数码相机和手机中起作用,作为一个新新的功能提供用户使用。

5、结语

ARM上进行图像处理以及人脸检测与识别等是可行的方案,可以减少硬件成本。 采用Linux+Qt4+OpenCv+Arm是一个方案合理、技术成熟、成本低廉、应用广泛的人脸检测与图像处理的解决方案。

参考文献

篇4

关键词:模板匹配 特征值 细化 二值化

中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2013)06-0134-02

1 模板匹配算法的描述

在机器识别事物的过程中,常需把不同传感器或同一传感器在不同时间、不同成像条件下对同一景物获取的两幅或多幅图像在空间上对准,或根据己知模式到另一幅图中寻找相应的模式,这就叫做匹配。因为只有当同一场景的两幅图像在同一坐标系下时,才能进行相似性比较,所以模板匹配的过程实际上也就是把一幅图像变换到另一幅图像的坐标系过程。图像的模板匹配就是先给定一幅图像,然后到另一幅图像中去查找这幅图像,如果找到了,则匹配成功。这看起来好像很简单,因为我们一眼就能看出一幅图中是否包含另一幅图像,遗憾的是电脑并不具有人眼的强大的视觉的功能,因而需要电脑去判定一幅图片中是否包含另一幅图片是件不容易的事情。对于机器视觉系统而言,实现匹配首先要对图像进行预处理。先计算模板图片的特征值,并存储到计算机中。然后计算待测试样板图片的特征值,与计算机中模板进行比较,运用匹配算法实现匹配。整个过程如图1所示。

在基于图像处理的应用领域中,对于图像匹配的研究可以说一直都是数字图像处理技术和计算机视觉理解的重要研究内容。图像匹配在机器视觉、工业自动模式识别、医学图像的定位等方面都有着重要意义。

2 图像匹配的数学描述

3 算法的改进及图示

根据以上对模板匹配的介绍,可以对字符图像进行识别。但是求相似性度量函数,求待匹配图像和模板之间的相似性映射关系均比较复杂。上一节知识的介绍中,也看到了其过程比较麻烦。本系统中识别的图像均为20×36大小的。即模板图像和待测图像大小相同。即会从图像的左下角一直顺着搜索一直至全图结束。而且映射关系及相似性函数均比较复杂,不是数量级上的关系。此时识别效率就不明显。显得木讷不灵巧。并非像前面介绍的在待测图片中搜索,并返回得到匹配点。因此需要基于此模板匹配算法原理的基础上,对算法进行改进,才能更有效的去完成识别的功能及简化其识别的过程。提高识别速度。即将图片区域化。算法改进的思想:将图片(3×4)分为12块区域,具体区域的划分如图3所示。再加上5条交线。共记有17个特征值。

模板训练时,将数字模板图片17个特征值的信息记下并存储在数组中。当进行样本训练的时候,用同样的算法计算图片中数字的17个特征值,并到计算机存储区中去匹配,直接利用象素灰度值的差异,找到特征值最接近的一个图片数字,便完成匹配识别的过程,到匹配的结果。这样便简单多。

4 结语

本系统通过对图片进行区域化处理基本能完成对数字图像的识别功能。虽然有一定的误识率。将图片区域化后再进行模板匹配可以很轻松的实现数字的识别,这是一次对模板匹配算法的新的尝试。通过对数字图片的研究,可以推广到英文字符的识别,甚至可以识别手写或打印的汉字字符。研究识别率达到100%是我们的理想,通过我们的研究可以不断地将字符识别技术推向前进。

参考文献

[1]钟志光,卢君,刘伟荣编著.《Visual C++.NET 数字图象处理实例与解析》[M].北京:清华大学出版社,2003年6月.

[2]何斌,马天予,王运坚,朱红莲编著.《Visual C++ 数字图象处理》第二版[M].北京:人民邮电出版社,2002.

[3]夏良正编著.《数字图象处理》[M].南京:东南大学出版社,1999年9月.

[4]葛亮.Visual C++从入门到实践[M].北京:清华大学出版社,2009.

篇5

关键词:OpenCV;视觉模块;图像处理

中图分类号:TP23 文献标识码:A

1 引 言

对于世界葡萄种植来说,切根虫(一种夜蛾的幼虫)是危害葡萄树生长的主要害虫之一。精准对靶施药系统可在葡萄树干上施加一个均匀的、宽度大于等于20cm的“障碍药带”,可有效的阻止切根虫夜晚从树根爬到树冠啃食新芽。由于在实际葡萄园中,每隔几棵葡萄树就会立一根树桩拉着铁丝牵引葡萄藤,所以在施药时需要区分笔直的树桩和弯曲的葡萄树干,避免不必要的施药。因此本文基于OpenCV的图像处理方法进行精准对靶施药系统视觉模块设计。

2 基于OpenCV的图像处理

OpenCV软件由C函数以及C++函数组成,可以进行例如特征检测、目标分割、三维重建等图像分析。在图像处理、计算机视觉等方面,OpenCV起到了无可取代的重要作用。在不远的将来,OpenCV对工业、航天、军事、人机对话等领域都起到了及其关键的作用。随着图像分析、视觉技术的发展,OpenCV将逐渐适用于更多的场合[1]。本文研究中采用计算机视觉技术,通过CCD摄像头采集图片,使用OpenCV来检测采集到的葡萄树干和木桩图片的外轮廓线,从而判断喷药设备前方的物体是弯曲的葡萄树干还是笔直的木桩,若判定为弯曲的葡萄树干则喷药,若判定为笔直的木桩,则发出信号,让拖车继续前行。

2.1 图像预处理

在进行轮廓检测前,首先要对采集到的葡萄树干和木桩的图片进行预处理,主要是进行形态学去噪以及图像平滑处理[2]。

2.1.1 形态学去噪

数学形态学,其本质是通过一些方法实现图像处理,比如:利用结构元素提取图像形状等。数学形态学的基本操作有两种:膨胀和腐蚀。膨胀使图像区域变大,可以实现小空间和缝隙的填充。腐蚀使图像区域变小,可以用来去掉图像菱角。膨胀和腐蚀两者没有互为逆运算,可以结合使用,对图像先膨胀再腐蚀,或者先腐蚀再膨胀。前一种运算称为闭运算,后一种称为开运算。两种运算在数学形态学中都很重要。闭运算可以弥补裂缝、填补孔洞,开运算可以去除毛刺和孤立小点,两种运算对物体的形状和位置不造成改变。本文中先用CCD相机拍摄照片,然后对照片进行闭运算和开运算,使轮廓平滑,没有毛刺和缺口。

2.1.2 利用中值滤波进行图像平滑处理

图像平滑处理多用于减少图像噪声,是数字图像处理技术的一种。对于在葡萄种植园中采集到的葡萄树干或者木桩的图片,由于场地等的原因,不可避免的存在许多噪声,进行平滑处理时最重要的是要保持葡萄树干或者木桩轮廓的清晰,还可以去除高频噪声,综合考虑,我们选择中值滤波。

中值滤波属于非线性滤波,它可以抑制图像噪声和脉冲干扰,保护图像,使图像的边缘不变模糊。也可以将图像的灰度信息保留的更多,提高对图像轮廓检测的质量[3]。

2.2 基于mean shift 的图像分割

mean shift 是通过迭代,运用非参数进行概率密度估算的方法。基于原理简单、参数少、不需要预处理等特点,mean shift 主要被运用在追踪目标、分割图像等方向[4]。使用mean shift 进行图像分割可以被当作特征空间聚类问题处理,因为被选取的空间的色彩、灰度、梯度不同,概率密度函数将会梯度上升,mean shift 沿着该方向找到局部最大值,可是将具特征类似的向量分割开来,归为一类。

2.3 边缘检测

边缘检测多是指检测图像中灰度或者亮度变化最大的部位,一般是指前景、背景的交界处,这些部位会导致数学算法模型中的一阶导数不连续,所以需要利用图像的阶梯函数,以此来求图像的边缘[5]。用的最多的方法有:Roberts 算子、Sobel 算子、Prewitt 算子和Canny 算子。

由于Canny 算子既用到了一阶导数,也用到了二阶导数,所以它的结果更加精确,因此本文运用Canny 算子对图像边缘进行检测。对于图像处理,先对原图进行灰度处理,然后通过Canny 算子就可以将图片中的物体轮廓较为精准的找出。

运用Canny 算子进行边缘检测,需要符合2个要求:①信噪比;②单位边缘响应。计算算子的零交叉点的平均距离,若该距离满足式①,则单位边缘只存在一个响应[6]。

3 图像处理试验及结果

本文利用OpenCV 提供的图像处理函数来对获得的靶标图像进行处理,先基于mean shift 进行图像分割,然后通过Canny 算子进行边缘检测,得到靶标外轮廓线,最后运用直线检测的方式来分析靶标的曲直,其工作流程如图1所示。

图1 工作流程图

计算技术与自动化2016年6月

第35卷第2期李梅竹等:基于OpenCV精准对靶施药系统视觉模块设计

3.1 基于mean shift 的图像结果

一般而言一副图像的特征点至少可以提取出5 维,即(x,y,r,g,b),众所周知,mean shift 经常用来寻找模态点,即密度最大的点。所以这里同样可以用它来寻找这5 维空间的模态点,由于不同的点最终会收敛到不同的峰值,所以这些点就形成了一类,这样就完成了图像分割的目的,有点聚类的意思在里面。

需要注意的是图像像素的变化范围和坐标的变化范围是不同的,所以在使用窗口对这些数据点进行模态检测时,需要使用不同的窗口半径。因此在OpenCV自带的mean shift分割函数pyrMeanShiftFiltering( )函数中,就专门有2个参数供选择空间搜索窗口半径和颜色窗口搜索半径的。 由函数名pyrMeanShiftFiltering可知,这里是将mean shift算法和图像金字塔相结合用来分割的,所以其参数列表中就有一个专门定义所需金字塔层数的变量。本次试验的主要过程是,首先设置好参数,然后用函数pyrMeanShiftFiltering( )对输入的图像进行分割。分割后的结果保存在该函数的第二个参数即输出图像中,最后根据该分割图像的特点用floodFill( )函数对其分割的结果用不同的颜色进行填充。试验中选取的树干原图如图2(a)、1(b)所示,图像分割后的结果如图3(a)、2(b)所示。

3.2 边缘检测结果

对图像基于mean shift的图像分割后,采用Canny算子进行边缘检测。Canny算法的步骤是①降噪,任何边缘检测算法不可能在未经处理的原始数据上工作,第一步是对原始数据与高斯mask作卷积,得到的图像与原始图像相比有些轻微的模糊。②寻找图像中的亮度梯度。图像中的边缘可能会指向不同的方向,所以Canny算法使用了4个mask检测水平、数值以及对角线方向的边缘。③在图像中跟踪边缘。较高的亮度梯度比较有可能是边缘,但是没有一个确定的值来限定多大的亮度梯度是边缘,所以Canny使用了滞后阈值。上述过程完成可得到一个二值图像。通过Canny算子就可以将图片中树干的轮廓找出,其试验结果如图4所示。从图中可以看出采用OpenCV的Canny算子进行边缘检测可以较为完整的将前景区从背景区域中分离出来,得到比较理想的树干轮廓线,为进一步判断轮廓线的曲直打下基础。3.3 直线检测结果

OpenCV使用霍夫变换函数来进行直线检测。该变换利用点与线的对偶性,通过曲线表达形式,将空间中的曲线转变为一个点,于是,对于原图的曲线检测问题变为在参数空间内寻找峰值的问题。 具体的说,利用直线的参数方程ρ=xcosθ+ysinθ将(x,y)空间中的一个点变成了一条正弦曲线,如果若干个点在一条直线上,那么它们对应的正弦曲线也会交于同一个点。所以检测直线的问题,就转化为了判断交点峰值的问题。设置一个峰值,大于这个值,就判为直线。

需要注意以下几点:首先,HoughLines检测出来的不是线段,而是(ρ,θ)对,使用std vectorlines来存放。其次,由于上面的原因,画线的时候是选一个y(最小为0),求一个x,得到一个点;再选一个y(选为图像的高度)再求一个x得到另一个点,水平方向的线采用同样的方法。这样画出的线贯穿整个图像。

4 结束语

由于在实际葡萄园中,每隔几棵葡萄树就会立一根树桩拉着铁丝牵引葡萄藤,所以在施药时需要区分笔直的树桩和弯曲的葡萄树干。本文主要介绍了基于OpenCV的图像处理方法,并给出了对一棵弯曲的树和一棵笔直的树的基于mean shift的图像分割结果、边缘检测结果以及直线检测结果。实验结果证明该模块设计可有效的区别出葡萄园中弯曲的葡萄树干和笔直的树桩。

参考文献

[1] 于仕琪,刘瑞祯.OpenCV教程(基础篇)[M].北京:北京航空航天出版社,2007.

[2] 景晓军.图像处理技术及其应用[M].北京:国防工业出版社,2005.

[3] 刘慧英,王小波.基于OpenCV的车辆轮廓检测[J].科学技术与工程,2010(12): 2987-2991.

[4] SONG N, GU I Y H, CAO Z, et al. Enhanced spatial-range mean shift color image segmentation by using convergence frequency and position[C]//Prof. of 14th European Signal Processing Conference (EUSIPCO 2006), Florence, Italy. 2006.

篇6

关键词:嵌入式Linux;OpenCV;教室人数统计;椭圆拟合

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2016)28-0187-02

Abstract: in order to let the students understand the remote study room number, starting from the student head characteristics, analysing the characteristics of classroom identification number of technology and shortcomings, based on embedded Linux and OpenCV as soft hardware system. The system adopts the vertical view shooting mode, take the contour extraction and recognition method of ellipse fitting and the number of personnel arrangement of the seating area, seating area. The experiment shows that the system can effectively identify the number of the classroom and analyze the behavior of the students. It has the characteristics of high speed and high accuracy.

Key words: embedded Linux; OpenCV; classroom population statistics; ellipse fitting

随着我国高水平大学的招生人数进一步增加,学生对自习室是否有空位及其排布情况无法便捷获取。随着计算机技术的发展,图像处理技术在解决这个问题越来越显示出它的优点。

文献[1]提取了一种基于网格的模板匹配方法,使用背景减除算法得到运动区域,提取帧图像进行预处理,然后提取特征统计人数。但人体间的相互遮挡而降低了检测精度。文献[2]利用人头和非人头统计特征提出了结合扩展的Haar特征和SVM分类器来检测行人,此方法需花费大量时间收集人头图像样本和训练分类器;

分析总结现有技术的不足,系统采用垂直俯视拍摄方式,使用OpenCV作为函数库,可方便移植于Linux系统,算法简单、鲁棒性强。

1 系统整体架构设计

嵌入式Linux是以Linux内核为基础,根据需要对软、硬件进行裁剪的专用嵌入式系统 [3]。

OpenCV是一个开放源代码的计算机视觉库,使非专业图像处理的工程技术人员应用于图像分割、运动检测等方面[4]。

系统框架分为应用层、库层、Linux内核、硬件层。应用层为教室人数检测应用程序,为C/C++语言编写,包含文中所提的算法。库层上下分别为OpenCV视觉库、OpenCV依赖库、基本c库三层。Linux内核以官网下载的Linux3.4.2内核基础上经过裁剪,加载摄像头、触摸屏、无线网络等模块。系统使用三星四核Cortex-A9构架处理器Exynos 4412,主频为1.5GHZ,内存为1GB DDR3、闪存4GB eMMC,图像处理能力强大。I2C接口连接CMOS摄像头OV7740。

2 人员特征的分析及检测

系统以教室为应用背景,在教室正中心架设摄像头,将整个教室摄入。系统的整体工作流程如图2所示。教室中心正上方的摄像头摄入当前教室图像,从视频中提取视频帧,对视频帧图像经过灰度化、二值化处理、提取轮廓,由于俯视情况下人头部轮廓图可近视为一圆形,通过椭圆拟合,可找到图像中的疑似人头部,再根据拟合椭圆的面积等条件判断是不是头部。由于学生坐在相邻位置时,在进行交谈时头部图像可能发生一部分重叠,当两个人头部图像重叠,提取的头部轮廓将存在拐点。如果椭圆面积大于一个人头部面积的阈值,再进行轮廓有无拐点判断。以拐点为分界点,随机选取疑似头部轮廓起始点到拐点、拐点到疑似头部轮廓终止点至少6个点做椭圆拟合,再根据拟合椭圆面积阈值进行判断是否为人头部。

(1) 图像获取并预处理

系统通过CMOS摄像头模块OV7740摄取当前教室图像。OpenCV通过cvCaptureFromCAM 函数初始化摄像头并从中捕获视频,再调用cvQueyrFrame函数从摄像头捕获的视频中获取并返回一帧图像。系统充分利用教室为应用背景的优势,将教室图像根据桌椅分布进行分块处理,使用cvGetSubRect函数分块图像,保证每一块图像中保留完整的座位。

(2) 图像二值化处理

图像的二值化有利于图像的进一步处理,使图像简单化,而且数据量减小,能凸显出感兴趣的目标的轮廓。其中cvThreshold参数使用最大熵值法求得的最佳阈值。该分割阈值使得图像目标和背景两类的信息熵之和最大[5]。

(3) 椭圆拟合

在进行椭圆拟合时,最常用的方法是最小二乘法。最小二乘法只需6个轮廓点即可拟合椭圆。以下是椭圆方程式:

A+C=1为没有零解的约束条件,用上述方程对边缘检测后的点进行最小二乘法处理

得到一个线性方程组,使用高斯消元法,得到方程式的解[6]。通过OpenCV 中cvFitEllipse函数,对cvFindContours函数提取出storage存储轮廓数据矩阵作椭圆的最佳拟合。图2为椭圆拟合的结果图,在程序中设定椭圆的长轴、短轴及面积的范围,去除不满足条件的椭圆,结果为图b。

图3 (a)为两学生在座位上交谈的情景。针对这种情况,拟合椭圆设定面积为单头像拟合椭圆面积的1.7~2.0倍。当满足此条件时遍历此轮廓数据矩阵(如图3(c)),找到x轴坐标相差不大,y轴坐标相差最小的A、B,这两点为此轮廓的拐点,再分别于轮廓起点、终点二次椭圆拟合。则可确定为两人头像遮盖的情况。

3 实验结果及分析

系统以某一实验楼大厅为实验对象进行试验,在二楼用摄像头垂直录制行人在大厅行走的场景,与安装在教室中心拍摄学生图像情况基本一致。图4为检测图。

座位区实验结果如表1所示,通过大量实验表明,对比其他方法,垂直俯视拍摄减小了人头部相互遮挡的情况,具有较高的准确性。程序检测及统计响应时间迅速,完全符合实时应用的要求。

4 结束语

论文在OpenCV图像处理函数库的基础上运用图像二值化、轮廓提取和椭圆拟合等图像处理技术,结合嵌入式Linux技术和视频采集技术,以自习室为应用背景,识别自习室学生人数、坐标和活动情况。总结系统特点,主要有以下3个方面:基于嵌入式Linux,具有较强的实用性、实时性;以自习室为应用背景且采用垂直俯视方式采集图像,最大限度地减小了学生之间相互遮挡的情况,能准确获取学生信息;使用OpenCV中函数对图像进行预处理、二值化和椭圆拟合,大大减小程序的复杂度和工作量。

参考文献 :

[1]Jun Wei Hsieh, Cheng Shuang Peng,Kao Chin Fan.Grid-based Template Matching for People Counting[C].Multimedia Signal Processing,2007. MMSP 2007. IEEE 9th Workshop,1-3 Oct. 2007: 316-319.

[2]Celik T,Seyin O H,Demirel H.Fire pixel classification using fuzzy logic and statistical color model[C]//IC2007.New York:IEEE,2007:1207-1208.

[3]毛德操,胡希明.嵌入式系统[M].浙江大学出版社,2003.

[4]刘瑞祯,于仕琪.OpenCV教程一基础篇[M].北京航空航天大学出版社,2007.

[5]杨召君.基于视频人数统计与跟踪改进算法的研究与实现[D].南京邮电大学,2013.

[6]苏娟. 基于视频监控的教室人数统计[D].安徽大学,2014.

篇7

关键词:三维重构;钻孔数据;轮廓线;三维矿体模型;矿体体积

中图分类号:TP274文献标识码:A文章编号:1009-3044(2011)14-3352-05

Design and Implementation on the 3D Orebody Reconstruction System Based on the Drilling Data

LIU Gang, YUAN Ji-wu, LI Lei

(SINOPEC Research Institute of Safety Engineering, Qingdao 266071, China)

Abstract: Through studying the technical characteristics of the 3D orebody reconstruction, the thesis puts forward the design methods for constructing the system of 3D orebody reconstruction based on the drilling data. The paper emphatically discussed several questions, including the methods disposing 2D drilling data, data structure of the 3D orebody model and the calculational methods for orebody volume, etc. It also presents the algorithm flow of the 3D orebody reconstruction. Finally, the program on the 3D orebody reconstruction is completed.

Key words: 3D reconstruction; drilling data; contour lines; 3D orebody model; orebody volume

随着计算机技术在采矿业的不断应用,采矿业正由经验型、传统型向科学型、定量分析与处理、自动化方向发展。矿业图件的生成与处理是矿山设计工作的重要内容,传统手工绘制的以及国内应用CAD系统绘制的图形大部分是二维平面图,用二维的图件来描述三维空间的矿体,可视性差且缺乏立体感,容易产生误解,并且难于向非专业技术人员展示自己的设计结果[1]。因此,以二维化的剖面采样数据为基础,通过三维重构技术来构建矿体的三维可视化模型并对其进行可视化的定量分析与处理,已经成为矿业数字化的一个重要发展方向。重构后的矿体三维可视化模型不但能够很好地模拟矿体形态,用于计算体积、品味等重要数据,而且可视化模型一旦形成,便可以对其进行任意剖切、投影以及浏览,并可随时根据需要制作相应的三维工程图,从而极大地提高矿山设计的速度与质量[2]。

1 基本问题描述

1.1 三维重构的意义

许多学科领域都需要收集和使用各种海量数据信息,如卫星发回的地球资源数据、气象数据、海洋和地壳板块及地震监测数据、医学扫描图象数据等。在通过各种测量方法获得这些海量数据之后,人们更期望能将这些数据以三维图形或图象的方式表示出来,以使那些原本抽象、难以理解的原理和规律变得更加直观。三维重构技术就是一种能将原始的海量数据以三维图形的方式表示出来的技术。

通过使用各种测量设备(如传感器),计算机能够获得外部世界中物体的各种信息,这些信息被称之为采样数据,三维重构的任务就是从获取的采样数据中恢复物体的三维结构,即物体的原型。不同领域中所用的测量设备不同,所得的数据种类也不同并且重构的目标也不一样,因此重构的方法也多种多样。在立体视觉中通过摄像机可以获得周围环境的光强信号,重构的含义是从不同角度拍摄的图像重构三维物体[3],重构的关键在于解决好图像匹配问题。从激光扫描测距仪获取的是景物的深度信息[4],从距离图像重构三维物体关键在于确定三维点之间的拓扑关系,然后选择适当的数学描述工具如参数曲面、三角面片、多面体等拟和这组点。在医学领域,通过各种医学设备可以得到人体内部的一组断层图像,其灰度代表生物组织的某种物理属性,不同的生物组织或器官具有不同的物理属性,所以在图像中表现为灰度,因此要从图像重构器官或者生物组织的三维结构首先要确定它们的边界,即对原始图像进行分割[5],然后用三角形或者多边形来拟和生物组织或者器官的表面[6]。尽管上述方法各有不同,但是都是试图从有限离散采样点中恢复完整连续的物体模型。只有通过重构物体的三维模型,才能够对它们进行定性或者定量的分析,才能够区别离散数据中的各个物体。因此,三维重构在可视化、计算机视觉、模式识别中占有重要的地位,也是模拟仿真和决策系统中必不可少的组成部分。

1.2 三维重构技术概述

在实际应用中,人们面对的往往并不是直接的体数据信息,而是一序列的二维轮廓线数据。由序列二维轮廓数据重构三维形体是当前三维重构技术研究的一个大的方向。在这里,轮廓线代表着一个物体对象表面与一系列切平面的交线,该方法首先获取轮廓线数据,然后再进行3D曲面重构,如图1所示。

一个断层上的轮廓组可以来自一个物体对象或多个物体对象,一个非凸的物体对象在某个断层截面上可以有多个轮廓。在此情况下,相邻两个断层之间的轮廓线便会出现一对一、一对多、多对多、末端以及连通分叉五种连接方式[7]。其中,一对一连接仅需解决相邻两层轮廓线之间的拼接问题;一对多连接首先需要解决轮廓线之间的分支问题,将一对多连接简化为多个一对一连接,然后再进行一对一轮廓线之间的拼接;多对多连接则首先需要解决轮廓线之间的对应问题,将多对多连接简化为多个一对一与多个一对多连接的组合,然后再进行相应的分支处理,最后进行轮廓线之间的拼接。

综上所述,基于轮廓的三维形体重构过程可以分解为四个子问题,即轮廓拼接问题、轮廓分支问题、轮廓对应问题和曲面拟合问题[8],如图2所示[9]。

1.3 矿体三维重构的技术特点

与目前三维重构技术应用较完善的医学图形等应用领域不同,矿体三维重构具有许多自身特点。首先,真实矿体的地质形态往往复杂多变且随意性较大,无明显规律可寻;其次,矿体重构以剖面图、中段平面图、钻孔及坑道等测量数据为采样数据,这些数据在不经过特殊处理的情况下将无法直接用于矿体重构;再次,真实矿体地质形态的复杂性,决定了由此产生的平行轮廓线之间的重合度往往非常小;最后,由于地质测量的特殊性,由钻孔剖面数据得出的平行轮廓线之间的距离往往非常大,导致两条轮廓线之间的矿体形态难以准确表达。

2 矿体二维剖面数据的处理

用于三维矿体重构的原始数据主要来自矿山提供的各类剖面图、中段平面图、钻孔及坑道测量编录资料,在对这些勘测线以及各类剖面图进行单层的二维圈矿处理后便可以得到人们所需要的断层轮廓数据。然而,由此得出的数据仍然与真正意义上的断层轮廓数据有很大的出入。首先,矿体的钻孔剖面具有很大的空间随意性,它可能不平行于X-Y平面、X-Z平面与Y-Z平面中的任何一个,也就是说,这些剖面的法向量可能指向空间的任何位置,且各个剖面的法向量所指方向也可能各不相同。其次,同一个轮廓线上的各个顶点往往并不在同一个平面上。再次,矿体剖面数据中的X、Y值通常代表大地物理坐标值,其数值往往很大,而Z值则代表深度值,与X、Y值相比可能要小得多。由于矿体剖面数据的上述特点,决定了在进行矿体三维重构之前必须对这些不规范的数据进行严格处理,将其转化为真正意义上的断层轮廓数据。

处理不规范的矿体剖面数据的过程包括平移、旋转等[10-11],图3所示,具体过程如下:

1) 平移坐标轴:求出矿体中心点的坐标值,平移三维坐标轴使原点与矿体中心点重合,将矿体中心点定义为新的坐标原点;

2) 旋转坐标轴:求出矿体各个剖面的法向量并由此计算矿体的平均法向量,求出该法向量与X、Y、Z轴的夹角大小,绕X轴将该法向量旋转至X-Z平面上,再绕Y轴将该法向量旋转至Z-Y平面上,最终使其与Z轴重合。

3 系统设计与实现

3.1 模型数据结构的设计

构建矿体的三维可视化模型,首先应建立矿体的表面模型,再在表面模型的基础上建立矿体的体块模型和品位模型。针对上述模型构建过程,矿体三维重构系统的数据结构应包括如下内容:

1) 在建立矿体表面模型之前,需要对断层数据、轮廓数据以及轮廓线顶点数据进行相应处理。其中,断层数据包括断层总数、断层内的轮廓线索引值以及断层Z坐标值等内容;轮廓数据包括轮廓总数、轮廓顶点总数、顶点索引值以及其他与处理轮廓密切相关的数据;轮廓线顶点数据则包括顶点的X、Y、Z坐标值等信息。

2) 在表面模型的构建过程中,则需要对三角面片数据、连接边数据进行处理。其中,三角面片数据包括三角面三个顶点的索引值等内容;连接边数据则包括边的两个顶点的索引值、共享该边的两个三角面的索引值等,边数据主要应用于表面模型构建完成后的局部信息的人工修改。

3) 在体块模型的构建过程中,需要对体数据进行处理,体数据包括组成该体块的三角面片数据等。

3.2 矿体三维重构的算法流程

通过对矿体三维重构处理过程进行分析,可将其划分为5个处理阶段,分别是:二维矿体数据读取阶段、三维矿体表面重构阶段、矿体体数据生成阶段、数据处理阶段与矿体三维数据保存阶段,其具体的算法流程如图4所示。

3.3 矿体体积计算

矿体经过三维重构首先生成以三角面为基础的表面模型,然后再在表面模型的基础上生成体数据,体数据生成后,便可以对矿体体积进行计算。本文参考三角区域累加计算的方法求取体积[12-13]。

首先,将不规则的形体分解为若干个较小的规则体元;然后,分别计算各个小体元的体积;最后,将所有体元的体积累加起来便得到整个形体的体积。这里所指的规则体元如图5所示。三种规则体元的体积计算公式分别为:1) V=s×h;2) V=(s×h)/3;3) V= 2×(s×h)/3。其中,s为底面三角形的面积,h为体元的高。

规则体元的生成原则是:

1) 上断层平面上的表面三角形向下断层投影,在下断层上生成一个投影三角形,两个三角形对应顶点连线即生成图5中的(a)体元;

2) 上、下断层之间的表面三角形由位于上断层上的顶点向下断层投影,在下断层上生成一个投影三角形。如果上断层含有1个顶点,连接该顶点及其投影顶点便可生成图5中的(b)体元;如果上断层含有2个顶点,分别连接这两个顶点及其投影顶点则生成图5中的(c)体元。

求取规则体元的体积也应遵循一定的规则,即如果三角形的法线方向与投影方向相反,则由该三角形生成的规则体元的体积为正,否则,相应的规则体元的体积为负。如图6所示,三角形P3P4A是上轮廓多边形进行平面三角剖分后得出的一个三角形,它的平面法向量为S1,其在下轮廓平面上的投影三角形为P’3P’4A’,两个三角形之间的部分为规则体元T1;三角形Q6Q7B是下轮廓多边形进行平面三角剖分后得出的一个三角形,它的平面法向量为S2,投影高度为0;三角形P2Q2Q3是连接上、下两条轮廓线的一个三角面片,它的平面法向量为S3,其在下轮廓平面上的投影三角形为P’2Q2Q3,两个三角形之间的部分为规则体元T2;三角形P6Q8Q9也是连接上、下轮廓线的一个三角面片,它的平面法向量为S4,其在下轮廓平面上的投影三角形为P6 Q’8Q’9,两个三角形之间的部分为规则体元T3。由于S1方向向上(与投影方向相反),故规则体元T1的体积为正;因三角形Q6Q7B的投影高度为0,故体积为0;因S3方向向上(与投影方向相反),故规则体元T2的体积为正;S4方向向下(与投影方向相同),故规则体元T4的体积为负。综上所述,四个规则体元的体积之和为V=VT1+VT2-VT3。

经过上述各步处理,最终可求得各个规则体元的体积,将这些规则体元的体积加在一起,其和即为所求形体(矿体)的体积。

4 实验结果

本文以Visual Basic 6.0、OpenGL等作为开发工具,完成了矿体三维重构系统的设计工作,图7给出了系统设计界面,并以两层剖面图为例生成矿体表面模型。图8给出了某铁矿的应用实例,该铁矿属鞍山式贫磁铁矿(沉积变质类型),矿体比较复杂。图9给出了某金矿的应用实例,该金矿为蚀变岩型大型金矿床,主要工业矿体隐伏于地下,埋藏深、品位低、水平厚度大,一般水平厚度达20m以上,最厚达100m以上,但矿体连续性好,局部有分枝复合现象,矿体呈缓倾斜产出,倾角18°~51°。通过与已知的实际矿体结构比较,图8、图9中生成的三维矿体模型基本反映了上述区域内矿体的分布情况。

5 结束语

从一组采样数据中重建物体的三维实体是人类观察和分析客观事物的重要手段。以三维重构技术为载体,通过二维化的剖面采样数据来构建矿体的三维可视化模型并对其进行可视化的定量分析与处理,早已成为矿业数字化的一个重要发展方向。在不远的将来,随着钻孔采样、中间插值、拼接算法等相关技术的不断发展,矿体三维重构也必将在矿业数字化的道路上愈行愈远。

参考文献:

[1] 吴立新.论21世纪的矿山――数字矿山[J].煤炭学报,2000(4).

[2] 南格利.矿体线框模型及其建立方法[J].有色矿山,2001(5).

[3] Ballard D H,Brown C puter Vision[M].Prentice-Hall,1982.

[4] Schmitt F,Chen X,Du W H.Geometric modeling from range image data[J].EROGRAPHICS,1991:57-62.

[5] Liang Z.Tissue classification and segmentation of MR images[J].IEEE Engineer in Medicine and Biology,1993,12(1):81-85.

[6] Fuchs H,Kedem Z M,Uselton S P.Optimal Surface Reconstruction from Planar Contour[J].Communication of the ACM,1977,20(10):693-702.

[7] Oliva J M,Perrin M,Coquillart S.3D reconstruction of complex polyhedral shapes from contours using a simplified generalized Voronoi diagram[J].EUROGRAPHICS,1996,15(3):397-408.

[8] Meyers D,Skinner S,Sloan K.Surface from contours[J].ACM Transaction on Graphics,1992,2(3):228-258.

[9] Meyers D.Reconstruction of Surfaces from Planar Contours[D].PhD.Thesis,University of Washington,1994.

[10] 孙家广.计算机图形学[M].3版.北京:清华大学出版社,1998.

[11] 唐荣锡,汪嘉业,彭群生,等.计算机图形学教程[M].北京:科学出版社,2000.

[12] 王贤文,王秀美,洪源,等.计算机辅助测量料堆体积的三角区域法[J].北京科技大学学报,2002,24(3):369-371.

篇8

信息化是形成注册会计师行业发展新动能的重要力量,是实现行业跨越式发展的重要引领。自“十二五”期间将信息化确定为行业发展战略以来,在《中国注册会计师行业信息化建设总体方案》《注册会计师行业信息化建设规划(2016-2020年)》《注册会计师行业信息化建设规划(2021-2025年)》等宏观政策的引领下,注册会计师行业信息化建设取得了显著成效。随着行业信息化建设的不断深入,大数据、人工智能、移动互联、云计算、物联网和区块链等新兴技术不断应用到审计实务中(舒惠好等,2021),注册会计师的信息化专业能力短板却日益突显(张敏,2020;应里孟和阳杰,2020;舒惠好等,2021),这显著降低了行业信息化建设的成效。虽然中国注册会计师协会于2007年印发的《中国注册会计师胜任能力指南》明确了信息技术在注册会计师胜任能力框架中的重要地位,但《中国注册会计师胜任能力指南》仅仅是导向性的,在信息化层面缺乏可操作性。基于此,本文重点探讨在行业信息化背景下注册会计师需要具备的各种素质和能力,揭示当前注册会计师信息化专业能力存在的主要短板,探讨如何提高注册会计师信息化执业能力,以期弥合期望差距,提高审计质量,促进行业高质量发展。深入研究注册会计师信息化专业能力具有重大意义。(1)深入研究注册会计师信息化专业能力是贯彻落实〔2021〕30号文件的重要举措。2021年7月30日,国务院办公厅印发《关于进一步规范财务审计秩序促进注册会计师行业健康发展的意见》(〔2021〕30号),明确提出“加强注册会计师专业培训教育。创新继续教育方式,围绕专业胜任能力、职业技能、职业价值、职业道德等重点,丰富完善教育内容。”深入研究注册会计师信息化专业能力建设相关问题,有助于丰富完善专业胜任能力、职业技能、职业价值、职业道德等重点的教育内容,可以为加强注册会计师专业培训教育指明方向和明确路径。(2)深入研究注册会计师信息化专业能力是提高审计质量的必由之路。根据DeAngelo(1980)对审计质量的经典定义,即审计质量是市场评估的注册会计师发现并报告财务报告存在错报或漏报的联合概率,审计质量取决于注册会计师的专业胜任能力和独立性,在信息化环境下,注册会计师的信息化专业能力是影响审计质量的关键因素,深入研究注册会计师信息化专业能力有助于提高信息化环境下的审计质量。(3)深入研究注册会计师信息化专业能力是塑造会计师事务所品牌的重要基础。《注册会计师行业发展规划(2021—2025年)》明确提出将“行业品牌化建设取得新成效”作为今后五年行业发展要努力实现的主要目标之一。众所周知,审计质量塑造事务所品牌,行业品牌化建设的关键是提高审计质量,提高审计质量的基础是提高注册会计师的专业胜任能力和独立性,深入研究探讨注册会计师信息化专业能力的框架、短板、提升路径和策略有助于提高注册会计师的专业胜任能力,为实现“行业品牌化建设取得新成效”的奋斗目标打下坚实的基础。

二、当前注册会计师信息化专业能力的现状分析

(一)注册会计师信息技术专业知识比较薄弱

根据作者对所在单位注册会计师信息技术专业知识情况的调查研究,目前的注册会计师普遍存在信息技术专业知识比较薄弱的问题,具体表现为注册会计师所掌握的专业知识主要局限于Office办公软件等传统信息技术知识,而对“大智移云物区”等新兴信息技术专业知识“知其然,而不知其所以然”,缺乏必要的理论知识储备。目前注册会计师获取信息技术专业知识的渠道主要来自职业继续教育。虽然行业协会和大部分会计师事务所的继续教育培训对新兴信息技术专业知识有所涉及,但仍主要停留在电子表格使用培训,面对高度信息化环境下的海量数据采集,注册会计师普遍缺乏必要的知识储备。

(二)注册会计师信息技术职业技能有待提升

注册会计师普遍存在信息技术职业技能有待提升的问题,具体表现为注册会计师的新兴信息技术职业技能不熟练,对新兴信息技术应用的参与度较低。一方面,作为一个人员流动性比较高的行业,会计师事务所除了每年通过校园招聘大批量的毕业生外,还会通过社会招聘从其他相关机构招聘一批专业人员。这些新入职的员工没有使用本所审计系统的经验。新员工学习软件过程除了观看视频培训教程,主要依靠项目实战摸索,这大大降低了员工使用软件的效率。同时较高的员工流动率导致审计作业系统用户一直都有一定比例的新用户,降低了审计软件使用效率。另一方面,每年审计作业系统改造需求主要来自于信息化部门运维收集到的用户问题修复、专业标准部分和质量控制部门每年修订质量控制制度的管理需要,以及业务部门的员工访谈。但每次访谈业务部员工使用需求,收到建设性建议较少。审计人员或者对信息化建设缺乏参与热情,或者是缺乏足够的信息化能力,提不出建设性意见,这使得软件改进成效存在一定的折扣。

(三)注册会计师信息技术职业道德意识不强

注册会计师普遍存在信息技术职业道德意识不强的问题,具体表现为对信息系统相关道德困境、数据管理相关道德困境和职业道德物化困境了解不足、重视不够。其中,信息系统相关道德困境是指注册会计师在信息系统设计和运行中的违规违法操作行为或其他不道德行为,导致数据保密和数据安全责任不能履行以及其他不道德行为的发生。数据管理相关道德困境是指注册会计师的数据采集、存储、分析以及输出行为危机客户的数据保密和数据安全,或导致其他不道德行为的发生。职业道德物化困境是指拥有自由意志或自主能力的信息化系统违反审计职业道德规范的行为,或导致其他不道德行为的发生。新兴信息技术在审计领域的广泛应用,使得注册会计师从基础工作中解放出来,也让注册会计师面临更加复杂的道德困境。然而,大部分会计师事务所在聚焦新兴信息技术的应用问题时,忽视了相关的职业道德教育,使得注册会计师普遍表现出信息技术职业道德意识不强。

三、提升注册会计师信息化专业能力的对策建议

(一)构建注册会计师信息化专业能力框架

根据中国注册会计师协会2019年6-12月对注册会计师行业信息化建设的最新调研结果,会计师事务所认为将对行业发展产生重大影响的信息技术依次是大数据(41.6%)、人工智能(39.3%)、云计算(18.1%)、物联网(4.9%)、区块链(3.5%)和其他(0.4%)。其中,大数据和人工智能在注册会计师审计领域的应用最为广泛。基于对审计实务的调研和相关学术研究,大数据审计技术大体上可以分为大数据智能分析技术、大数据可视化分析技术和大数据多数据源综合分析技术三类。其中,大数据智能分析技术包括自然语言处理技术、社会网络分析技术和图形数据库技术等。大数据可视化分析技术包括标签云分析、散点图分析、条形图分析、折线图分析、直方图分析、气泡图分析、小提琴图分析和热力图分析等。大数据多数据源综合分析技术是通过采集各种可获取的数据,采用大数据技术方法进行数据分析,从而发现审计线索的技术。常用的大数据审计工具有R语言、Python和Tableau。基于对审计实务的调研和相关学术研究,人工智能审计技术大体上可以分为机器学习、计算机视觉、虚拟、自然语言处理和认知计算等(吴勇等,2021)。在率先应用人工智能审计的领域,四大会计师事务所都是与专业机构合作推出可供注册会计师应用的审计产品,注册会计师通常无需参与审计产品的开发设计。因此,人工智能审计对注册会计师信息化专业能力要求相对较低。相比而言,注册会计师在大数据审计中不仅需要具备大数据审计思维,还需要掌握一定的大数据审计技术。因此,大数据审计对注册会计师信息化专业能力要求更高。基于此,本文主要基于大数据审计技术探讨注册会计师信息化专业能力框架。基于《中国注册会计师胜任能力指南》构建的中国注册会计师胜任能力框架,本文将从信息技术专业知识、信息技术职业技能和信息技术职业道德三个方面构建注册会计师的信息化专业能力框架,如图1所示。其中,信息技术专业知识应当在原有学科领域的基础上增加新兴技术学科领域,比如大数据、人工智能、移图1注册会计师信息化专业能力框架图动互联网、云计算、物联网和区块链等相关的知识。信息技术职业技能应当在原有技术和应用技能的基础上增加新兴技术学科领域的应用技术和应用技能,比如注册会计师应当掌握大数据审计常用的R语言、Python和Tableau等信息化工具。信息技术职业道德应当在原有职业价值观、道德和态度的基础上增加信息系统、数据管理和职业道德物化等方面的职业道德教育。

(二)改革创新学历教育

1.改革创新学历教育的课程体系。目前的学历教育课程体系难以培养出行业信息化建设所需的人才。目前会计专业开设的相关信息技术知识、技术和道德已经无法满足新时代审计工作的需要。具体表现为:一是信息技术专业知识较为陈旧,并未新增大数据审计、人工智能审计等新兴技术;二是课程所涉及的信息技术职业技能较为落后,仍局限于Office办公软件等传统信息技术;三是新兴信息技术职业道德教育缺失,并不涉及新兴技术相关的职业道德教育,仍局限于传统的审计职业道德教育。学历教育阶段应当遵循科学的课程体系设计逻辑,可以从以下三个方面改革创新学历教育的课程体系:首先要更新信息技术专业知识,新增大数据审计、人工智能审计等新兴技术专业知识;其次要开设信息技术职业技能课程,比如R语言、Python和Tableau等信息化工具应用课程;最后要加强新兴信息技术职业道德教育,在审计职业道德相关的课程中新增新兴技术相关的职业道德教育内容。2.改革创新学历教育的培养模式。目前的学历教育培养模式几乎全部依赖自有师资力量、自编课堂教材,普遍存在理论与实务脱钩的现象,人才培养不能满足行业信息化建设的需求。建议采用产学研相结合的培养模式,遵循“理论源于实务,理论指导实务,理论高于实务”的科学理念,将理论与实务融合在一起。具体而言,高等院校可以在学历教育的人才培养过程中引入信息化实务导师,可以与会计师事务所开展联合培养,根据学生的择业选择以及会计师事务所的用人需求开展有针对性的学历教育。

(三)完善职业继续教育

1.完善会计师事务所内部职业继续教育。会计师事务所是高智力的学习型组织,每年均会对员工开展财务会计审计等各种专业知识的培训,为提升审计人员的信息化水平和使用能力,应加强和改进培训工作,如:在内部培训中增加有关信息化方面的培训内容;从外部聘请信息化方面的专家开展培训工作;从现有员工中选拔更多优秀的、具有培养前途的员工参加外部各种信息化培训、学历教育和信息化审计项目实务锻炼等。同时,对现有的信息化审计人员也要开展财务会计审计相关知识的培训,使目前的信息化审计人员理解和掌握更多财务审计知识,成为精通财务的信息化审计人才。2.完善注册会计师行业的职业继续教育。行业协会要创新职业继续教育的方式和方法,围绕信息化专业能力的专业知识、职业技能和职业道德等重点,丰富完善相关教育内容。充分利用信息技术手段,上线职业继续教育相关应用,切实提高职业继续教育的培训效果,持续保持和强化注册会计师信息化专业能力和职业道德操守。

(四)深化行业监管改革