数字图像处理综述范文

导语：如何才能写好一篇数字图像处理综述，这就需要搜集整理更多的资料和文献，欢迎阅读由公务员之家整理的十篇范文，供你借鉴。

数字图像处理综述

篇1

【关键词】：数字图像处理；实验；创新

【引言】：数字图像处理是一门迅速发展的新兴学科，发展的历史并不长。由于图像是视觉的基础，而视觉又是人类重要的感知手段，故数字图像成为心理学、生理学、计算机科学等诸多方面学者研究视觉感知的有效工具【1】。“数字图像处理”是高校电子信息类本科生的重要专业课，在信号处理系列课程中扮演重要角色，它的任务是为相关硕士博士点培养专业研究人才打下坚实基础，它是一门理论性和实践性都很强的课程，如何培养学生扎实的专业理论基础和实践创新能力，成为一个亟待研究的课题。

1 “数字图像处理”课程的教学体系结构

“数字图像处理”课程的前置课程除了“高等数学”等公共基础课，还包括信息与通信工程学科方向的“信号与系统”、“数字信号处理”、“信息论与编码”等专业基础课。瑞典布莱金格理工学院对这些前置课程与学生的接受能力之间的关系M行了研究[2]。通过本课程数字图像及成像基础、二维数字信号处理基本理论、灰度及彩色图像压缩、增强、分割等基本处理算法的学习，学生熟悉并掌握数字图像处理方面的基本知识、基本理论和基本技能，重点掌握基于图像变换理论的图像增强、图像压缩和图像分割等处理算法，它为深入学习数字图像处理及其在专业中的应用打下了基础。在教学实践中，我们将“数字图像处理”的教学体系结构分为三个模块[5-6]：1）绪论部分：这一部分主要介绍数字图像处理的发展历史、研究内容和基本概念，力争帮助同学把握学科发展沿革和应用方向，了解整体架构，建立研究和实践的兴趣。2）理论部分：按照空域处理（包括直方图、点处理、代数处理、几何处理）、频域处理（傅立叶等离散正交变换、滤波器处理）、统计模型方法的顺序进行讲解。在这一部分，我们遵循系统深入的原则，基于图像处理的例子，帮助学生系统复结并领会各种理论方法之间的逻辑顺序与本质。由于图像处理具有理论性和可视化强的特点，在这个部分教学中，我们希望加强学生对前置课程所学基本理论和方法的深入理解，使其充分认识理论知识在实际应用中的指导意

义，并体会理论本身的魅力。3）应用部分：在这一部分教学中，我们充分发挥图像处理应用性强的特点，选择基础性和典型性强的图像压缩、图像增强、边缘提取与图像分割、图像特征提取等应用，重点讲述应用基础理论和方法解决实际问题的常用系统与方法，进一步训练同学的动手实践能力，激发学生学习兴趣【3】。

2、实验实践教学体系特点：

2.1从基础的电子电路和集成电路的分析、设计和测试等“微观”视角入手，不断递进推广到包含完整的通信网络等“宏观”视角，使得学生可以建立起完整的信息与通信知识体系，了解本学科领域的最新前沿技术【4】。

2.2从相对独立的电路、器件、芯片等“点”入手，到电磁场与微波、无线、光纤和卫星等“线”为脉络，再推广网络与交换、多媒体通信、广播电视和传感网等“面”的体系，构建了完整的“点-线-面”结构和具有“全程全网”特色现代信息通信网络实验环境【5】。

3、分组实验

实验是数字图像处理课程必修的环节，实验阶段学生要完成两个内容：综述报告和编程实验。在综述报告部分，教师根据图像处理的发展前沿和应用领域给出综述报告的题目，学生也可根据自己感兴趣的领域自拟题目；对于编程实验，各组根据实验任务书的内容完成相应的任务要求【6】。这两个实验内容学生是以组为单位完成的，各组由组长负责根据各自的情况完成实验任务的分工。由于实验课时数的限制，大部分实验任务是学生在课下时间完成的。

结语

实验教学在具体实施过程中仍有诸多问题有待解决，如指导老师工作量的认定，学生提交作品创新程度的鉴定等。开展创新型实验对于学生和老师都是一个新的挑战，只有对教学实践进行改革，选择适当的实验内容，有组织地执行预定实验计划，才能探索出一条适合从教学向教学研究过渡的实践教学体系。

【参考文献】：

[1]于猛，单亦先. 构建完善的实践教学体系[J]. 实验室研究与探索，2009， 28（ 5）： 126-128， 139.

[2]潘清林，黄继武，徐国富，等.材料科学与工程实验教学中心的改革与实践[J].实验室研究与探索，2009，28（1）：108-111.

[3]叶国荣，陈达强. 高校本科生教育中研究型教学模式探讨[J]. 中国高教研究， 2009（ 3）： 90-91.

[4] 卢德馨. 关于研究型教学的进一步探讨[J]. 中国高等教育， 2004（ 21）： 24-24.

篇2

针对培养学生应用型研究能力的目标，我们在教学方法设计上本着激发学生的学习兴趣，开阔学生眼界，给学生提供更自由的思考空间的原则，通过下面两个措施来实现我们的目标。

1.1精心选择案例

选择的案例要贴近实际生活，并与课堂上讲授的方法紧密衔接。例如，在讲解图像增强和复原这两章之后，我们引入在实际生活中常见的“图像去雾”问题，通过如下方法，培养学生研究能力。

（1）要求学生先尝试用学过的算法来解决这个问题，并在课堂进行算法讨论，给出算法结果。

（2）要求学生针对具体问题，查阅文献资料，了解别人的解决方法。通过查阅国内外的文献资料，同学们知道了如何根据关键词查询科研论文，了解哪些电子数据库中有与专业相关资料，知道了文献的级别有SCI、EI、核心期刊、一般期刊等。

（3）学生将查到的算法进行分类和总结，撰写文献综述。

（4）每位学生都需要编程实现“图像去雾”算法，这个算法是结合自己的思考、实践以及查阅文献的结果。通过自己动手，同学们发现如果图像的清晰度不好，有噪声，或者没有归一化，结果就完全不同。通过自己动手验证，同学们会发现图像处理领域的一个最为重要的特点——任何算法主要都是针对一类图像或是针对一类问题而设计的，因此在算法的适应性上需要有所考虑。

1.2全面介绍图像处理的各个应用领域

老师在课堂上介绍几个图像处理涉及的较为重要的应用方向（如视频监控、图像检索、人脸识别、运动检测、车牌检测等）后，将同学们进行分组，每组负责查找一个应用方向的相关资料，讨论和汇报自学的结果。汇报内容主要包括：①应用方向的介绍；②涉及的主要问题；③目前的解决方法及应用成果。通过查找文献，同学们不仅对课上学习过的经典算法有进一步了解，同时还接触到很多新算法。通过听取各组汇报，同学们在较短的时间里，了解了图像处理涉及的多个主要的应用领域。针对每个应用研究领域，老师引导学生分析该领域的难点和重点，提出问题，再让学生思考解决方案，没有标准答案，只希望能够锻炼学生的思考能力。以“人脸识别”为例，有很多经典的或较新颖的算法，老师会结合应用领域对其中常用的或比较重要的算法，如PCA方法和Adaboost算法，进行详细讲解，使学生全面了解图像处理算法的应用领域。

2数字图像处理实验内容设计

针对培养学生的应用技术能力的目标，同时考虑到本课程实验学时数较少，我们设计了两个实验——基础性实验和综合性实验。

2.1基础性实验

目前很多经典的图像处理算法是用VC++程序实现的，我们要求大家学会读程序，能够看懂已有的算法实现程序，并在此基础上能开发新的功能。实验一：实现对多种图像格式的支持（2学时）实验内容：采用VC++编码实现，基于CDib类，添加支持打开，并保存多种图像格式的功能，包括JPEG和GIF。实验要求：利用学习的图像压缩的知识，利用现有的编码解码库实现对JPEG和GIF图像的打开和保存。实验目的：了解多种图像格式，编写针对多种图像格式的读写程序，能够进一步理解针对图像的编程的特点，同时也进一步了解开发图像应用程序的适应性问题。

老师在课程初期会向大家介绍图像处理的一个公开库——CDib类。该类很好地封装了图像的数据结构，涉及很多图像的基本操作。我们知道现实生活中的图像常常都是压缩格式的，如BMP、JPEG、PNG、GIF等。因此在讲完图像的压缩格式后，对照讲过的BMP图像结构，老师要求学生为CDib类添加能够支持多种图像格式的功能。以GIF图像为例，它不同于如JPEG、PNG等格式，GIF采用的是LZW压缩算法，使用的是无损压缩技术。GIF图像的特点是可以一次压缩多幅图像，图像颜色表控制为256色，使用渐显方式。

3.2综合性实验

针对综合性实验，我们会拟定多个题目让学生选择，如树叶提取、花朵提取、车牌识别等。实验二：数字号码图像的识别（6学时）实验内容：采用VC++编码实现，基于CDib类，针对数字号码图像，识别出数字，给出文本显示结果。实验要求：将该题目进行分解，划分任务；组内每个同学负责一部分任务的编程工作；每个人针对自己负责的工作至少提供两种实现方法，并放入整个项目流程中验证这两种方法的有效性；最后总结出两种方法的异同以及适应的范围。实验目的：考查学生对数字图像处理应用中每个步骤的掌握程度和项目合作沟通能力。上述实验涉及以下几个步骤。①图像的预处理；②图像的分割；③图像的特征提取；④图像的分类。组中每个学生负责一个步骤，所有步骤都需要尽心设计，这样整体的效果才可能最好。同时大家需要协商各自负责模块的入口和出口的数据结构，保证数据能够在模块之间顺利流转。这种协商和分工合作的能力是软件工程专业最需要的技术能力之一。

以“数字号码图像识别”为例，该题目可以分割成4个步骤：预处理、数字图像切分、数字图像特征提取和数字识别。在每个步骤中都有分别需要注意的问题，如在预处理阶段，需要对图像进行去噪声，增强对比度，甚至需要进行膨胀和腐蚀将图像中断裂的数字部分连通起来；在数字图像切分阶段需要制定适应性广泛的切分策略来应对各种情况，如数字排列可以呈现任意的倾斜角度，或数字字符相连等；在数字图像特征提取阶段，我们可以考察每个数字图像的自相关系数特征，或者每个数字图像的频谱特征，也可以考察数字图像的几何拓扑特征，如将数字图像分成2个洞的（8），1个洞的(4，6，9，0），没有洞的（1，2，3，5，7），针对每个类别再提取新的几何特征；在数字图像识别阶段，可以采用神经网络的分类器，或者利用制定的一些分类策略来分类，或者采用主成份分析（PCA）的方法来识别。

4结语

篇3

关键词：注册；识别；图像获取

1.指纹识别技术的发展

在生活中较常见的指纹识别应用有：指纹锁、指纹考勤、指纹门禁、指纹保管箱、笔记本电脑指纹登陆模块、手机指纹开机验证模块、指纹网上银行。相信随着技术发展成熟，应用成本越来越低，指纹识别技术会越来越广泛地应用到我们日常生活中来。

指纹识别由于其电子门锁技术的成熟和成本降低，开始彻底走向民用。国内生物识别未来将形成上百亿元的市场，其中安防业是最重要的应用领域之一，市场空间很大。目前，罗湖口岸已经用了指纹通关，德国将指纹识别付款应用到某些超市中。预计指纹门禁、指纹读卡器、指纹智能锁，指纹门禁考勤一体机及相关指纹身份识别系统将会迅速普及到每一个安全防范项目和智能大厦，目前国内年门禁安装数量大约是在50万门以上，其中指纹识别的在门禁应用大概只有1%左右，而一般国外这个比例大约应为20%以上。换句话说，在国内安防业，生物识别产品的市场缺口在9.5万台左右，另一个比较明显的状况是，目前专门从事指纹读头和电子门锁指纹门禁生产和销售企业很少，所以综合起来看这个市场有两个明显的特点：市场大，竞争少。

社会在不断的进步，身份的鉴别工作也提出越来越高的要求，在各种生物特征识别技术中，历史最悠久、使用最广泛的无疑是指纹识别技术，是一种相对比较成熟的身份鉴别方法，无论是在科学研究还是在工业界的实际应用中都得到了人们的广泛关注。尽管指纹识别技术在研究与使用得到了关注，但其发展还是不能满足社会日益增长的需求，究其原因是指纹识别在识别率、稳定性以及识别速度等方面还不能够满足实际使用时的要求。

2.指纹识别技术的应用

毫无疑问，指纹识别技术具有广泛的市场前景，其社会效益及经济效益是具大的，一般的自动指纹识别技术都需要有四个过程，即指纹图像的获取、指纹图像的处理、指纹特征提取和指纹匹配，也就是说，指纹识别的大部分工作都是数字图像处理的工作，而本文的主要研究内容也是数字图像处理在指纹识别中的应用。在数字图像处理中，图像获取就是把一幅模拟图像（如照片、画片等）转换成适合计算机或数字设备的数字信号。这一过程主要包换摄取图像、光电转换、数字化等步骤，而指纹图像的获取就是通过一定的设备采集手指表面的指纹凹凸信息同时将之转化为数字信号图像的过程；而在指纹图像处理的过程中，包含了几种常用的图像处理手段，如图像增强，图像分割等，其中在图像增强的过程中又包含了灰度与对比度的处理过程，主要是为了突出图像中感兴趣的信息，衰减或去除不需要的信息，从而使有用的信息得到增强，便于目标区分或对像理解；指纹特征提取则是从经过预处理的图像中提取指纹特征；指纹匹配顾名思义是指匹配指纹的特征，从而进行识别。故对几幅指纹图像进行匹配一般是从图像中提取的特征进行匹配。

一般来说，指纹图像有全局特征和局部特征两大特征，能够反映指纹整体开关特征的是全局特征，这个特征的提取一般局于指纹分类；能够反映指纹细节特点是局部特征，这个特征一般用于指纹对比。指纹线中的中断点、交叉点及拐点是指纹的特征点。

指纹识别系统的主要工作分为两个阶段，即注册阶段与识别阶段，也就是提取指纹特征和识别指纹特征的过程。一般在注册阶段，都要求输入各自的用户名以及对应的指纹，该过程需要将手指放在专门的采集指纹窗口上，经过指纹识别系统的指定模块特征提取模块将输入指纹的特征提取出来，结合用户名形成一个数据库；识别阶段时，该系统会将输入的指纹与数据库中现在有的指纹中进行一系列的匹配，特征点特征线等，这个过程需要读取数据库中保存的指纹特征信息。通用的指纹识别系统的流程图如图1所示。

图1指纹识别系统

就使用情况看，现有的指纹识别系统通常分为两大类，即嵌入式系统和计算机终端指纹识别系统。嵌入式系统是一个独立的系统，它不需要其它的设备就可以完成工作，这方面的应用有指纹锁，指纹考勤机（此处的指纹考勤机需要定期连接设备读取存档）等；计算机终端的指纹识别系统的设计与使用则更加灵活，通过计算机的分配，可以使多个系统共同使用指纹数据库，若用在考勤设备中，则可以实时显示该工作人员是否在岗。

除了公司等地的考勤、安保等地，还有一个与我们是日常生活更为接近的使用场合，即笔记本的指纹识别系统，现在，有很多品牌的笔记本已经将指纹识别系统应用到计算机上，笔记本的指纹识别系统大概经历了两代，第一代的指纹识别系统使用的是光学识别系统，这种技术容易出错而且不稳定，而第二代指纹识别系统采用的是电容传感技术，利用小信号创建指纹图像的半导体设备，电容传感器产生的电子信号可以直接达到真皮层读取指纹图案，提高了整个系统的可靠性。

3.结束语

指纹作为生物特征之一，其先天具有的不变性，唯

一性和可分类性，是公认的具有法律地位的个人身份特

征的可靠证据。指纹识别系统相对其他生物识别系统，

起点较早、种类最多应用最广泛，由于指纹识别系统成

本低，可以集成在很小的芯片上进行处理，已经普遍被

用来替换用户名/ 口令、电子令牌等传统的身份认证终

端设备。目前，指纹识别系统已用到了几乎所有需要进

行安全性防范的场合，遍及诸多领域。

参考文献：

[1] 郭浩.基于嵌入式隐Markov模型的指纹分类和匹配研究.[博士学位论文].大连:大连理工大学,2004

[2] Jain A K, Pankanti S. Automated Fingerprint Identification and Imaging Systems. Technical Report. Miehigan State University，1999.

[3] 李晓昆.基于结构特征的指纹识别.计算机工程与科学.1999,21(2):25~29

[4] 王崇文，李见为等.自动指纹识别系统的设计与实现.计算机应用.2001,12:63~65

[5] 章毓晋.中国图像工程及当前的儿个研究热点.计算机辅助设计与图形学学报,2002,14(6):489~193

[6] 高靖靖.指纹识别预处理算法研究:[硕士学位论文].成都:电子科技大学,2007

篇4

关键词：图像处理；数字水印；空域水印；信息隐藏；zigzag置乱

中图分类号：TP391文献标识码：A文章编号：1009-3044(2012)07-1614-04

Spatial Domain Watermarking Research Based on the Zigzag Scrambling

ZHAO Hong-qiao, LUO Yang

(University of South China, Computer Science and Technology College, Hengyang 421001, China)

Abstract: A new blind watermarking method for robust spatial-domain digital image in this paper. Zigzag transformation is utilized to scramble watermark and general a new watermark. Then, the watermark is embedded in bigger contrast regions of image by a quantization strategy. This scheme can be adapted to various texture images, and the algorithm of extracting the watermark doesn’t need the original image. Experimental results show that the proposed method is robust for some image processing operation such as salt and pepper noise.

Key words: image processing; digital watermarking;spatial domain watermarking; information hiding; zigzag scrambling

数字水印（Digital Watermarking）技术[1]是一种有效的数字产品版权保护和数据安全维护技术，是将一些标识信息（即数字水印）直接嵌入数字载体当中（包括多媒体、文档、软件等)或是间接表示(修改特定区域的结构)，且不影响原载体的使用价值，也不容易被探知和再次修改。数字水印通常满足不可感知性、可靠性和鲁棒性这三个要求。近年来数字水印技术取得了很大的发展，许多数字水印方案被相继提出。这些方案大体可以分为空域水印和变换域水印两大类。其中，变换域水印方法是先将图像做某种变换（特别是正交变换），然后把水印嵌入到图像的变换域（DCT变换或DWT变换等）中。空域水印方案的优势在于水印容量大和算法易于实现。目前大多数空域水印方案都是基于图像像素LSB[3]（即最不重要比特位）的嵌入思想。

M.S.HWANG等采用单向HASH函数提高了水印算法的安全性；宋琪等提出了用随机数置乱水印嵌入位置来提高安全性的方法，并将水印嵌入到非LSB位平面；但随机产生的水印嵌入位置存在冲突现象，需要用记录表来解决此冲突问题[4]。陈永红采用单个混沌系统来随机产生水印嵌入位置，也不可避免出现位置冲突问题,其解决办法是采用记录表。

本方案主要提出了一种空域的数字图像盲水印方案，主要原理是结合人眼的视觉模型，利用量化策略将数字水印嵌入到对比度较大的区域，较好的满足了不可感知性的要求。相较于变换域的方法他较易于硬件实现，计算量小，能够满足快速实时响应。

1算法描述

1.1数字水印嵌入过程

一个完整的数字水印系统通常包含三个基本部分：水印的生成、嵌入和水印的提取检测。水印的嵌入算法[4]通常是利用对称的密钥或公开密钥实现把水印嵌入到原始载体信息中，得到隐秘载体。图1显示了方案的整体框图。

1.2生成水印图像

设原始水印图像为M×N维的灰度图像，将每个像素点随机重排列形成一个新的水印图像。

1.2.1 Zigzag变换

Zigzag置换[5]是一种置乱方法。图像置乱的任务之一是将图像打乱，使其满足统计上和视觉上的具有服从均匀分布的白噪声的特性。一般来说，图像的置乱度越高，其隐藏的信息安全性越高，抗攻击性越好。Zigzag置换是通过对一个矩阵中的元素从左下角开始按"之"字形依次扫描取数来达到对数据进行置换。首先将扫描到的元素先依次存放到一个一维数组中，如图2所示，然后再将此一维数组按一定的方式置换为二维矩阵，则上述的置换过程可看作是对矩阵中元素的置换，这样的过程就叫做Zigzag置换。Zigzag置换的特点是算法实现简单，时间复杂度低。其在数字图像处理中应用比较多，基于Zigzag置乱在视频加密方法及图像数据压缩等方面已有广泛的应用。

图2二维矩阵变换成一维数组

置乱算法描述如下：

1）输入原始水印图像大小为M×N文件W及预设的迭代次数N；

2）按某种顺序R依次对图像水印文件W的每个元素扫描，并将扫描到的像素值放入到一个一维数组中，得到1×M×N的数组B0; 3）按照某种规则r将B0变换为矩阵B，令W=B；

4）重复2），3）直至N次

5）输出置乱图像B原水印图像（a）置乱次数T=5（b）置乱次数T=10(C)

图3置乱效果比较图

显然有图3可知，选取不一样的R，r将得到不同置乱方法。置乱次数n不同，也可以得到不同程度的置乱图像。因此，R，r，n可以作为置乱的加密密钥。本文选取方法是从左下角往上一次扫描，如图2所示，n选取为10。经过置乱后，水印图像在视觉和统计上服从均与分布的白噪声的特性。

1.3水印图像的嵌入

设原始图像为大小O×P的灰度图像I(x,y)，将图像I分割成互不重叠的大小为8×8的K块，每块记为bk，即I(x,y)=∑

3p/2≤rk

式中，meank表示块bk的平均灰度值;p表示水印嵌入的深度参数，属于预先设定的参数，p值越大，水印表现的嵌入程度越深，鲁棒性越好，但是可见性越高，通常取值0-5之；rk表示量化参数，用于选择不同情况下的嵌入的规则；mkj表示水印图像的第K个像素点的二进制表示的第j位；ck为块bk中第k个像素点增加的偏移量。

1.4水印图像的提取

从水印的嵌入来看，加过水印的图像块bk中的像素灰度值均加入了一个相同的偏移量，其均值变为meank+ck，但其方差比没有发生改变。所以在提取水印中的能够通过方差的排序重新定位到嵌入水印的块。

提取算法步骤具体如下：

1）将添加过水印的图像按照8×8分割成互不重叠的分块bk，计算每个分块bk的方差，按方差由大到小的顺序进行排列，选取出前K块作为嵌入的区域。

2）按照以下规则计算并依次进行嵌入的水印：

mean’k=(∑

2实验仿真与结果

(I(x,y)-I’(x,y))2

其中，I(x,y)代表的是原始水印图像，I’(x,y)代表的是提取后的原始水印图像。

仿真实验采用的是MATLAB7.0仿真平台。嵌入水印图像为尺寸大小为512×512的lena图灰度图像，水印图片为“南华大学”字样的16×16的灰度图像。由于采用的水印图像是感知上可视的，因此，提取出来的水印图案能够较为容易识别。实验中设定p=8,图4(a)为原始lena图像和原始水印图像，(b)为添加过水印后的图像与提取出的水印，(c)为原始水印图像与添加过水印图像的差值图像。

参考文献：

[1]金聪.数字水印理论与技术[M].北京:清华大学出版社,2008:36-39

[2]易开祥,石教英.数字水印技术研究进展[J].中国图象图形学报,2001,6(2):111-117.

[3]刘瑞祯，谭铁牛.数字水印研究综述田[J].通信学报,2000,21(8):39-42.

[4] VOYATZIS G,PITAS I.Chaotic watermarks for embedding in the spatial digital image domain[C]//Conference on Image,Processing(ICIP.98),Chicago,Illinois,USA,Accepted for Publication,1998.

[5]冀汶莉,张敏瑞,靳玉萍,等.基于Zigzag变换的数字图像置乱算法的研究[J].计算机应用与软件2009,26(3):71-73.

[6]王慧琴,李人厚.基于人类视觉系统的数字水印技术的理论框架[J].计算机工程,2002,28(9):1- 3.

[7] NIKOLAIDIS A,PITAS I.A region- based technique for chaotic image watermarking[C].Tampere,Finland:EURASIP European Signal Processing Confe rence(EUS IPCO2000),2000

篇5

关键词：遥感课程；高职学院；教学改革；学习效果

中图分类号：G64 文献标识码：A 文章编号：1009-3044（2012）30-7260-03

遥感是现代地理空间信息科学的核心技术之一，其作为信息采集与信息更新最重要的技术手段，已经应用于社会的各个部门以及经济领域的很多行业之中，并在新兴的全球性的“数字地球”计划中占有重要的地位。加强遥感技术与应用教学，提高学生遥感技术应用水平，是测绘学科教学中的重要环节。针对这个教学目的，结合我校地学类专业学生的具体情况，通过几年的教学实践探索，我们在以下几方面进行了教学实验，并取得了初步的效果。

1 教材分析选择：多种教材的结合

遥感技术及应用是我们的专业基础课，与本科学生相比，他们的就业方向对理论的学习要求较低，学习中的重点是实际技能的培养与掌握及应用。针对学生的具体情况与《遥感技术及应用》课程的特点，我们的教学目标是通过基本的理论教学，使学生掌握基本的遥感原理、遥感图像处理的基本方法、遥感解译的基本方法及其在测绘、地理、土地、地质和农业、交通等领域的具体应用，通过初步的上机实习，使学生掌握遥感数字图像处理软件的基本功能操作并能够完成简单的基本应用。

本课程以前一直使用《遥感概论》作为遥感技术及应用课程的教材，这部教材的特点是：内容层次安排合理，概念清晰易懂，实验内容以目视解译为基础，易于开展，但是，部分内容老化，跟不上遥感技术的发展；而《遥感导论》是教育部面向2l世纪课程教材.内容丰富，涉及技术原理较多，对于初次接触遥感的高职生而言，有些内容显得过深，为此，在教学过程中适当引用《遥感概论》的部分内容，作为学生入门的内容，从地物反射波谱特征入手，逐步开展遥感目视解译，地物判读标志的建立，在此基础上再结合《遥感导论》的相关内容，这样既可保证学生对遥感有全面的掌握，又可在需要加强的重点内容上有所侧重。《遥感原理、方法、应用》、《遥感获取与分析》这两本书中包含了较多的遥感应用实例，但是《遥感原理、方法、应用》为本科生教学用书，对于高职学院的学生来说，内容过于深奥，不易理解。《遥感获取与分析》过于偏重遥感数据的几何处理，而且遥感应用部分内容较少。基于上述考虑，《遥感技术与应用》课程没有指定教材，而是将相关的书籍作为参考用书向学生推荐，由学生自主决定选择购买，然后老师结合多种教材的特点与学生的实际需求选择教学内容。

2 教学内容的选择与教案的整理

理论教学内容可以分为遥感概述、遥感基本原理、遥感数字图像处理、遥感图像目视解译与遥感图像的计算机解译、遥感应用、3S综合应用。但只讲最基本和必需的，对较深和复杂的内容只做简单介绍，供感兴趣的同学自学。

在具体的教学中，为了达到课程的整体教学要求，必须通过实践课程让学生将学过的理论知识与具体实践结合起来，加深学生对理论知识的理解，和对基本原理的验证，学以致用，提高学生解决实际问题的能力。因此，在教学中将实习内容分为两个阶段。

1）遥感数字图像处理软件操作。以PCI、ENVI与ERDAS遥感数字图像处理软件为主要实习软件，结合具体的遥感数据，讲述遥感图像基本处理技术，包括几何校正、大气校正、几何精校正、投影转换、影像镶嵌、数字图像增强、波段运算、多源遥感数据融合、计算机分类、人机交互式解译等内容。

2）遥感基本应用。应用前一阶段所掌握的遥感图像数字处理技术，与一个具体的研究领域（比如土地利用类型遥感调查等）相结合，完成一个综合的实践性题目。

认真整理教案，对教案的结构，每一节，每句话、每个字都琢磨清楚，分析重点与难点。由于遥感技术更新非常快，因此要跟学生提供一些课下学习的参考资料，参考内容的选择不仅局限于书籍和杂志，一些专业网站已成为遥感教学不可缺少的资源，除此之外，遥感图像是遥感教学中重要的参考资料，因此收集各种影像数据是教师备课和教学的重要内容，我们先后从美国马里兰大学、美国地质调查局、中国遥感卫星地面站下载了一些免费的图像做为练习使用。做好教案后，再做好PPT向同学讲授，特别要增加一些图片和动态演示。

3 教学方式与方法的应用

具体教学内容确定以后，如何使其在授课过程中很好地被学生理解掌握并能运用，很大程度上取决于采用的教学方式方法。选用适合的教学方式方法是很好的完成教学任务、提高教学质量的关键。

1）多媒体与黑板等的优势结合去教学

随着社会的进步，信息技术已经深入到千家万户、各行各业，高职院校的教学软硬件设施也得到了更新完善发展，多媒体教学已成为众多学科教学的有力的工具。与传统使用的黑板的教学手段相比，多媒体教学有着不可比拟的很多优点，因为多媒体具有图、文、声并茂甚至有动态影像这样的特点，具有许多对于教学过程来说是特别宝贵的特性与功能，这些特性与功能是其他媒体（例如投影、录音、录像等）所不具备或是不完全具备的。遥感技术是一门对地观测与获取信息技术，其中具有很多的图像数据和空间地理数据，所以多媒体教学应成为遥感技术与应用教学的重要形式。首先，从人的生理心理学角度分析，图像比语言更容易被人感知，人所接受的外界信息有至少70%是视觉感知的。以图像的形式显示教学信息具有形象、直观、生动的特点，能高效激发学生学习兴趣，调动学生的学习积极主动性。能实现传统教学实现不了的情境、动画、模拟等。其次，方便教师的教学设计，更易突出重点、突破难点，进而提高教学效果，促进学生全面发展。但是，应用多媒体教学也有很多问题，如果课件的交互性差，则学生“难以消化”；如果多媒体使用太滥，则把握不住学生的思想心理，不利于学生的学习。所以利用多媒体与传统黑板等多种教具相结合的教学，地理数据和图像以多媒体展示，重点和难点在黑板上结合学生的学习讲解，对原理结合生产实例展开讲解。这样就能优势互补，取得最佳的教学效果。

2）在理论教学过程中，以讲授法为基本教学方法，适当采用提问和启发式教学的方式。关注全班学生，注意反馈信息，凝聚学生的注意力，使其保持相对兴奋状态，使他们产生愉快的心境，课堂语言简洁明了，课堂提问面向全体学生，注意启发学生学地理的兴趣，课堂上讲练结合。积极鼓励学生，使学生感到有“功”。我国古代教育家孔子说过：“知之者，不如好之者，好之者，不如乐之者”。要学生达到“乐学”，必然要使他们有成功感。“求成功”是人类的共有的天性。即使是一点一滴的进步，也会使学生感到愉快，成为促使学生继续学习的动力。学生取得进步时，我会对学生的成绩给予正确的评价，或者与平时成绩结合起来。在课堂上我会使用一些鼓励性语言来激发学生学习的热情，有时还可借助同学们的掌声进行鼓励。在教学过程中，我非常注意给学生们更多的鼓励，对他们抱有一颗宽容慈爱的心。

在教学过程中，充分利用已有的知识基础，引导学生思考遥感应用中的问题和现象，并自行设计或补充一些与学生关系较大的遥感应用问题和现象，以展示遥感课内容的丰富多彩和应用价值，引入新知识、新技术与新成果，增强学生的求知欲。认真组织开展复习、测验、考试、课外活动等。侧重于教会学生了解遥感在生产建设中的作用，培养学生实践能力，多阅读课外书籍，多关注身边的遥感知识，不断扩宽知识面，为教学内容注入新鲜血液。

3）在第一阶段的实习过程中，是对基本原理和方法的验证，采用演示加练习的方法来教学。老师先对某一个专题结合理论进行演示与讲解，然后让学生进行操作练习，老师巡回指导并检查学生完成情况，最后老师总结，学生完成实验报告。在这个过程中，演示与讲解一定要结合学生理论知识掌握程度的实际情况，使学生的知识能与老师的讲解衔接上，演示时，老师要尽可能收集能激发学生兴趣的一些具体实例，使学生感到有“味”，从而使学生保持良好的精神状态、学习状态，让学生的潜能最大化地激发出来，特别是注意力、理解力、记忆力、创造力，达到最佳的效果。在学生自己练习过程中，老师结合自身学习的经验教训，去纠正学生不良的学习习惯，在学生碰到困难时，及时分析困难产生的原因，针对每个学生进行指导，特别要教会学生尽量自己解决问题的能力，“授之以鱼”不如“授之以渔”。

4）在第二阶段的实习过程中，在有条件的情况下，增加野外实践实习的内容，携带手持GPS、便携式地物光谱仪、短波红外地物光谱仪等遥感仪器，到野外进行遥感技术的综合应用实习，如几何精校正中的地面控制点选取、地物反射率测量、地物目视解译与验证补判等等。通过野外实习，进一步提升学生理解与灵活运用知识的能力，提高遥感技术与应用课程的实践性[1]。

与遥感图象处理与应用的企事业生产单位建立联系，让学生通过顶岗式实习，熟悉遥感技术与应用的具体工作流程，观察实际生产中出现的问题并学会独立解决问题的能力，将实际生产与自己的课程学习进行结合，增强遥感技术与应用的实际生产能力。

5）让比较优秀且有兴趣的学生参加老师的遥感技术与应用的科研课题，学生在老师的指导下，针对具体的小题目，成立各个科研小组，各个小组独立的收集相关资料，结合题目进行知识和技能扩展训练，然后进行实验，不断思考总结，老师适时进行点拨指导，学生基本都能取得项目预期的成果。通过这种学习和锻炼，使科研小组成员具备了一定的科研基础，养成了良好的科研素质，为以后的进一步发展有了较高起点。

4 小结

从这几年的教学情况看，通过这些教学环节的精心计划与认真实施、反馈修正，激发了学生的学习兴趣，既学到了有用的理论知识，又具有实际的技能，提高了独立解决较复杂问题的能力，为尽快尽好走入社会奠定了坚实的基础。

参考文献：

[1] 刘勇卫.遥感精解[M].北京：测绘出版社，1993：76-86.

[2] 吕国楷，洪启旺，郝允充，等.遥感概论（修订版）[M].北京：高等教育出版社，1995：36-40.

[3] 梅安新，彭望禄，秦其明，等.遥感导论[M].北京：高等教育出版社，2001：79-81.

[4] 赵英时.遥感应用分析原理与方法[M].北京：科学出版社，2003：83-85.

[5] 孙家柄.遥感原理与应用[M].武汉：武汉大学出版社，2003：73-76.

[6] 张彦丽，潘竞虎.《遥感技术基础》课程教学策略探究[J].师范教育，2008，3（3）：53-54.

[7] 徐永明.关于成人教育《遥感应用》课程教学的几点思考[J].气象教育与科技，2007，31（2）：27-31.

[8] 刘仁钊，廖文峰.遥感图像分类应用研究综述[J].地理空间信息，2005，3（5）：11-13.

篇6

【关键词】指纹识别预处理点方向场块方向场

1 前言

当今已进入网络信息化时代，个人身份正变得越发隐性化。为了保证个人信息安全，准确鉴别身份就成了首要问题。由于每人的指纹纹线的特点不同，且形态稳定，所以被很多各类身份识别系统采用。要实现指纹识别，指纹图像预处理是前提，本文尝试用方向场技术来进行指纹图像处理，以升身份识别率。

2 指纹方向场简介

方向场其实是用来对图像中纹理方向和对应位置进行描述的一个二维平面场。就指纹来说，其方向场的功能就是描述图像的纹理方向及其在空间分布。具体而言，指纹方向场有两种：一种是可用于表示图中每个像素点脊线方向，且具有连续性和渐变性的点方向场，这类的特点是方向过渡自然，易受噪声影响；而另一种则是可表示图中每块脊线大致方向的块方向场，此类方向场能很好地去除噪声，但是其整体过渡性差，精确度不高。本文将点方向场和块方向场进行结合，以优化识别效果。

3 指纹方向场的计算方法

3.1 求解指纹点方向场

在计算点方向场时，可以采用邻域方向模板法，可以把指纹脊线的走向按八个方向进行划，并将方向模板中心设为基准点。如此一来，从水平方向起，沿着逆时针方向，每隔一定的间隔确定一个方向i（i=0，...，7），本文中求取方向角范围是[0，π]，相邻方向间隔相等。

3.2 求解指纹块方向场

为了削弱点方向场D（x，y）所受的噪声干扰，还要依据点方向场进一步求取块方向场，为此往往会将点方向场划分为一系列相互之间不重叠的块。然后再针对每个小块求取平均方向，并把该方向视为此小块脊线的主导方向。若用该小块的主导方向替代小块内每个像素的方向，就可以得到块方向场了。但如此一来，由于未对其他相邻小离散块中像素的影响进行考量，很可能会造成方向的不连续性，故而性能亟待改进。

3.3 求解指纹连续分布方向场

4 结论

指纹方向场实际是指纹图像的一种变换表示方法，在预处理中可以利用其对指纹图像进行处理，以实现对所采集的不确定性指纹进行图像增强，为后继的识别步骤做准备。可是，常规的点方向场计算受噪声影响较大，一般无法完全反映指纹脊线的真实走向；而块方向场的整体过渡性差，精确度不高。文中将两者进行了适当组合，从仿真结果来看可以处理效果较好。

参考文献

[1]董明.指纹识别技术发展综述[J].中国科技信息，2011（13）.

[2]李宏中，叶强.指纹识别算法研究及实现[J].计算机光盘软件与应用，2012（22）.

[3]李向丽，周美娇，张翠雪.基于块方向图的指纹中心点定位[J].信息技术，2014（10）.

作者简介

段沛沛（1980-），女，河南省洛市人。硕士学位。现为西安石油大学讲师。研究方向为智能信号处理、数字图像处理。

篇7

论文摘要：分割的目的是将图像划分为不同区域。图像分割算法一般是基于亮度值的两个基本特性之一：不连续性和相似性。第一类性质的已用途径是基于亮度的不连续变化分割图像，比如图像的边缘。第二类的主要应用途径是依据事先制订的准则将图像分割为相似的区域。门限处理、区域生长、区域分离和聚合都是这类方法的实例。遗传算法具有简单、鲁棒性好和本质并行的突出优点。其在应用领域取得的巨大成功，引起了广大学者的关注。在图像分割领域，遗传算法常用来帮助确定分割阈值。

本文介绍讨论了几种目前广泛应用的图像边缘检测、图像阈值分割的各种算法，并给出了对比分析;对遗传算法的基本概念和研究进展进行了综述;给出了标准遗传算法的原理、过程、实验结果及分析. 实验结果表明，本文提出的遗传分割算法优于传统分割算法。

第一章绪论 1.1 图像分割综述

图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。这里所说的特性可以是灰度、颜色、纹理等，而目标可以对应单个区域，也可以对应多个区域。图像分割是数字图像处理中的一项关键技术，它使得其后的图像分析，识别等高级处理阶段所要处理的数据量大大减少，同时又保留有关图像结构特征的信息。而且，在数字图像处理工程中，一方面，图像分割是目标表达的基础，对特征测量有重要的影响；另一方面，图像分割是自动目标识别的关键步骤，图像分割及其基于分割的目标表达、特征提取和参数测量等将原始图像转化为更抽象更紧凑的形式，分割中出现的误差会传播至高层次处理阶段，因此分割的精确程度是至关重要的。只有通过细致精细的图像分割，才能使得更高层的图像分析和理解成为可能。因此，图像分割是由图像处理进到图像分析的关键步骤，在图像工程中占据重要的位置。

1.2 图像分割的研究意义与发展现状

作为计算机视觉和图像处理中的难点和热点之一，图像分割的研究受到了研究工作者的高度重视，对图像分割进行了深入、广泛的研究。作为一种重要的图像技术，图像分割在不同领域中有时也用其它名称：如目标轮廓(object delineation)技术，阈值化(thresholding)技术，图像区分或求差(image discrimination)技术，目标检测(target detection)技术，目标识别(target recognition)技术，目标跟踪(target tracking)技术等，但这些技术本身或其核心实际上也就是图像分割技术。图像分割作为图像处理、分析的一项基本内容，其应用非常广泛，几乎出现在有关图像处理的所有领域，并涉及各种类型的图像。在工业自动化、在线产品检验、生产程控、文件图像处理、遥感图像、保安监视、以及军事、体育、农业等行业和工程中，图像分割都有着广泛的应用。例如：在遥感图像中，合成孔径雷达图像中目标的分割、遥感云图中不同云系和背景分布的分割等；在医学应用中，脑部 MR 图像分割成灰质（GM）、白质（WM）、脑脊髓（CSF）等脑组织和其它脑组织区域（NB）等；在交通图像分析中，把车辆目标从背景中分割出来等；在面向对象的图像压缩和基于内容的图像检索中将图像分割成不同的对象区域等。在各种图像应用中，只要需对图像目标进行提取，测量等都离不开图像分割。

自 20 世纪 70 年代至今，已提出上千种各种类型的分割算法。如：门限法、匹配法、区域生长法、分裂－合并法、水线法、马尔可夫随机场模型法、多尺度法、小波分析法、数学形态学等。随着新理论、新技术的发展，一些新的图像分割方法也随之出现，但这些分割算法都是针对某一类型图像、某一具体的应用问题而提出的，并没有一种适合所有图像的通用分割算法。通用方法和策略仍面临着巨大的困难。另外，还没有制定出选择适用分割算法的标准，这给图像分割技术的应用带来许多实际问题。

1.3 本论文所作的工作

据此，在本论文中只对常用的、并在实践中行之有效的边缘检测方法和阈值分割方法进行深入的了解，并对阈值分割方法中的灰度直方图双峰法和基于遗传算法的最大类间方差法进行详细的讨论，同时用Matlab对上述两种方法进行验证并给出结果。

1.4 本论文的论述内容

本文对图像分割的整个过程中的一些常用的，经实践检验行之有效的算法进行了讨论和改进。全文共七章。第一章为绪论，主要介绍了现阶段图像分割技术的发展现状和研究意义。其他六章分别在以下几个方面介绍了本文所做的工作：

1.对本文所采用的试验测试工具Matlab 进行简介。

2.简介数字图像的基础问题。概述了数字图像的基本概念和特点，简介了各种图像格式的特点和应用，为全文的讨论作一铺垫。

3.详细讨论了图像分割中的基于阈值的图像分割方法，给出了直方双峰法的算法和验证结果，并简要介绍了普通最大类间方差法的算法过程。

4.对遗传算法理论进行简介。详细讨论了遗传算法的定义和标准遗传算法的流程和要素。为应用此方法对最大阈值进行迭代寻优打下基础。

6.应用遗传算法改进了最大类间方差法。给出了整个遗传操作的使用函数与具体进程，并对实例图片进行处理，得到处理结果并得到迭代最优阈值M。

本文研究了图像分割的相关理论和常用技术，并对遗传算法进行了介绍，对遗传算法应用于图像分割进行了验证.

第二章 Matlab简介 2.1 MATLAB的概况和产生背景 2.1.1 MATLAB的概况

MATLAB是矩阵实验室（Matrix　Laboratory）之意。除具备卓越的数值计算能力外，它还提供了专业水平的符号计算，文字处理，可视化建模仿真和实时控制等功能。MATLAB的基本数据单位是矩阵，它的指令表达式与数学，工程中常用的形式十分相似，故用MATLAB来解算问题要比用C，FORTRAN等语言完相同的事情简捷得多.

当前流行的MATLAB包括拥有数百个内部函数的主包和三十几种工具包(Toolbox).工具包又可以分为功能性工具包和学科工具包.功能工具包用来扩充MATLAB的符号计算，可视化建模仿真，文字处理及实时控制等功能.学科工具包是专业性比较强的工具包，控制工具包，信号处理工具包，通信工具包等都属于此类.开放性使MATLAB广受用户欢迎.除内部函数外，所有MATLAB主包文件和各种工具包都是可读可修改的文件，用户通过对源程序的修改或加入自己编写程序构造新的专用工具包.

2.1.2 MATLAB产生的历史背景

在70年代中期，Cleve Moler博士和其同事在美国国家科学基金的资助下开发了调用EISPACK和LINPACK的FORTRAN子程序库.EISPACK是特征值求解的FOETRAN程序库，LINPACK是解线性方程的程序库.在当时，这两个程序库代表矩阵运算的最高水平.到70年代后期，身为美国New Mexico大学计算机系系主任的Cleve Moler，在给学生讲授线性代数课程时，想教学生使用EISPACK和LINPACK程序库，但他发现学生用FORTRAN编写接口程序很费时间，于是他开始自己动手，利用业余时间为学生编写EISPACK和LINPACK的接口程序.Cleve Moler给这个接口程序取名为MATLAB，该名为矩阵(matrix)和实验室(labotatory)两个英文单词的前三个字母的组合.在以后的数年里，MATLAB在多所大学里作为教学辅助软件使用，并作为面向大众的免费软件广为流传。1983年春天，Cleve Moler到Standford大学讲学，MATLAB深深地吸引了工程师John Little.John Little敏锐地觉察到MATLAB在工程领域的广阔前景.同年，他和Cleve Moler，Steve Bangert一起，用C语言开发了第二代专业版.这一代的MATLAB语言同时具备了数值计算和数据图示化的功能.1984年，Cleve Moler和John Little成立了Math Works公司，正式把MATLAB推向市场，并继续进行MATLAB的研究和开发.

在当今30多个数学类科技应用软件中，就软件数学处理的原始内核而言，可分为两大类.一类是数值计算型软件，如MATLAB，Xmath，Gauss等，这类软件长于数值计算，对处理大批数据效率高;另一类是数学分析型软件，Mathematica，Maple等，这类软件以符号计算见长，能给出解析解和任意精确解，其缺点是处理大量数据时效率较低.MathWorks公司顺应多功能需求之潮流，在其卓越数值计算和图示能力的基础上，又率先在专业水平上开拓了其符号计算，文字处理，可视化建模和实时控制能力，开发了适合多学科，多部门要求的新一代科技应用软件MATLAB.经过多年的国际竞争，MATLAB以经占据了数值软件市场的主导地位.

在MATLAB进入市场前，国际上的许多软件包都是直接以FORTRANC语言等编程语言开发的。这种软件的缺点是使用面窄，接口简陋，程序结构不开放以及没有标准的基库，很难适应各学科的最新发展，因而很难推广。MATLAB的出现，为各国科学家开发学科软件提供了新的基础。在MATLAB问世不久的80年代中期，原先控制领域里的一些软件包纷纷被淘汰或在MATLAB上重建。

时至今日，经过MathWorks公司的不断完善，MATLAB已经发展成为适合多学科，多种工作平台的功能强大大大型软件。在国外，MATLAB已经经受了多年考验。在欧美等高校，MATLAB已经成为线性代数，自动控制理论，数理统计，数字信号处理，时间序列分析，动态系统仿真等高级课程的基本教学工具；成为攻读学位的大学生，硕士生，博士生必须掌握的基本技能。在设计研究单位和工业部门，MATLAB被广泛用于科学研究和解决各种具体问题。在国内，特别是工程界，MATLAB一定会盛行起来。可以说，无论你从事工程方面的哪个学科，都能在MATLAB里找到合适的功能。

2.2 MATLAB的语言特点

一种语言之所以能如此迅速地普及，显示出如此旺盛的生命力，是由于它有着不同于其他语言的特点，正如同FORTRAN和C等高级语言使人们摆脱了需要直接对计算机硬件资源进行操作一样，被称作为第四代计算机语言的MATLAB，利用其丰富的函数资源，使编程人员从繁琐的程序代码中解放出来。MATLAB最突出的特点就是简洁。MATLAB用更直观的，符合人们思维习惯的代码，代替了C和 FORTRAN语言的冗长代码。MATLAB给用户带来的是最直观，最简洁的程序开发环境。以下简单介绍一下MATLAB的主要特点。

1. 语言简洁紧凑，使用方便灵活，库函数极其丰富。MATLAB程序书写形式自由，利用起丰富的库函数避开繁杂的子程序编程任务，压缩了一切不必要的编程工作。由于库函数都由本领域的专家编写，用户不必担心函数的可靠性。可以说，用MATLAB进行科技开发是站在专家的肩膀上。　更为难能可贵的是，MATLAB甚至具有一定的智能水平，所以用户根本不用怀疑MATLAB的准确性。

2. 运算符丰富。由于MATLAB是用C语言编写的，MATLAB提供了和C语言几乎一样多的运算符，灵活使用MATLAB的运算符将使程序变得极为简短。

3. MATLAB既具有结构化的控制语句（如for循环，while循环，break语句和if语句），又有面向对象编程的特性。

4. 程序限制不严格，程序设计自由度大。例如，在MATLAB里，用户无需对矩阵预定义就可使用。

5. 程序的可移植性很好，基本上不做修改就可以在各种型号的计算机和操作系统上运行。

6. MATLAB的图形功能强大。在FORTRAN和C语言里，绘图都很不容易，但在MATLAB里，数据的可视化非常简单。MATLAB还具有较强的编辑图形界面的能力。

7. MATLAB的缺点是，它和其他高级程序相比，程序的执行速度较慢。由于MATLAB的程序不用编译等预处理，也不生成可执行文件，程序为解释执行，所以速度较慢。

8. 功能强大的工具箱是MATLAB的另一特色。MATLAB包含两个部分：核心部分和各种可选的工具箱。核心部分中有数百个核心内部函数。其工具箱又分为两类：功能性工具箱和学科性工具箱。功能性工具箱主要用来扩充其符号计算功能，图示建模仿真功能，文字处理功能以及与硬件实时交互功能。功能性工具箱用于多种学科。而学科性工具箱是专业性比较强的，如control，toolbox，signl proceessing toolbox，commumnication toolbox等。这些工具箱都是由该领域内学术水平很高的专家编写的，所以用户无需编写自己学科范围内的基础程序，而直接进行高，精，尖的研究。

9. 源程序的开放性。开放性也许是MATLAB最受人们欢迎的特点。除内部函数以外，所有MATLAB的核心文件和工具箱文件都是可读可改的源文件，用户可通过对源文件的修改以及加入自己的文件构成新的工具箱。

2.3 MATLAB 遗传算法工具箱简介

鉴于Matlab强大的扩展功能和影响力，各个领域的专家相继突出了许多基于Matlab的专用工具箱。本文所采用的遗传算法工具箱，就是由英国谢菲尔德（Sheffield）大学设计推出的。相对于其他版本的遗传算法工具箱，如：美国北卡莱罗纳州立大学推出的遗传算法优化工具箱GAOT（Genetic Algorithm Optimization Toolbox），以及MathWorks公司最新的一个专门设计的Matlab遗传算法和直接搜索工具箱（Genetic Algorithm and Direct Search Toolbox），本工具箱的出现最早，影响较大且功能较为完备。文中所采用的所有遗传操作函数大部分出自本工具箱。第三章数字图像基础简介

图像处理的首要一步，就是要了解图像的基本性质与特点。只有充分了解和掌握了所要处理得图像的特点和性质，才能在接下来的处理中根据图像的特点获取所需的信息，并对其进行相应的处理。

本章将介绍数字图像的基础知识，以及图像在计算机处理中的信息表达形式，并对几种常用的图像文件格式Bmp， Jpeg以及Png等做简要的介绍。

3.1 图像的基本概念及其特点

要对图像进行处理，必须清楚图像的概念。一般来说，二维或三维景物呈现在人眼中的样子就是图像。图像具有以下三个方面的特点:

①图像带有大量的信息，一幅图像顶得上千言万语;

②图像种类繁多，包括照片、绘图视频图像等;

③人类从外界获得的大部分信息来自视觉系统。

人们看到的任何自然界的图像都是连续的模拟图像。其形状和形态表现由图像各位置的颜色来决定。可以用f（x， y)表示一幅模拟图像，其中x， y表示空间坐标点的位置，f表示图像在点(x， y)的某种性质的数值，如亮度、颜色等，f、x、y可以是任意的实数。而把连续空间的图像在坐标空间(X， Y)和性质空间F都离散化，以便于计算机进行加工处理的离散化的图像则称为数字图像。数字图像用I (r， c)来表示，其中:r=row为行，c = col为列，表示空间离散点的坐标，I表示离散化的图像f。I， r， c都是整数。实际中仍习惯用f (x， y)表示数字图像。图像存储画面的形式为栅格结构:即将图像划分为均匀分布的栅格(像素)，显式的记录每一像素的亮度和颜色;而将像素的坐标值规则地隐含起来，其位置排列规则，通常为矩形排列。

3.2 图像的格式

组成数字图像的基本单位称为像素(Pixel)，把像素按不同的方式进行组织和存储，就得到不同的图像格式;把图像数据存为文件就得到图像文件。图像文件按其格式的不同一般具有不同的扩展名。常用的图像文件格式有位图文件、JPEG文件、GIF文件、PNG文件等。每一种格式都有它的特点和用途，在选择输出的图像文件格式时，应考虑图像的应用目的以及图像文件格式对图像数据类型的要求。下面我们介绍几种常用的图像文件格式及其特点。

3.2.1 BMP图像格式

这是一种DOS和Windows兼容计算机系统的标准图像格式。BMP格式支持索引色、灰度等色彩模式。图像存储为BMP格式时，每一个像素所占的位数可以是1位、4位、8位或32位，相对应的颜色数也从黑白一直到真彩色。对于使用Windows格式的4位和8位图像，可以指定采用RLE压缩。BMP图像文件含文件头、调色板数据和图像数据三个层次。其中文件头由定义文件标识、大小即图像数据偏移量的BITMAPF工LEHEADER以及指定BMP图像自身的若干参数的BITMAPINFOHEADER两部分组成。这种格式在PC机上应用非常普遍。

3.2.2 JPEG图像格式

JPEG是由联合照片专家组(JiontPhotographic Experts Group)开发的一种图像文件格式。它采用有损压缩方式去除冗余的图像和彩色数据，在获取极高的压缩率的同时也能展现十分丰富生动的图像。也就是说，可以用较少的磁盘空间得到较好的图像质。另外，JPEG还是一种比较灵活的格式，当将图像保存为JPEG格式时，允许用户用不同的压缩比例对文件进行压缩，就是可以指定图像的品质和压缩级别。

3.2.3 TIFF图像格式

TIFF文件主要由三部份组成，包括文件头、标识信息区和图像数据区。T工FF文件的图像数据区以行扫描的方式存取图像，存储图像前先将图像分割成若干部分，压缩后再存储。存储时，单色图像一个字节存储8个点，16色图像一个字节2个点，而256色图像就是一个字节存储一个点。TIFF图像格式是一种应用非常广泛的位图图像格式，几乎被所有绘画、图像编辑和页面排版应用程序所支持。TIFF格式常常用于在应用程序之间和计算机平台之间交换文件。

3.2.4 GIF图像格式

CIF是Graphics Interchange Format(图形交换格式)的缩写，是由ComputerServe公司推出的一种图像格式。该种图像格式的特点是压缩比高，可以极大地节省存储空间。最初的GIF只是简单的用来存储单幅静止图像，后来可以同时存储若干幅静止图像从而形成连续的动画;同时，GIF格式支持透明背景，可以较好地与网页背景融合在一起。因此，GIF常常用于保存作为网页数据进行传输的图像文件，成为网络和BBS上使用频率较高的一种图像文件格式。但是GIF最多只能处理256种色彩，不能用于存储真彩色的图像文件。

3.2.5 PNG图像格式

这种格式称为可移植网络图像文件格式(Portable Network Graphics)，由Thomas Boutell， Tom Lan。等人提出并设计。其特点是:①支持48位真彩色图像、16位灰度图像和颜色索引数据图像;②主要面向网络图像传输和图像编辑，其提供的二维交叉存储机制使用户在图像网络传输过程中能更快的观察到接近真实的近似图像;③对用户完全透明且无专利限制，用户可以从Internet上随时下载与PNG文件格式配套的图像数据压缩算法源程序代码:④ 具有比GIF高5-20%的压缩效率;⑤ 具有可扩展性。

作为目前最不失真的图像格式， PNG格式图像吸取了GIF和JPEG二者的优点。它可以把文件压缩到极限以利于网络传输，但由于采用无损压缩方式来减少文件大小，PNG格式能保留所有与图像品质有关的信息。同时，PNG支持图像背景透明，显示速度快。

本文的所有图像的处理都是对由JPG格式图像通过图像格式转化得来的Bmp格式的索引色图像进行的，其具体转换程序参见附录[一]。

第四章图像分割 4.1 图像分割算法的定义与分类

在图像的研究和应用中，人们往往只对一幅图像中的某些部分感兴趣，这些感兴趣的部分一般对应图像定的、具有特殊性质的区域（可以对应单个区域，也可以对应多个区域），称之为目标或前景；而其它部分称为图像的背景。为了辨识和分析目标，需要把目标从一幅图像中孤立出来，这就是图像分割要研究的问题。所谓图像分割，从广义上来讲，是根据图像的某些特征或特征集合（包括灰度、颜色、纹理等）的相似性准则对图像象素进行分组聚类，把图像平面划分成若干个具有某些一致性的不重叠区域。这使得同一区域中的象素特征是类似的，即具有一致性；而不同区域间象素的特征存在突变，即具有非一致性。从集合的角度出发，图像分割定义如下：

设整个图像空间为一集合R 。根据选定的一致性准则P ，R 被划分为互不重叠的非空子集（或子区域）：{R1， R2，L， Rn}，这些子集必须满足下述条件：

（1） R =

（2）对于所有的i和j ，当i ≠ j， =空集

（3） P(Ri) = True ，对所有的i

（4）所有i ≠ j；Ri ，Rj相邻，P(Ri U Rj) = False

（5）对i =1，2，L，n， Ri是连通区域

其中：P(Ri)为作用于Ri 中所有象素的形似性逻辑谓词，i， j =1，2，L，…n。上述条件

（1）指出分割后的全部子区域的总和应包含图像中的所有元素，或者说分割应将图像中每个象素都分进一个子区域中。

（2）指出各个子区域相互不重叠。

（3）指出分割后得到的属于同一区域中的元素应该具有某种相同特性。

（4）指出对于分割后得到的属于相邻两个区域中的元素具有某种不同的特性。（5）要求同一个子区域内的元素应当是连通的。

其中分割准则P 适用于所有象素，由它来确定各区域元素的相同特性。上述数学条件说明了图像分割算法的一些特点，凡不符合以上特点的图像处理算法则不能称为图像分割算法。

目前，在己提出的多种类型的分割算法中，大致可以分为基于边缘检测的方法和基于区域的方法。而在实际应用中，这些方法主要又可划分为三种类型: 边缘检测型、阈值型和区域跟踪型。本文的讨论正是基于阈值型图像分割方法展开的。

4.2 基于阈值的分割 4.2.1方法定义与特点

基于阈值的分割方法是一种应用十分广泛的图像分割技术。所谓阈值分割方法的实质是利用图像的灰度直方图信息得到用于分割的阈值。它是用一个或几个阈值将图像的灰度级分为几个部分，认为属于同一个部分的象素是同一个物体。它不仅可以极大的压缩数据量，而且也大大简化了图像信息的分析和处理步骤。因此，在很多情况下，是进行图像分析、特征提取与模式识别之前必要的图像预处理过程。它特别适用于目标和背景占据不同灰度级范围的图像。阈值分割方法的最大特点是计算简单，运算效率高，在重视运算效率的应用场合，它得到了广泛的应用。

4.2.2阈值的分割的描述

设(x，y)是二维数字图像的平面坐标，图像灰度级的取值范围是G= {0， 1， 2，…L-1 }(习惯上0代表最暗的像素点，L-1代表最亮的像素点)，位于坐标点(x， y)上的像素点的灰度级表示为f (x， y)。设t∈G为分割阈值，B= {b0， b 1}代表一个二值灰度级，并且b0， b1∈B。于是图像函数f 1(x，y)在阈值t上的分割结果可以表示为:

阈值分割法实际就是按某个准则函数求最优阈值t的过程。域值一般可写成如下的形式:

T=T［x，y， f (x，Y)，p (x，y)］

其中f (x， y)是在像素点(x， y)处的灰度值，p(x，y)是该点邻域的某种局部性质。4.3.3阈值分割方法的分类

通过上文的讨论，结合所给公式，可以将阈值分割方法分为以下3类:

全局阈值:T=T[p(x，y)〕，即仅根据f(x，y)来选取阈值，阈值仅与各个图像像素的本身性质有关。

局部阈值:T=T[f(x，y)，p(x，y)]，阈值与图像像素的本身性质和局部区域性质相关。

动态阈值:T=T[x，y，f(x，y)，p(x，y)]，阈值与像素坐标，图像像素的本身性质和局部区域性质相关。

全局阈值对整幅图像仅设置一个分割阈值，通常在图像不太复杂、灰度分布较集中的情况下采用;局部阈值则将图像划分为若干个子图像，并对每个子图像设定局部阈值;动态阈值是根据空间信息和灰度信息确定。局部阈值分割法虽然能改善分割效果，但存在几个缺点:

每幅子图像的尺寸不能太小，否则统计出的结果无意义。

每幅图像的分割是任意的，如果有一幅子图像正好落在目标区域或背景区域，而根据统计结果对其进行分割，也许会产生更差的结果。

篇8

关键词:ASM算法;主动形状模型;人脸风格化;风格化因子

中图分类号:TP311文献标识码:A文章编号:1009-2374(2010)06-0020-02

绘画的最终目的并不仅仅是模仿自然和真实再现外部世界,在计算机图形学中的图像渲染领域,更应该有多样化的目标和选择,因此,20世纪90年代开始,风格化绘制逐渐成为计算机图形学的研究热点。风格化渲染并不关心像照片般真实地再现客观世界,恰恰相反,它更专注于图形个性化和艺术化的表达。

在广泛阅读国内外现有的关于人脸检测和面部风格化的文章后,比较和借鉴现有成功的面部风格化的方法,对人脸特征点定位,面部特征提取和变形的关键技术进行改进和完善,提出了一整套方案,并开发相应的基于视频图像序列的面部图像风格化系统。

一、相关技术

(一)主动形状模型(ASM)

主动形状模型(Active Shape Models)是一种物体形状描述技术,是Cootes提出的用于解决图像中的目标搜寻的形状统计模型,被广泛应用于医学图像处理、数字图像理解和计算机视觉等领域。

ASM的思想最早可以追溯到1987年Kass等人提出的snake方法,该方法主要用于边界检定与图像分割。1989年,Yuille等人提出使用参数化的可变形模板来代替snake模型。 1995年,Cootes等人提出ASM算法,ASM采用参数化的采样形状来构成对象形状模型,并利用PCA方法建立描述形状的控制点的运动模型,最后利用一组参数组来控制形状控制点的位置变化,从而逼近当前对象的形状。

ASM的基本思想是选取一组训练样本,用一组特征点来描述样本的形状, 然后对各样本的形状进行配准(使得形状尽可能地相似),对这些配准后的形状向量利用主分量分析方法进行统计建模得到物体形状的统计学描述,最后利用建立的模型在新的图像中搜索物体轮廓,从而定位出目标物体。ASM依靠一个由人工标定特征点的训练集来得到一个平均的人脸形状(Mean Shape)之后,在平均形状点的邻接区域进行搜索得到目标形状(Shape)。

由ASM训练得到的平均形状模型能很好地覆盖各种人脸几何外形子空间,具有较高的定位精度;同时,采用灰度和梯度信息指导形状模型收敛速度也较快,并且可以提高收敛的概率。

(二)基于特征线对的图像变形

一组特征线对被定义为一对方向向量,一个位于源图像,一个位于目标图像。这样从源图像到目标图像就存在一个映射。定义以下式子:

U=(1)

V=(2)

X'=P'+u•(Q'-P')+ (3)

式中X代表源图像中的一点,PQ代表源图像征线对,X代表目标图像中的一点。P'Q'代表目标图像的特征线对。

图1基于一组特征线对的示意图

多组线对关键是要确定每个线对的权重。因为目标图像中每个点都要依据每组线对计算一次,所以线对的权重是比较关键的。定义权重计算式如下:

weight=()b(4)

式(4)中,length是线对中线段的长度,dist是像素点到线段的最短距离;a,b,p是参数,可以修改它们的值来改变线与线之间的影响,a的值影响变形后的平滑程度,越大变形后线段将越平滑;b的值决定了距离对于线对的影响程度,实验证明b的范围在[0.5,2]能取得比较好的效果;p是一个0～1之间的数,如果p=0,那么所有的线对之间权重相同,如果p=1,线段越长权重越大。

图2中,X'是源图像钟像素的位置,X是目标图像中像素的位置。v1,v2分别是相应的像素点到线段的距离。

二、人脸特征点的定位

实验开始阶段,使用手工标注人脸特征点的正面图像对ASM进行训练,每张图片有68个特征点,其中脸型15个,眉毛12个,双眼10个,鼻子14个,嘴巴17个。这些特征点已经能够比较完整地反映出人脸的轮廓以及五官的特征。

如图2所示为拟合出人脸轮廓,首先在平均模板基础上生成一个初始形状估计,然后根据搜索策略调整标记点位置,让初始形状在待识别的图像不断地变形,直至收敛,最终拟合出人脸的轮廓。

根据上述的介绍,可以看出,68个特征点已经能比较准确的描绘出人脸的五官特征,但是对于眼睛这样的精细部位的描述来说,仍略显不足,因此,这里我们采用插值的办法在每只眼睛周围补充了4个特征点,如图3和图4分别为采用插值增加特征点前后的对比图。

三、人脸风格化

通过阅读大量的图像风格化和人脸识别的文章,已经能够确定艺术家的风格特征,既和图像的几何特征相关,又与图像的纹理特征相关。

在图5中,将人脸风格化的过程可以分为训练阶段和运行阶段两个阶段,下面分别介绍这两个阶段的具体步骤:

(一)训练阶段(Training):

第一步:训练人脸检测的分类器,本文训练的分类器只针对正面免冠人脸。

第二步:训练ASM模型,以便对用户给定的图像进行人脸特征点的自动定位。

第三步:根据训练图像的特征点,计算出原图和风格化图训练样本的平均几何,并称之为Mean ShapeI和Mean ShapeS,如图5的右上角所示。

第四步:根据MeanShapeI和Mean ShapeS对I和S做几何变换:I'= G(I),S'= G(S),以消除人脸几何差异性影响。

第五步:做抽取Mean Shape的几何特征G,并得到特征线向量组:S'= G(S)。

第六步:计算风格化样本的风格化变换系数,将两个Mean Shape作对比,确定变换系数作为描述特定风格的参数。

(二)运行阶段(Running):

第一步:采用人脸检测的方法,定位抽取人脸。

第二步:使用主动轮廓模型(ASM)进行脸部特征点定位,获得脸部的几何形状并计算特征线向量组和几何变换:Si'= G(Si);

第三步:使用面部图像分割技术Canny边缘检测以及阈值提取技术,将定位的人脸图像边缘和阈值提取以及ASM轮廓内部的合并图抽取出来,获得脸部的纹理信息以及轮廓信息;

第四步:将获得的几何形状(Shape)与训练过程得到的平均几何形状(MeanShape)作对比,将几何特征提取出来与训练阶段获取的风格化参数相乘从而确定变形的特征;

第五步:根据获得的特征使用变形方法获得风格化后的图像。

至此,完成了人脸的风格化处理过程,图5即为整个系统的实现框架。

四、结论

本文通过主动形状模型(ASM)算法提取人脸特征点,其中运用了图像分割中的边缘检测以及机器学习的方法,达到了一定的描述效果。基于该算法,给出了一个人脸风格化系统的实现框架,系统分为训练阶段和运行阶段,通过这两个阶段,可以很好地完成人脸的风格化描述过程。但是,由于风格化因子受限于训练样本,所以产生的输出结果也会受到训练样本的影响。

参考文献

[1]Cooper DH,Cootes TF, Taylor CJ. Active shape models―their training and application[J].Computer Vision and Image Understanding,1995,61(1).

[2]李培华,张田文.主动轮廓线模型(蛇模型)综述[J].软件学报,2000,11(6).

[3]Cootes TF,Taylor CJ.Statistical models of appearance for computer version[R].Technical Report,Manchester M13 9PT.University of Manchester,2001.

[4]周仁琴,刘福新.基于人脸特征分析的卡通人脸动画系统[J].计算机工程,2008,(10).

篇9

图像边缘是图像灰度值变化不连续的部分，可以粗略地分为阶跃边缘和屋顶边缘[1]。图像边缘的信息能勾勒物体轮廓框架，是数字图像研究领域的重要部分。多见的图像边缘检测方法有Sobel算法、Canny算法、Laplacian算法等，虽然这些算子简单方便，但不能适应各种类型的边缘检测，自适应性较差。有实验表明，彩色图像比灰度图像含有的边缘信息更为丰富，彩色图像大概有十分之一的边缘信息不能在灰度图像中检测得到[2]。由于RGB三个分量相关性较强[3]，对颜色感知不均匀，难以对色度、饱和度和亮度等进行数字化调整。因此，本文采用符合颜色视觉特性的颜色空间HSI。除此之外，由于光照不均匀，采集到的图像往往显得暗淡，其灰度值和动态范围都较小，需要采用二维共生矩阵直方图均衡化方法来解决。

本文对彩色图像灰度值及动态范围较小的边缘检测算法进行研究。首先根据图像的整体及布局灰度级的分布，在空间域对图像进行二维共生矩阵直方图均衡化处理，增强图像整体对比度，使图像过渡自然、细节清楚，然后利用一种改进的HSI形态学彩色图像边缘检测方法，计算H、S、I三分量的数据信息，接着对其进行权分析和图像融合，最后得到彩色图像边缘。通过MATLAB实验，结果表明，本文算法检测准确率高，自适应效果好，是一种较好的检测方法。

1 共生矩阵

1.1 灰度共生矩阵概念

灰度共生矩阵是一种像素距离和角度的的矩阵函数，再现了图像灰度在间隔、方向及变换范围的全部信息。它是通过统计分析一个图像中具有不同灰度状况的两个像素得到的，两个像素的方向和距离具有适当性。

1.2 共生矩阵直方图均衡化

2 HSI空间形态学梯度彩色图像边缘检测

2.1 HSI模型与色差求解

2.2 形态学梯度算子

2.3 双结构元的形态学算法

在数学形态学中，结构元素是一个最重要也是最基础的概念，不同的结构元素在同一幅图像中可用于提取、识别不同的图像形状或者目标。在单一的结构元素，提取图像的特性是大小完全相同的；而对于微小差异的结构元素，则无法提取他们的特性。本文采用文献[10]的方法，即一种双结构元的形态学算子：

其中，A是一种钻石型5×5的结构元素，B是一种十字型3×3的结构元素：

A与B是两种不同尺度的结构元素，各有优点与缺点。对于A，尺度大，去除图像噪声能力强，但会失去一些边缘信息；对于B，尺度小，可以较好地保持边缘信息，但去除图像噪声能力较弱。由此可见，合理调整结构元素尺度的大小，可以有效抑制噪声并得到理想的边缘检测结果。本文采用改进的形态学梯度算子[12]应用到基于共生矩阵和形态学的检测算法中，得到如下算子：

2.4 本文算法的步骤

针对在RGB空间中难以有效区分颜色相似性，光照不均匀的彩色图像存在灰度动态范围较低等问题，本文提出一种关于共生矩阵和形态学的边缘检测算法，检测算法描述如下。

第一步：首先通过通过共生概率密度函数和累积分分布函数计算得到K个新的灰度级，然后根据式子⑹计算共生直方图均衡后相邻像素之间的空间相关特性，根据式子⑺对图像进行二维共生矩阵直方图均衡彩色图像增强。

第二步：进行色彩空间转换，根据已知的RGB分量值，计算H分量、S分量以及I分量。

第三步：利用H分量和式⑷以及式⑸计算多尺度边缘EHi（x，y）。其中，Bn为有限个结构元素序列，n为尺度参数。

第四步：利用式⑶计算融合后H分量的边缘检测信息EHi（x，y）。当中，权重系数为ai（i=1，2，3…，n），（a）在噪声较小或无的情况下图像取平均数值，即；（b）在噪声较大的情况下图像取非平均权重，即。

第五步：对于S分量和I分量，同理重复第二、第三、第四步骤，得到S分量和I分量的边缘检测信息。

第六步：将图像H分量、S分量、I分量的边缘数据信息进行图像融合统计处理，得到彩色图像边缘。

3 仿真实验和分析

本文使用的实验环境是MATLAB 7.0，第一步是对本文边缘检测算法进行实验，确保算法正确；第二步，为了保证检测算法的准确性与有效性，将本文算法与文献[10-11]及Sobel算法、Canny算法等几种常见的边缘检测算法进行对比，如图2所示。

从图2可知，经典的Sobel算子、Canny算子对噪声比较敏感，不能完整地勾勒图像的边缘；文献[10]与文献[11]优于经典算子，能够较好地抑制噪声，但显得不够清晰平滑；本文算法将噪声过滤较好，所检测的边缘轮廓较为清晰完整。

客观来说，用图像峰值信噪比（PSNR）对实验图像进行定量分析，PSNR越大，代表保留的图像信息越多。本文算法和两种传统算法Sobel和Canny以及文献[10-11]共五种算法的PSNR计算结果如表1所示。

4 结束语

针对在RGB空间中难以有效区分颜色相似性的问题，本文提出一种关于共生矩阵和形态学的边缘检测算法。该方法首先通过利用图像的整体及布局灰度级的分布，在空间域对图像进行二维共生矩阵直方图均衡化处理，然后采用形态学梯度算子对H、S、I的三分量进行权分析和图像融合得到彩色图像边缘。与传统算法相比，本文所提出的算法更能有效地保持边缘信息，是一种有效的边缘检测方法。

参考文献：

[1] J X SUN， GU DB. A multiscale edge detection algorithm based on velet domain vector hidden Markov tree model[J]. Pattern Recognition，2004.37（7）：1315-1324

[2] NEVATIA R.A color edge detector and its use in scene egmentation[J].IEEE Trans on Systems，1977.7（11）：820-826

[3] 杨益，何颖.基于RGB空间的车道线检测与辨识方法[J].计算机与现代化，2014.2：86-90

[4] 杨冰清，田小平，吴成茂.基于共生矩阵的彩色图像增强算法[J].计算机应用，2012.9（32）：2573-2584

[5] 姚宇峰，夏开建，钟珊等.改进的形态学和小波变换边缘检测算法研究[J].计算机工程与应用，2011.47（21）：214-216

[6] 王佐成，唐素，薛丽霞等.多方向模糊形态学彩色图像边缘检测算法[J].计算机应用研究，2010.27（10）：3971-3973

[7] 徐杰.数字图像处理[M].华中科技大学出版社，2009.

[9] 徐国保，王骥，赵桂艳等.基于数学形态学的自适应边缘检测新算法[J].计算机应用， 2009.29（4）：997-1002

[10] 罗圣敏.改进的彩色图像边缘检测算法仿真研究[J].计算机仿真，2011.28（7）：301-304

[11]李依令.基于多尺度多结构元素的数学形态学边缘检测[J].科学技术与工程，2006.6（10）：1417-1419

[12] 毛若羽，陈相宁.改进的HSI空间形态学有噪彩色图像边缘检测[J].计算机应用研究，2013.30（2）：635-637

篇10

关键词：图像分割、阈值、边缘检测、区域分割

中图分类号： TN957.52 文献标识码： A

1引言

随着图像分割技术研究的深入，其应用日趋广泛。凡属需要对图像目标进行提取、测量的工作都离不开图像分割。图像分割是图像处理、模式识别和人工智能等多个领域中一个十分重要且又十分困难的问题，是计算机视觉技术中首要的、重要的关键步骤。图像分割结果的好坏直接影响对计算机视觉中的图像理解。现有的方法多是为特定应用设计的，有很大的针对性和局限性，到目前为止还不存在一个通用的方法，也不存在一个判断分割是否成功的客观标准。因此，对图像分割的研究目前还缺乏一个统一的理论体系，使得图像分割的研究仍然是一个极富有挑战性的课题。

2图像分割方法

图像分割(Image Segmentation)，简单地说就是将一幅数字图像分割成不同的区域，在同一区域内具有在一定的准则下可认为是相同的性质，如灰度、颜色、纹理等。而任何相邻区域之间其性质具有明显的区别。

2.1基于灰度特征的阈值分割方法

阈值分割技术是经典的、流行的图象分割方法之一，它是用一个或几个阈值将图像的灰度级分为几个部分，认为属于同一个部分的像素是同一个物体。

这类方法主要包括以下几种：

(1)单阈值法，用一个全局阈值区分背景和目标。当一幅图像的直方图具有明显的双峰时，选择两峰之间的谷底作为阈值。

(2)双阈值法，用两个阈值区分背景和目标。通过设置两个阈值，以防单阈值设置阈值过高或过低，把目标像素误归为背景像素，或把背景像素误归为目标像素。

(3)多阈值法，当存在照明不均，突发噪声等因素或背景灰度变化较大时，整幅图像不存在合适的单一阈值，单一阈值不能兼顾图像不同区域的具体情况，这时可将图像分块处理，对每一块设一个阈值。

2.2 边缘检测分割法

基于边缘检测技术可以按照处理的顺序分为并行边缘检测和串行边缘检测两大类。常见的边缘检测方法有：差分法、模板匹配法及统计方法等。由于边缘灰度变化规律一般体现为阶梯状或者脉冲状。边缘与差分值的关系可以归纳为两种情况，其一是边缘发生在差分最大值或者最小值处；其二是边缘发生在过零处。

2.3基于区域的分割方法

基于区域的分割方法利用的是图像的空间性质。该方法认为分割出来的某一区域具有相似的性质。常用的方法有区域生长法和区域分裂合并法。该类方法对含有复杂场景或自然景物等先验知识不足的图像进行分割，效果较好。

区域生长方法是把一幅图像分成许多小区域开始的，这些初始的小区域可能是小的邻域甚至是单个像素，在每个区域中，通过计算能反映一个物体内像素一致性的特征，作为区域合并的判断标准。区域合并的第一步是赋给每个区域一组参数，即特征。接下来对相邻区域的所有边界进行考查，如果给定边界两侧的特征值差异明显，那么这个边界很强，反之则弱。强边界允许继续存在，而弱边界被消除，相邻区域被合并。没有可以消除的弱边界时，区域合并过程结束，图像分割也就完成。

2.4结合特定工具的图像分割技术

20世纪80年代末以来，随着一些特殊理论的出现及其成熟，如数学形态学、分形理论、模糊数学、小波分析、模式识别、遗传算法等，大量学者致力于将新的概念、新的方法用于图像分割，有效地改善了分割效果。产生了不少新的分割算法。下面对这些算法做一些简单的概括。

2.4.1基于数学形态学的分割算法

分水岭算法是一种经典的借鉴了数学形态理论的分割方法。该方法中，将一幅图像比为一个具有不同高度值的地形，高灰度值处被认为是山脊，底灰度值处被认为是山谷，将一滴水从任一点流下，它会朝地势底的地方流动，最终聚于某一局部最底点，最后所有的水滴会分聚在不同的吸引盆地，由此，相应的图像就被分割成若干部分。分水岭算法具有运算简单、性能优良，能够较好提取运动对象轮廓、准确得到运动物体边缘的优点。但分割时需要梯度信息，对噪声较敏感。

2.4.2基于模糊数学的分割算法

目前，模糊技术在图像分割中应用的一个显著特点就是它能和现有的许多图像分割方法相结合，形成一系列的集成模糊分割技术，例如模糊聚类、模糊阈值、模糊边缘检测技术等。

这类方法主要有广义模糊算子与模糊阈值法两种分割算法。

(1)广义模糊算子在广义模糊集合的范围内对图像处理，使真正的边缘处于较低灰度级，但还有一些不是边缘的像素点的灰度也在较低灰度级中，虽然算法的计算简明，且边缘细腻，但得到的边缘图会出现断线问题。

(2)模糊阈值法引入灰度图像的模糊数学描述，通过计算图像的模糊熵来选取图像的分割阈值，后用阈值法处理图像得到边界。

2.4.3基于遗传算法的分割方法

此算法是受生物进化论思想提出的一种优化问题的解决方法，它使用参数编码集而不是参数本身，通过模拟进化，以适者生存的策略搜索函数的解空间，它是在点群中而不是在单点进行寻优。遗传算法在求解过程中使用随机转换规则而不是确定性规则来工作，它唯一需要的信息是适应值，通过对群体进行简单的复制、杂交、变异作用完成搜索过程。由于此法能进行能量函数全局最小优化搜索，且可以降低搜索空间维数，降低算法对模板初始位置的敏感，计算时间也大为减少。其缺点是容易收敛于局部最优。

2.4.4基于神经网络分割算法

人工神经网络具有自组织、自学习、自适应的性能和非常强的非线性映射能力，适合解决背景知识不清楚、推理规则不明确和比较复杂的分类问题，因而也适合解决比较复杂的图像分割问题。原则上讲，大部分分割方法都可用 ANN(attificial neural network)实现。ANN 用于分割的研究起步较晚，只有多层前馈NN，多层误差反传(BP)NN，自组织NN，Hopfield NN以及满足约束的NN(CSNN-Const raint Satisfaction Neurat Network)等得到了应用。使用一个多层前向神经网络用于图象分割，输入层神经元的数目取决于输入特征数，而输出层神经元的数目等同于分类的数目。

2.5图像分割中的其他方法

前面介绍了4大类图像分割较常用的方法，有关图像分割方法和文献很多，新方法不断产生，这些方法有的只对特定的情形有效，有的综合了几种方法，放在一起统称为第5类。

(1)标号法(labeling)是一种基于统计学的方法，这种方法将图像欲分割成的几个区域各以一个不同的标号来表示，用一定的方式对图像中的每一个像素赋以标号，标号相同的像素就合并成该标号所代表的区域。

(2)基于Snak模型的分割方法，基于Snake模型的分割是通过对能量函数的动态优化来逼近图像目标的真实轮廓的

(3)纹理分割，由于新的数学工具的引入，纹理分割技术取得了一些进展，张蓬等人将小波分析应用于纹理基元提取。

(4)基于知识的图像分割方法，直接建立在先验知识的基础上，使分割更符合实际图像的特点。该方法的难度在于知识的正确合理的表示与利用。

3图像分割性能的评价

图像分割评价主要有两个方面的内容：一是研究各分割算法在不同情况下的表现，掌握如何选择和控制其参数设置，以适应不同需要。二是分析多个分割算法在分割同一图像时的性能，比较优劣，以便在实际应用中选取合适的算法。分割评价方法分为分析法和实验法两大类。分析法是直接分析分割算法本身的原理及性能，而实验法是通过对测试图像的分割结果来评价算法的。两种方法各有优劣，由于缺乏可靠理论依据，并非所有分割算法都能够通过分析法分析其性能。每种评价方法都是出于某种考虑而提出来的，不同的评价方法只能反映分割算法性能的某一性能。另一方面，每一种分割算法的性能是由多种因素决定的，因此，有可能需要多种准则来综合评价。

4图像分割技术的发展趋势

随着神经网络、遗传算法、统计学理论、小波理论以及分形理论等在图像分割中的广泛应用，图像分割技术呈现出以下的发展趋势：(1)多种特征的融合。(2)多种分割方法的结合。(3)新理论与新方法。

参考文献

[1] [美]RC冈萨雷斯.数字图像处理（第二版）[M].阮秋琦，等译.北京：电子工业出版社，2003

[2] 章毓晋．图像分割[M]．北京：科学出版社，2001．

数字图像处理综述范文

篇1

篇2

篇3

篇4

篇5

篇6

篇7

篇8

篇9

篇10

免责声明

AI创作文章

热门标签

相关文章

相关期刊

数字生活

数字财富

数字传媒研究

数字印刷

精品范文

学术顾问