卷积神经网络的难点范文

时间:2024-03-29 18:16:48

导语:如何才能写好一篇卷积神经网络的难点,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

卷积神经网络的难点

篇1

关键词 深度神经网络 图像分类 车型识别 预测

中图分类号:TP317.4 文献标识码:A

0 引言

所谓的深度学习是根据具有多层结构的人工神经网络所提出。在具体的深度学习中,主要借助模拟神经系统中的层次结构,来进行数据结构特征的反映,一般来说,细节用低层次进行表示,抽象数据结构则用高层次来表示,利用这种方式,能够进行数据挖掘学习,满足学习要求。在传统的车型识别发展中,主要涉及到的技术包括模式识别、特征选择和提取以及检测分割等方面内容,在技术发展中,存在的难点主要涉及到如何将完整的目标车辆区域进行分割,这是项基础工作,也是难点所在。这结合实际需求,对于不同拍摄角度下的汽车图片,包括皮卡车、SUV、面包车以及小轿车进行车型识别,其目标质量分割质量则是最为关键的技术,直接影响到最后的判断效果。所以,应该重视进行具有代表性特征的选择处理,并相应转化成有效的参数过程。在获取特征参数后,则应该结合项目要求来选择合理的分类器,这样才能保障识别的准确率。结合汽车车型识别问题的要求,这里网络输入则是原始图像,利用神经网络优势,原始数据经过卷积层、完全连接层以及Softmax 层的培训学习,通过这种深度神经网络来进行分析处理,免于上述存在难度的图像分割、手工提取等过程。

1数据集

这里的车型识别目标的数据集主要包括皮卡车、SUV、面包车以及小轿车等四种类型。其中,训练集和测试集分别包括1025张和368张原始图片。此数据集中,包括不同摄像角度中的汽车图像照片,具有背景复杂、图像大小不统一,车辆在图片中所占比例具有较大差异性等方面问题,这些都在一定程度上造成车型识别的难度上升。

在预处理中,为了保证网络输入的一致性,对于原始图像进行调整处理为256?56?尺寸。在此基础上,对于图像RGB三个通道的均值进行计算,并进行均值标准化的处理。在具体的网络训练测试的过程中,主要则是选取224?24? 的样本作为输入。

2网络结构探讨

结合文献所提出的深度神经网络VGG16的优势,我们将其应用在汽车车型识别问题中。VGG16网络具有较强的优势,主要包括5个堆栈式的卷积神经网络ConvNet,以及3个完全连接层以及1个Softmax层,由此可见,其属于“网络中的网络”架构。在每个每个ConvNet中,还有多个卷积层所构成,然后紧跟随着Max-Pooling层。在进行卷积以及池化处理的基础上,进行三层完全连接处理,同时,Softmax层的输入则是最后一个完全连接曾的输出,在这基础上,实现车型分类的要求。结合实际需求,将非线性的ReLU层加入该网络中,这样就会让ReLU来处理卷积层和完全连接层的输出,保证训练时间有效降低。另外,还将一种正则化Dropout方式应用在网络中,避免出现完全连接层中的过拟合问题。

另一个神经网络Alexnet,结构稍微简单一些,主要包括5卷积层、3个完全连接层、Softmax层等几部分,在进行部分卷积层处理后,在进行Max- Pooling层处理。在此网络中,同样采用非线性的ReLU层,所采用难度重叠池化方式,也能有效保证尽量降低过拟合的问题。

3实验结果分析

结合上述分析的深度神经网络VGG16和AlexNet的基础上,进行Gaffe框架的搭设,为了保证运算效率,建立在GeForce GTX TITAN X CPU的工作站中。经过统计,单一网路训练大约为2小时,一张图片测试大约为0.2秒。在应用上述网络测试、训练之外,在分类过程中,还应用了经典的分类算法KNN。经过实验分析,可以看出,VGG16网络能够具有比较好的分类结果,能够实现准确率为97.3%,而AlexNet网络准确率达到为93.0%,KNN算法不能有效处理较为复杂背景的图片,分类准确率仅为52.3%。在具体的案例中,分析VGG16网络错误分类的情况,面包车具有完全正确的分类效果。在错误分类的SUV车型中,究其原因,主要包括:车颜色有两部分组成,红色部分则和皮卡车车型相同;车型结构太类似于皮卡车;背景中加入其他车型,这样会造成分类结果不准确。如果图片中仅仅包括车头的情况,在进行车型识别中也存在较大的难度,不同车型从前面角度进行观察,并没有太大的差异化,这点应该明确指出。

4结语

这里采用深度学习方法,结合先进的深度神经网络,以及功能强大的计算机工作站,对于四类汽车进行识别实验研究。经过试验表明,VGG16网络具有最好的分类效果,传统的经典分类算法往往仅为其准确率的一半左右。所以,可以看出深度神经网络具有强大的学习能力,能够在图像分类问题中表现出很大优势,应该不断优化深度神经网络的结构,以便其适用于更多的图像分类要求。

参考文献

[1] Hinton G E, Osindero S, Teh Y W.A Fast Learning Algorithm For Deep Belief Nets[J]. Neural Computation, 2006, 18(7):1527-1554.

篇2

关键词:拉格朗日力学; 图像预测; 图像追踪; 天气雷达; 临近预报

DOIDOI:10.11907/rjdk.162240

中图分类号:TP317.4

文献标识码:A文章编号:1672-7800(2016)012-0001-04

0 引言

多普勒天气雷达(以下简称雷达)是现代气象业务研究及应用中不可或缺的重要工具,基于雷达回波及图像的追踪与外推是短时临近预报的关键性技术,也是长期以来的难点问题。准确而及时的雷达外推预报,可以为局地龙卷风、雷暴、短时强降水等极端灾害性天气提供预警,以便做好防御措施,最大限度保障人民及生命财产安全。

近半个世纪以来,很多学者在基于雷达资料的预报领域作出了大量卓有成效的贡献,并逐步形成了一系列较为通行的方法。例如,TREC算法通过逐区域寻求相邻时刻雷达反射率的最大相关,跟踪整个回波区域的移动,并且假设回波具有一致的移动方向[1]。CTREC算法则利用交叉相关分析,跟踪反射率因子大于一定阈值区域的移动,进而推算回波的发展[2]。TITAN是由美国国家大气研究中心(NCAR) 研发的一套风暴识别、跟踪、分析和预报系统,其利用雷达一次完整体扫所构成的三维结构数据对强回波中心进行识别追踪[3-4]。SCIT算法则更加侧重对雷暴单体的有效追踪和预测[5-7]。近年来,又有一些学者试从图形图像学中的光流技术入手,通过分析雷达回波时序图像中的光流场特征进行回波强度和位置的外推预测[8-11]。此外,还有基于神经网络、模式匹配等多种方法[12-14]。

总体来说,这些方法的共同之处是需要分析相邻时刻雷达图像(或基数据)中区域的相似性,而该相似性的度量,如最大相关法,虽然可以计算出最匹配的位置,但匹配和外推结果往往表现出发散性或多个最优解。并且,基于窗口平移的模板匹配算法无法适应区域图像的旋转和变形等情况。

为了克服相关性度量算法所遇到的问题,本文考虑对位移场的分析加以分层,也就是每个特征运动被认为是确定在相对粗糙的空间分辨率下的平稳变化趋势的总和,然后衍生为更高的空间分辨率下的小幅度局部修正,并对此过程进行多次迭代。对于位移场的分析,将充分考虑雷达回波所指示风暴的动力学特征,运用拉格朗日力学相关理论构建预测模型。该方法的研究意义在于进一步提高中小尺度、强对流天气事件的预测能力,且相对于光流等一些大运算量算法,本方法运算规模更小,进而能够更好地满足短临预报业务高时效性的要求。

1 理论与方法基础

1.1 雷达回波外推预测

大量研究表明,合理的外推预测算法可以为降水、雷暴、冰雹等对流天气的预报提供重要支撑[15-17]。基于外推预报的一般性描述为:

其中,pt(x,y)表示任一位置的回波强度,U和V分别表示回波在水平和垂直方向上的偏移量,由U和V共同组成回波移动的速度矢量。g表示一个函数,用来计算单位时间间隔后回波强度的变化。根据式(1),Δpt(x,y)反映了任一点(x, y) 在t 时刻回波强度的变化情况,U和V反映了回波移动的方向和速度。此外,函数g代表一个拉格朗日动力学过程,在此过程中雷达回波的强度是由其沿回波路径移动时在拉格朗日坐标系统中的历史变化推导出的,也就是用当前回波演变的趋势预测回波未来的位置和强度。究其趋势预测的方法,多年来诸多学者作出很多研究,本文主要从拉格朗日力学角度进行分析,提出一种雷达回波图像追踪预测的方法。

1.2 拉格朗日力学

拉格朗日力学是由Joseph Lagrange[18-19]最早提出的一种力学分析方法。由于该方法引用了广义坐标的概念,使得对力学相关问题的研究更具普适性。

在雷达回波图像预测研究中,如何准确得到回波运动矢量是预测需要解决的关键问题。在不考虑天气系统的非线性变化时,拉格朗日力学模型能够满足构建回波发展演变过程的算法要求,式(1) 可以改写为:

有研究表明,对整个回波图像采用统一的U和V所构成的位移矢量,可适用于对大尺度天气系统的预测分析,如对卫星图像的外推预测和云导风的分析[20]。但对于局地强对流天气系统,预测结果往往与实际偏差较大。因此,这也是本文将重点阐述解决的问题。

2 雷达图像追踪预测

2.1 基于拉格朗日力学的追踪算法

在上述理论基础上,根据大气运动演变发展的规律及其在雷达回波图像上的表征特点,构建基于拉格朗日力学的追踪算法模型,如式(3) 所示。

该模型假定所预测的回波图像是当前和过去若干个回波图像以固定时间间隔而变化的函数。f2表征一个用于估测单位时间间隔前后回波图像各相应网格点回波强度值变化率的函数,即回波的演变趋势。在不断生消、发展的对流系统中,ΔP可以为正,也可以为负数。式(4)~式(6) 进一步表明了函数f1和f2,即回波移动矢量及回波强度的计算方法。

2.2 中心极值滤波

为了降低雷达杂波对位移矢量计算的不良影响,本节提出采用一种滤波器对雷达基数据进行滤波处理。其基本思想是:逐网格分析回波强度特征,如果某格点的值大于周边最相邻一圈(共8个网格)的最大值,或者该值小于周边最相邻一圈的最小值,则将当前网格点回波强度值用上述8个网格的最大值或最小值替代。

如图1所示,位于当前中心点的数值39大于其最邻近一圈8个网格的最大值。因此,使用数值23替换当前网格的39。

从图像上看,该滤波方法可显著降低图像中的椒盐噪声,从实际效果上看,该方法可以有效过滤单点的杂波奇异值,较传统的均值滤波和中值滤波更好地保留了回波细节[21-22],特别是回波中梯度变化较大的边缘区域。

2.3 分层外推预测算法

由于天气系统复杂多变,特别是尺度较小的局地强对流,其生命周期短的只有几分钟到几十分钟,由于其空间尺度小,生消速度快,因此,包括基于拉格朗日力学在内的各种线性关系外推算法,其预测准确性都存在一定的局限性。为了改善这一问题,本节提出采用分层的外推预测方法。该思想最早由Bellerby等 [20]提出,并研究应用于卫星图像的云顶平流场分析中。

该算法的关键流程为:先将当前雷达回波图像逐级抽稀,降低图像的分辨率,以模糊回波细节,由此粗略估算出回波主体的移动趋势;然后再反向逐级提高图像分辨率,在较粗的移动趋势基础上,细化和订正位移矢量的细节。从而产生一个在空间上连续和平滑的且不受模板边界不连续性影响的矢量场。计算方法如式(7)所示:

对于每一级抽稀计算,都是将当前一级各网格点的回波强度值经由公式(7)计算,并往复迭代。其中P表示某一点的回波强度,L和L-1代表抽稀的层级,在本文下述实验中,采用的最高层级为4。

在计算两个相邻时刻图像中回波的位移时,可以借鉴交叉相关法,计算方法如式(8),在每个选定的匹配窗口遍历出最大相关矩阵的位置,从而输出位移矢量。

式(8) 中,P和P’ 分别表示相邻两个时刻(如t-Δt与t)的回波,(x, y) 表示图像中的某一点,X和Y表示匹配窗口的大小。再将两幅回波图像之间的网格还原或内插到其先前空间分辨率的两倍,重复上述匹配。该迭代过程还考虑到了由非矩形网格代表的局部扭曲,结合这些局部扭曲,使外推预测算法能够适应旋转、扩展、缩小等回波图像形态上的变化。如此插值和匹配计算,迭代直到网格分辨率达到原始雷达图像分辨率。

3 实验与结果分析

3.1 实验数据说明

为检验所述方法的预测效果,本实验数据使用2016年6月南京地区多普勒天气雷达的基数据文件。该雷达使用VCP-21体扫模式,探测周期为6分钟。实验选用1.5°和2.4°仰角的基本折射率数值。为方便计算,实验前将原始数据由极坐标系统转换为平面直接坐标系统,数据的图像分辨率为920×920。为减少样本数量,从全部7199个基数据文件中筛选出以230库长为半径,其覆盖区域内具有大面积强回波的数据文件,共计880个。

3.2 实验结果分析

为检验雷达回波图像预测的准确性,使用与预测同一时刻的雷达实际探测数据作比对分析,计算过程采用交叉相关检验法。

首先以自然日为单位,统计逐日样本数据中每份预测结果与实况交叉检验的相关系数的平均值,如图2所示。

图2中3种图案标记分别表示预测6分钟、30分钟和60分钟的检验结果,每个值代表当日所有样本检验结果的平均值。横坐标为2016年6月的逐个日期,纵坐标为相关系数,其中横坐标4、5、9、10等日期没有标记图案,原因是这些日期的当日为晴天或少云,体现在雷达上没有强的大面积回波,因此没有列入样本数据进行分析。从图2中还可以看出,本方法预测未来6分钟的结果与实况相比,相关系数超过87%,平均达到93%以上,而随着预测时效的延长,预测准确率逐步下降,在未来60分钟的预测中,全月平均相关系数为70%左右。

进一步统计分析每次预测准确率的稳定性。以6月19日全天样本数据为例,统计每批样本所预测6、12、18至60分钟结果分别与实况交叉相关检验的情况,如图3所示。

图3中,每个柱状条的顶端和底端分别表示检验的相关系数的最大值和最小值,柱状条中间的黑色方形表示相关系数的均值。可以看出,随着预测时效的增长,其预测准确率的个体差异也随之增大。在前6分钟的预测中,该差异约为3%,30分钟时约为8%,而到预测60分钟时,差异进一步增大到20%。结果与强对流天气系统具有生命史短、突发性强,水气生消发展变化快的特点是相一致的。

4 结语

由于天气系统复杂多变,特别是对于中小尺度的对流系统,其生消、发展时间短、变化快,如何进行准确、有效的预报是提升当今短时临近预报的关键环节之一。考虑到大气中水气等物质的移动变化应遵循一般力学规律,而拉格朗日力学正是表征和计算动力学问题的普适性方法,因此,本文的预测动力模型建立在拉格朗日力学关系基础之上。又由于天气系统的变化表现在雷达图像上,其回波图形具有相当的不确定性,因此,本文提出采用分层的位移场分析方法,先假定位移矢量是在相对粗糙的空间分辨率下的平稳变化趋势的总和,然后在更高空间分辨率下作小幅度局部修正,并如此进行多次迭代。为了减少低仰角杂波对实验结果的影响,提出采用中心极值滤波对实验数据进行处理。结合上述理论构建起基于拉格朗日力学的追踪预测模型及算法流程,以雷达基本反射率因子作为输入场,追踪和预测回波在空间和时间上的位移矢量,并由此预测未来一段时间雷达回波的位置和强度。

实验部分采用1个月样本数据对本算法模型进行检验,通过预测结果与同时刻实况的比对分析,得出两者的相关性和个例稳定性等评价指标。结果表明,该方法能够较好地预测局地天气系统的演变过程,在未来30分钟的预测中准确率平均超过80%,且对于辅助预报未来60分钟内的局地龙卷风、强降水、雷暴等灾害性事件具有实践应用的价值。

参考文献:

[1] 刘红艳,魏鸣.多普勒雷达风场资料在临近预报中的应用[J].大气科学学报,2015(4):483-491.

[2] 郑永光,林隐静,朱文剑,等.强对流天气综合监测业务系统建设[J].气象,2013(2):234-240.

[3] 周康辉,郑永光,蓝渝.基于闪电数据的雷暴识别、追踪与外推方法[J].应用气象学报,2016,(2):173-181.

[4] DIXON M, WIENER G.TITAN:thunderstorm identification,tracking,analysis,and nowcasting―a radar-based methodology[J].Journal of Atmospheric & Oceanic Technology, 1993, 10(6):785-797.

[5] SHAH S, NOTARPIETRO R, BRANCA M.Storm identification,tracking and forecasting using high-resolution images of short-range X-band radar[J].Atmosphere, 2015, 6(5):579-606.

[6] 庄旭东,胡胜,陈荣,等.“雨燕”中风暴算法与新一代雷达SCIT产品的对比分析[J].热带气象学报,2011(3):299-306.

[7] DUAN Y, XU Y, ZHI S.Application analysis of the hail suppression operation based on the improved SCIT Algorithm[J].Meteorology & Disaster Reduction Research, 2014(15):23-29.

[8] 曹春燕,陈元昭,刘东华,等.光流法及其在临近预报中的应用[J].气象学报,2015(3):471-480.

[9] GARCIA F, CERRI P, BROGGI A, et al.Data fusion for overtaking vehicle detection based on radar and optical flow[J].2012, 7(2272):494-499.

[10] 王兴,王新,苗春生,等.基于GPU加速的雷暴追踪外推方法研究[J].南京师范大学学报:工程技术版,2015(1):35-42.

[11] STAINVAS OLSHANSKY I, BILIK I, BIALER O.Doppler-Based Segmentation and Optical Flow in Radar Images: US20160084953[P].2016.

[12] 盛仲飙.BP神经网络在数据预测中的应用[J].软件导刊,2016(1):147-148.

[13] 王利卿,黄松杰.基于多尺度卷积神经网络的图像检索算法[J].软件导刊,2016(2):38-40.

[14] WANG X, GU Y H, MIAO C S, et al.Parallelization and performance optimization of radar extrapolation algorithm with OpenCL[J].Journal of Internet Technology, 2016(17):323-330.

[15] .雷达外推预报与暴雨数值模式融合预报降水方法研究[D].北京:中国气象科学研究院,2013.

[16] 张蕾.多普勒雷达回波演变的动力学分析及临近预报算法改进[D].南京:南京信息工程大学,2015.

[17] FOX N I, WEBB R, BALLY J, et al.The impact of advanced nowcasting systems on severe weather warning during the sydney 2000 forecast demonstration project:3 November 2000[J].Weather & Forecasting, 2004, 19(1):97-114.

[18] 李艳艳.相似空间中不变的欧拉-拉格朗日方程[J].河南大学学报:自然科学版,2014,03:273-276.

[19] ERICKSEN R E, GUITERAS J J, LARRIVEE J A, et al.A parachute recovery system dynamic analysis [J].Journal of Spacecraft & Rockets, 1967, 4(3):321-326.

[20] BELLERBY T J.High-resolution 2-D cloud-top advection from geostationary satellite imagery[J].IEEE Transactions on Geoscience & Remote Sensing, 2006, 44(12):3639-3648.

篇3

【关键词】 遥感 城市扩张 城市范围 分类

1 引言

随着我国经济持续快速的增长,我国进入城市数量和体量快速增长的阶段。城市的发展与扩张,引起了诸多学者的关注,然而城市范围的界定往往是研究城市扩张的前提,而利用遥感进行城市范围提取正趋于成熟。

遥感是指不与探测目标相接触,从远处把目标的电磁波特性记录下来,通过分析揭示出物体的特征性质及其变化的综合性探测技术[1]。由于遥感具有大面积同步观测、时效性、综合性、经济性等特点,因而在城市范围提取中被广泛使用,如阿里木江・卡斯木[2]等在研究塔什干市城市扩张时同时使用了TM、ETM+、ALOS-AVNIR2三种影像数据。在众多关于城市扩张的研究中,对城市范围的提取方法种类繁多,本文基于各方法特点,将如今主要的基于遥感影像的城市范围提取方法归纳总结为基于人工解译方法,基于图像分类方法,基于光谱指数和指数模型方法,基于相关因素提取方法这四种方法。

2 方法研究

2.1 基于人工解译方法

人工解译方法主要是指目视解译,它凭借解译人员的经验知识,将遥感图像转换成可以被非专业人士理解的现实中的实物。作为传统的判别方法,人工解译的方法一般精度较高,但工作量大。王茜[3]等在对南京市城市扩展的研究中将预处理和几何纠正的图形直接进行人机交互目视解译的方法,对南京市市区成片的区域在计算机中勾画,由此获得南京市城市范围。

人工目视解译作为遥感研究人员必备的一项技能,但在如今遥感技术智能化,高效化的发展过程中,其作为城市范围提取方法的核心作用越来越小,更多的只能作为一种辅助判别方法或是对成果进行检验的手段。人工目视解译本身也受到解译标志、图像质量、解译人员的经验等因素的影响[4],所以在解译的过程中应该在这些方面引起足够重视以保证解译的质量。

2.2 基于图像分类方法

遥感图像分类分为非监督分类与监督分类,其为获取遥感图像信息最常见的处理方法。非监督分类是指人们事先对分类过程不加入任何先验知识,而仅凭遥感图像中地物光谱特征进行分类,分类结果不能确定类别属性,相对的监督分类则是引入已知类别象元作为训练区再对图像进行分类[5]。

在遥感影像的城市范围提取中首先会对图像进行预处理与增强,增大城市与非城市像元DN值的差别,再对影像进行分类,从而区分出城市与非城市区域。图像处理方法的选择对城市区域分类结果有很大的影响。如杨恒喜[6]等在提取昆明市图像中,先对图像做了直方图均衡化处理,将DN值域增大使其呈正太分布,增强了图像上地物与地物之间的反差,再利用非监督分类的方法提取了城市建成区域,得到城市面积大小。余新朝[7]利用植被差值归一化指数阈值的设定,经过波段运算处理后,单独对图像进行监督或非监督分类都不能取得良好效果,而在结合了多次监督与非监督分类的方法后才较为准确地生成了城市建成区范围图。

基于图像分类的城市范围提取方法在很大程度上减轻了研究人员解译的工作强度,并能得到较为准确的结果。分类前的图像处理方法多样,且多内置于影像处理软件中,操作简单,效果显著;另一方面,分类算法中如最大似然分类、马氏距离分类等逐渐完善,人工神经网络等更智能的分类算法的出现,使图像分类结果更加准确,也使该方法在提取城市范围中得到更广泛的认可。

2.3 基于光谱指数和指数模型方法

由于地物对太阳光的反射和吸收存在差异,导致不同波段中的地物反射信息存在差异,研究人员利用这种差异将卫星不同波段探测数据进行组合运算,得到反映研究所需特定信息的指数,称之为光谱指数,而提取这种指数的特定方法则称为指数模型。

基于此方法的城市范围提取也随着相关的光谱指数和指数模型如归一化差异建筑指数(Normalized Difference Built-up Index, NDBI)[8]、图像卷积运算模型[9]等的发展而得到大量应用。NDBI相对来说使用最广泛,它是在对归一化植被指数NDVI经过深入研究后的拓展,最早由杨山[10]对提取无锡市城乡聚落空间信息而提出,称之为仿植被归一化指数。Y.ZHA[8]等基于TM数据的TM4与TM5波段特性,得到表达式

NDBI=(band5-band4)/(band5+band4)

运算后城镇区域的亮度值增大,其他区域的亮度值都减小,其中NDBI>0的部分为城市,NDBI≤0的部分为非城市区,从而提取出城市范围。NDBI在分类中也存在不足,邓文胜等[11]就曾证明其在大面积复杂区域的应用效果不是很好。基于此光谱指数的城市范围方法也在不断的改进,徐涵秋[12]就放弃了单纯使用NDBI,同时利用了NDBI、土壤调节指数SAVI、修正归一化差异调节指数MNDWI将ETM+数据的六个波段压缩为呈不相关的三个波段,并用谱间信息的相关性逻辑运算,提取出城市建成区域,且抽样验证精度达到 91.3%。

基于光谱指数和指数模型方法充分利用了图像波段间的光谱信息差异,城市范围确定精度通常高于基于图像分类方法的结果。由于此方法充分挖掘了城市地物与非城市地物间光谱信息异同,所以光谱指数和指数模型方法的可重用性更加强,适用范围也更加广泛。

2.4 基于相关因素提取方法

城市作为一个综合体,其包容的元素多样,所表现的性质从不同的角度观察也有不同的结果,因此,除了如上常用的一些方法外,还有一些利用相关因素间接提取出城市范围的方法。

基于不透水面的确定来提取城市范围的方法。广义的不透水面(Impervious Surface Area,ISA)是指天然或人为建造,能够隔离地表水渗透到土壤,进而改变洪水径流的流动、物质沉淀和污染剖面的任何物质[13]。目前研究的人工不透水面多指停车场,道路,屋顶,广场等地物,然而这些地物也是城市的组成部分,再加上如今城市的建设都离不开人工修建的不透水面,所以对城市不透水面范围的确定,在一定程度上可以看作是对城市范围的确定。白杨[14]等人已经完成了在不透水面的基础上,用面向对象的方法,对城市建成区域的提取,得到的城市范围基本与实际吻合。

基于地表温度的确定来提取城市范围的方法。地表温度主要受地表覆盖物影响,由于城市建设,城市地表主要被水泥等人工化合物取代,导致与农田、林地、水体等自然覆盖物的地表温度有明显差异。李昕瑜[15]等人就已经通过反演地表亮温发现,地表温度与归一化不透水面指数NDISI、NDBI呈正相关。王跃[16]等更是利用Landsat的热红外波段,将反演的亮温以296K为界,提取出了苏州市城市范围。

基于这些相关因素提取来提取城市范围的方法突破了以往比较固定的思维,为城市区域研究提供了一种新的思路。但此方法的不足在于难以验证这些相关因素和城市范围之间的联系紧密度,因而有时会对准确提取城市范围造成较大影响。

3 结论与讨论

城市范围的提取在对城市扩张、城市总体规划、城市生态环境等研究中都具有基础性的作用。随着对城市的研究增多,出现了多种多样的城市范围提取方法,经过对大量研究的对比总结,基于对各种方法的主体思想或关键步骤的分析,本文将众多城市范围提取的方法归纳为人工解译方法、图像分类方法、光谱指数与光谱模型方法以及相关因素提取方法。

经过分类后的对比还发现,人工解译方法提取的相对精度较高,但进度慢,耗时多;图像分类方法较人工解译方法更加便捷,但结果相对较差,同时分类前的影像处理和分类方法的选择对分类的结果有较大的影响;光谱指数与光谱模型方法在指数和模型建立之前需要进行大量的分析,但其方法适应范围广,同时对城市范围的提取结果又有充分的物理依据;相关因素提取方法通过对城市特有的相关信息的提取来确定城市范围,此方法思路新颖,发展前景广,但相关因素与城市相关性的确定将是其研究的重点与难点。各种方法虽有不同之处,但在研究中往往又相互联系,相互补充,使城市范围的提取朝着更加精确的方向发展。

随着中国经济的发展,城市的扩张还将持续,由此给我们带来的影响,将会引起越来越多学者的关注。笔者认为,随着遥感信息提取技术的发展,多源数据的应用,以及土地信息数据库的完善,基于遥感的城市范围研究也必然会有新的突破。

参考文献:

[1]梅安新等编著.遥感导论.北京市:高等教育出版社,2001.

[2]阿里木江・卡斯木,阿斯耶姆・图尔迪.基于遥感数据的塔什干市城市扩展时空特征分析[J].新疆师范大学学报(自然科学版),2012,(第2期).

[3]王茜,张增祥,易玲,谭文彬,王长友.南京城市扩展的遥感研究[J].长江流域资源与环境,2007,(第5期).

[4]姜放,张国勇.遥感图像目视解译值得注意的几个问题[J].长春工程学院学报(自然科学版),2002,(第3期).

[5]汤国安等编著.遥感数字图像处理.北京市:科学出版社,2004.

[6]杨恒喜,史正涛,陈可伟.基于遥感影像的1992-2002年昆明市城区扩张及驱动力分析[J].环境科学与管理,2010,(第6期).

[7]余新朝.基于多时相遥感影像的城市演变分析[J].城市勘测,2013,(第6期).

[8]Zha, Y. Y., Gao, J. J., & Ni, S. S. (2003). Use of normalized difference built-up index in automatically mapping urban areas from TM imagery. International Journal Of Remote Sensing, 24(3), 583.

[9]MUXiaodong,LIUHuiping,WANGHongbin.Application of image convolution to extract the urban extent[J].遥感学报,2011,(第6期).

[10]杨山.发达地区城乡聚落形态的信息提取与分形研究:以无锡市为例[J].地理学报,2000,(第6期).

[11]邓文胜,关泽群,王昌佐.从TM影像中提取城镇建筑覆盖区专题信息的改进方法[J].遥感信息,2004,(第4期).

[12]徐涵秋.基于谱间特征和归一化指数分析的城市建筑用地信息提取[J].地理研究,2005,(第2期).

[13]SloneckerET,JenningsD,GarofaloD. RemoteSensingof ImperviousSurfaces: AReview[J]. Remote Sensing Reviews,2001,20(3):227-255.

[14]白杨,宁晓刚,张继贤.基于不透水面和引力模型的城市建成区提取与分析[J].测绘科学,2014,(第1期).