图像编辑范文

时间:2023-03-18 08:58:34

导语:如何才能写好一篇图像编辑,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

篇1

电视作为现代社会中重要的大众传播媒介,其异于其它大众传媒的地方,在于它的直观形象性。离开了色彩鲜明、清晰生动的画面,电视也就失去了它的魅力。因此,图像编辑必须在正确把握节目的主题和内涵的前提下,准确选择富有表现力的画面,生动直观地把节目的主题和内涵表达出来。但是在实际操作中,由于现场情况的限制,记者拍摄的往往只是基本的创作素材,数量多而杂,所以必须经剪辑之后才能成为真正有用的材料。比如在2008年的抗冰雪救灾中,衢州一千多名党员干部奔赴第一线开展多种形式的救助活动,新闻中心也派出强大的采访队伍,深入山区进行采访报道,并在《衢州新闻》栏目中推出《冬日里的温暖》系列报道。在这组报道推出前,我们提前策划、精心准备;在拍摄中,大家克服了很多困难;后期制作时我们再把前方记者采制回来大量的新闻素材进行分类组合,以达到最佳的传播效果。《冬日里的温暖》这组报道的图像编辑突出一个“情”字,通过党员干部为山区老百姓除冰铲雪、架设电网、运输食品等一系列活动,使温暖的主题得到深刻表现,同时也增强了新闻报道的感染力。

图像编辑的主观能动性和创造性主要表现在对稿子和素材正确有效的处理上。文字编辑对图像处理往往并不十分了解,播音员事先也不知道图像的实际再现效果,所以这个中间环节的制作者只能是图像编辑。图像编辑绝不是不动脑子只动手指的机械操作员,恰恰相反,优秀的图像编辑能根据新闻内容,选择最富有表现力的图像,取得以一当十的艺术效果。虽然一个画面在屏幕上停留的时间只有几秒钟,但选择得当、处理完美的画面通过蒙太奇的表现手法,能够给受众留下极其深刻的印象。专题片《石三奶的故事》介绍的是一位71岁产党员石三奶承包荒山搞农业综合开发的事迹。为了反映主人翁的精神,笔者在编辑时交替使用了大量的劳动工具和满山遍野果实累累的丰收镜头,并用夕阳空镜头作为过渡,使整个画面沐浴在一片金黄色之中。电视特有的剪辑方式让这些画面更集中、更鲜明地表现出人物的个性。它既能起到象征的意义,又能富有美感地烘托出主人公“满目青山夕阳红”的情怀,使整个片子取得了较好的艺术效果。

此外,图像的剪辑还可以表现强有力的视觉冲击和节奏感。例如,表现抒情内容或宏大的场面时,可以用较长的镜头画面进行组接;表现强烈动感或欢快、紧张等气氛时,则可用较短的镜头,营造不断高涨的气氛。纪录片《喜悦的丰收》为了表现农民联产承包,粮食丰收的喜悦心情,片子开头就将敲锣打鼓放鞭炮的特写画面与农民的笑脸特写交替剪辑,用不断变化的组接方式来产生富有节奏感的热烈气氛。而那些奥运集锦的纪录片,更是利用内容上的对比因素来造成画面语言的不断变化,如冷与暖(滑冰与游泳)、刚与柔(滑雪与花样滑冰)、力量与技术(举重与体操)等,通过对比的剪辑手法,给观众留下深刻的印象。

受众的积极介入是现代电视生命力的源泉,所以,电视节目的制作必须十分注重受众的意见和态度。正因为受众与电视的交流主要是通过画面来完成的,所以,图像编辑尤为重要。图像编辑不仅要以制作者的身份,而且要以受众的身份,认真地感受画面,准确地选择画面,才能取得好的效果。这样,电视记者、制作者与受众之间的距离无形之中就缩短了。例如为了配合衢州市创建国家卫生城市,营造良好的社会氛围,从2009年开始,《衢州新闻》推出了记者蹲点实录系列报道。该节目以纪实的手法把那些不文明的行为用电视镜头一一纪录下来,然后与这些不文明行为所造成脏、乱、差的后果进行对比剪辑,再组接市民现场采访的内容,几组画面交叠出现,使这一组报道内容得到更为充分的体现,在市民中形成了强烈的共鸣,取得了很好的宣传效果。

篇2

关键词:双边滤波 边缘保持 超分辨率 最速下降法

中图分类号:TP391 文献标识码:A 文章编号:1672-3791(2013)06(c)-0004-02

在超分辨率技术研究初期,所做工作都是针对单幅图像展开的。最早的方法是在一帧图像上进行插值,但插值后图像的高频细节被丢失,且无唯一解。1984年Tsay和Huang[1]第一次提出了从互有位移的多帧图像序列中插值产生一帧高分辨率图像的概念,才从本质上解决了图像超分辨率无唯一解的问题。Kim将建立在频域上的算法模型扩展到包含噪声的情况。研究发现基于序列和多幅图像的超分辨率重建效果比单幅的超分辨率重建更好。

超分辨率重建问题是一个病态求逆过程[2~4],且图像在获取和传输过程中不可避免地有噪声,在重建图像中首先需要过滤噪声,但边缘保持能力往往不强。为此,本文提出基于双边滤波算子的多帧超分辨率重建模型,采用基于各向异性扩散的双边滤波算子进行保边去噪处理。

1 退化模型

图像的超分辨率重建就是在已知退化图像序列的基础上重建高分辨率图像。假设有N帧观测到的低分辨率图像,为理想的高分辨率图像。观测模型为:

可简化为:

2 提出的算法

结合图像亮度信息作为滤波权系数的双边滤波方法使得滤波后的图像中的信息得到相应的加强,同时在对噪声的去除方面有明显的改进。在达到对图像进行平滑去噪的目的同时,还可以很大程度上保持图像的边缘信息。

2.1 双边滤波算子

双边滤波器是图像空间邻近度和像素相似度相结合的一种折中处理。从各向异性扩散的稳健性统计出发,定义了基于双边滤波算子的罚函数:

2.2 最小化问题及迭代求解

为保证方程组求得的解逼近真解,需使图像数据保真度即残差项最小,建立如下基于数据残差项L1范数的最小化泛函:

为了在重建图像过程中能得到收敛的稳定解,同时有很好的噪声抑制效果,则需要对图像本身做假设,将图像的先验知识用于重建算法中。将基于双边滤波算子的罚函数作为约束条件,通过最小化代价函数获得高分辨率图像:

上式在数据保真项和约束项的共同作用下,选择合适的最优化求解算法,得到高分辨率图像的稳定唯一解。对能量泛函计算其梯度,通过采用最速下降法进行迭代求解得到最优解:

3 仿真实验结果及分析

为验证算法的有效性,对合成的图像序列进行超分辨率重建实验。采用双线性插值法、POCS算法和本文算法从重建的视觉效果方面进行对比分析。

先后对理想HR图像添加高斯噪声、亚像素平移、因子为2的降采样,产生10幅LR模拟图像。图1(a)为256×256的理想HR图像,图1(b)是其中4幅128×128的LR图像。

从视觉角度上看本文算法效果最好,图2(c)只是对一帧低分辨率图像进行了双线性插值,不能利用多帧之间的互补信息,细节较为模糊,图像质量并没有任何的改善;利用POCS方法重建的,效果不理想,图像中存在着大量的模糊。同时考虑了空间距离因素和像素灰度值因素的本文算法重建的图像,质量和清晰度得到明显的提高,具有很强的去噪能力。

4 结语

本文提出了利用多个低分辨率图像序列的互补信息获取更高分辨率图像的方法。结合图像灰度信息作为滤波权系数的双边滤波去噪方法,构造了代价函数。实验结果表明本文算法与其他算法相比能够在滤除噪声平滑图像的同时较好地保存超分辨重建图像的边缘信息。

参考文献

[1] R Y Tsai, T S Huang. Multi frame image restoration and registration[C]. Advances in Computer Vis-ion and Image Processing. Greenwich CT: JAI Pre-ss,1984:317-339.

[2] S Farsiu, M Robinson, M Elad, et al. Fast and Robust Multiframe Super Resolution[J].IEEE Trans. on Image Processing,2004,13(10):1327-1344.

篇3

[关键词] 边坡 变形 稳定性 动水压力

1 引言

随着我国基础设施建设的蓬勃发展,在建筑、交通、水利、矿山等部门都涉及到大量的边坡问题。边坡在演变过程中将发生不同形式和规模的变形与破坏,如滑坡和崩塌等。边坡在形成过程中,其内部原有的应力状态发生变化,引起应力重分布和应力集中等效应。为适应这种应力状态的变化,边坡将发生不同形式和不同规模的变形与破坏,这是推动边坡演变的内在原因。各种自然营力和人类工程活动也可造成边坡外形、内部结构及应力状态的变化,这些营力则是推动边坡演变的外部因素。

2 边坡变形破坏的发育过程

边坡在发生滑动之前通常是稳定的。由于各种因素影响,边坡土体强度逐渐降低,或边坡内部剪切力不断增加,使边坡的稳定状况受到破坏。在边坡内某一部分因抗剪强度小于剪切力而首先变形,产生微小的滑动,以后变形逐渐发展,直至坡面出现断续的拉张裂缝。随着裂缝的出现,渗水作用加强,变形进一步发展。后缘拉张裂缝加宽,开始出现不大的错距,两侧剪切裂缝也相继出现。坡脚附近的土石被挤压,滑坡出口附近潮湿渗水,此时滑动面已大部分形成,但尚未全部贯通。随着边坡变形的继续发展,后缘拉张裂缝进一步加宽,错距不断增大,两侧剪切裂缝贯通并撕开。边坡前缘的土石挤紧并鼓出,出现大量的鼓张裂缝,滑坡出口附近渗水混浊,这时滑动面已全部形成,接着便开始整体地向下滑动了。边坡变形破坏的发生是一个长期的变化过程,通常可将边坡变形破坏的发育过程分为三个阶段:蠕动变形阶段、滑动破坏阶段和渐趋稳定阶段。

3 土质边坡变形及稳定性的主要影响因素

3.1 内部因素

3.1.1边坡岩土体类型和性质

地层土体类型及其性质的差异是影响土质边坡稳定的主要因素。不同土层组成的边坡有其不同的内力作用机制,也有其不同的变形破坏形式[1]。

① 粘性土边坡。根据粘土成分的不同,分为一般粘土边坡、红土边坡、裂隙性硬粘土边坡等。粘土颗粒细密,但由于生成环境的不同,各类粘土的组织结构、物理力学特性等差别较大,对边坡稳定性的影响也不一样。但一般都具有干时坚硬开裂,遇水后膨胀分解呈塑状的特点,对边坡稳定极为不利。若土体内存在软弱结构面,则破坏了边坡土体的整体性,而且还降低了土体的抗剪强度,边坡常沿这些软弱结构面发生滑动变形破坏。

② 软土边坡。软土因其抗剪强度极低,流变性能显著,对于边坡稳定极为不利。由于软土的塑流变形,边坡随挖随塌,难以成形,这对于工程边坡的影响更为严重。

③ 砂性土边坡。由于砂性土结构较疏松、粘聚力低,边坡坡度一般较缓;由于砂性土一般透水性较大,所以,饱和含水的均质砂土边坡,在振动力作用下,易于发生液化破坏,对边坡的稳定不利。

④ 黄土边坡。黄土在我国华北、西北地区大面积分布,黄土具有多孔性,孔隙比一般为40%~50%,成分以粉粒为主,天然状态下含水量甚少,干燥时甚坚固,可形成直立边坡,但遇水后土体强度大为降低,容易剥落或遭受侵蚀,黄土边坡的变形以崩塌和滑动为主。

3.1.2地质构造

地质构造对边坡稳定的影响表现为结构面的产状、发育程度、规模、连通性及充填物成分、充填程度对边坡稳定性的影响。一般情况下,同向倾斜边坡比反向倾斜边坡稳定性差,同向缓倾边坡中,结构面倾角越陡,稳定性越差。结构面走向和边坡坡面走向之间的关系,决定了可能失稳边坡运动的自由程度,当倾向不利的结构面走向与坡面平行时,整个坡面都具有临空自由滑动的条件,因此对边坡的稳定最为不利;结构面走向与坡面走向夹角愈大,对边坡的稳定愈有利。而结构面充填的软弱物质会降低边坡抗剪强度,不利于边坡稳定。

3.1.3边坡形态

边坡形态对边坡的稳定性有直接影响。不利形态的边坡往往在坡顶产生张应力,并引起坡顶出现张裂缝;在坡脚产生强烈的剪应力,出现剪切破坏带,这些作用极大地降低边坡的稳定性。一般来说,坡度越陡,边坡越容易失稳,坡度越缓,边坡越稳定;而坡高越大,对边坡稳定越加不利。平面上呈凹形的边坡较呈凸形的边坡稳定;同是凹形边坡,边坡等高线曲率半径越小,越有利于边坡稳定。

3.1.4地下水

地下水对边坡稳定性的影响不仅是多方面的,而且是非常活跃的,包括地下水的埋藏条件、流量、渗流条件及其动态变化等。大多数边坡的破坏和滑动都与地下水的活动有关。地下水对边坡稳定性的影响可反映在以下几个方面:

3.1.4.1 静水压力

处于地下水位以下的透水边坡将承受水的浮托力的作用,使坡体的有效重量减轻;而不透水的边坡,坡面将承受静水压力,充水的张开裂隙也将承受裂隙静水压力的作用,这些都对边坡的稳定不利。地下水的存在使边坡土体的含水量增大,土体容重也随之增加,而且孔隙水压力也随之增大,从而引起剪应力增大和土体抗剪能力下降,使边坡稳定受到影响。

3.1.4.2 动水压力

地下水的渗透流动,将对坡体产生动水压力,在动水压力作用下,水流将带走边坡断层破碎带或其它软弱结构面中的细小颗粒。经过长期的渗流作用,土质边坡内部可能形成较为连贯的渗流通道,随着通道的不断扩大,坡体不断被淘空,最终将导致边坡失稳。

3.1.4.3 水的软化作用

水的软化作用指由于水的浸泡使边坡土体强度降低的作用。地下水的溶蚀和潜蚀也直接对边坡产生破坏作用。出露的地下水可能冲刷边坡坡脚,并不断侵蚀掏空,使边坡不断崩垮,引起坡体整体失稳。

3.2 外部因素

3.2.1振动作用

地震对边坡稳定性的影响较大,地震作用导致边坡稳定性降低主要是由于地震作用产生水平地震附加力,使边坡下滑力增大;而且,在地震力的作用下,边坡岩土体的结构发生变化甚至破坏,出现新的结构面或使原有结构面张裂、松弛,地下水状态也有较大变化,孔隙水压力增大,边坡岩土体强度降低,随着地震力的反复作用,边坡发生位移变形,最终导致破坏。因此,在地震时经常发生边坡失稳。

边坡施工或露天矿开挖中经常采用的爆破施工振动也是影响边坡稳定性的动力因素。因为爆破振动产生的惯性力增加了边坡岩土体的下滑力,而且由于频繁的振动影响造成岩土体中原有裂隙的松动、错动与扩展,降低了结构面的力学强度,加速了滑体的蠕变过程,导致结构体沿优势产状失稳滑出或剪出,或诱发较大滑坡。

公路、铁路边坡由于车辆的长期反复荷载而导致强度疲劳、边坡破坏。对于受双荷载的土质边坡(如坡顶受公路荷载,坡底受铁路荷载),作用于坡体顶部的公路载荷对坡体的破坏程度几乎贯穿于整个边坡,其破坏远远大于作用于坡底的铁路载荷,作用于坡体底部的铁路载荷,其对坡体的影响范围基本保持在动载源周围2m以内;由于长期作用下可能引起坡体下部的局部液化,从而加快了坡体的失稳。

3.2.2气候条件

气候条件对边坡稳定性的影响有多种作用方式,如降雨、气温变化等,其中以降雨的作用最为突出[2]。在降雨过程中,由于雨水的作用,将导致某些岩土体产生膨胀及物理力学性质的变化;降雨也使地下水位提高,增加静水压力造成地下渗流场的变化,产生动水压力;降雨使土体饱和而使其容重增加,引起土体内部剪应力的增大。

3.2.3风化作用

风化作用能造成岩土体结构面的规模增大,条件恶化,并可产生风化裂隙等次生结构面及次生粘土矿物,使地表水易于入渗,改变地下水的动态等。长期的风化作用可使岩土体的抗剪强度减弱,影响边坡的形状和坡度,还可使边坡岩土体脱落或崩塌。

3.2.4人类工程活动

随着公路、铁路及城市建设向着山区的不断延伸和发展,人类工程活动对于边坡的影响越发凸显出来。人类工程活动对于边坡的影响存在着两面性,它既是一种改造,也是一种破坏。适当的人类活动能增强边坡的稳定性,而不适宜的活动则会对其产生不利的影响[3]。对边坡稳定性产生显著影响的人类工程活动主要有:

3.2.4.1 开挖削坡

工程实际中不合理的开挖边坡如开挖坡脚,会造成边坡临空面过大,坡脚压重不够,降低了边坡滑动面的抗滑力,造成边坡失稳。开挖对变形的影响,不仅是由于应力变化产生瞬时变形,还有由此产生的蠕变,而且由于开挖并非瞬时结束,又会对后期蠕变产生影响。

3.2.4.2 坡顶加载

坡顶加载一方面增加了坡体的下滑力,另一方面加大坡顶张应力和坡脚剪应力的集中程度,使边坡岩土体破坏,降低强度,因而引起边坡稳定性降低。

3.2.4.3 不适当的开挖放炮

开挖放炮产生爆破动荷载,其振动作用产生的地震惯性力对边坡稳定也产生不利影响。由于爆破振动的频繁作用使边坡岩土体原有裂隙、层理产生扩张或错动,降低了岩土体结构面的抗剪性能,减小摩擦阻力,降低了边坡稳定性。

4 结语

边坡的稳定性受内部和外部因素制约,当超过土体平衡条件时,边坡便会发生失稳现象。包括边坡岩土体类型及性质、边坡地质构造、边坡形态、地下水、振动作用、气候条件、风化作用及人类工程活动等,特别是人类工程活动及地下水对边坡稳定影响较大。

参考文献:

[1] 常士骠.工程地质手册[M].北京:中国建筑工业出版社,1992.

篇4

针对传统基于稀疏字典对的超分辨率(SR)算法训练速度慢、字典质量差、特征匹配准确性低的缺点,提出一种基于改进稀疏编码的图像超分辨率算法。该算法使用自适应阈值的形态组成分析(MCA)方法提取图像特征,并采用主成分分析算法对训练集进行降维,提高特征提取的有效性,缩短字典训练时间,减少过拟合现象。在字典训练阶段,使用改进的稀疏K-奇异值分解(K-SVD)算法训练低分辨率字典,结合图像块的重叠关系求解高分辨率字典,增强字典的有效性和自适应能力,同时极大地提高了字典的训练速度。在Lab颜色空间对彩色图像进行重建,避免由于颜色通道相关性造成的重建图像质量下降。与传统方法相比,该算法重建图像质量和计算效率更优。

关键词:

超分辨率;稀疏表示;形态组成分析;主成分分析;颜色空间;机器学习

中图分类号:

TP391.41

文献标志码:A

Image super-resolution algorithm based on improved sparse coding

Abstract:

The traditional Super-Resolution (SR) algorithm, based on sparse dictionary pairs, is slow in training speed, poor in dictionary quality and low in feature matching accuracy. In view of these disadvantages, a super-resolution algorithm based on the improved sparse coding was proposed. In this algorithm, a Morphological Component Analysis (MCA) method with adaptive threshold was used to extract picture feature, and Principal Component Analysis (PCA) algorithm was employed to reduce the dimensionality of training sets. In this way, the effectiveness of the feature extraction was improved, the training time of dictionary was shortened and the over-fitting phenomenon was reduced. An improved sparse K-Singular Value Decomposition (K-SVD) algorithm was adopted to train low-resolution dictionary, and the super-resolution dictionary was solved by utilizing overlapping relation, which enforced the effectiveness and self-adaptability of the dictionary. Meanwhile, the training speed was greatly increased. Through the reconstruction of color images in the Lab color space, the degradation of the reconstructed image quality, which may be caused by the color channels correlation, was avoided. Compared with traditional methods, this proposed approach can get better high-resolution images and higher computational efficiency.

Key words:

super-resolution; sparse representation; Morphological Component Analysis (MCA); Principal Component Analysis (PCA); color space; machine learning

0 引言

超分辨率(Super-Resolution, SR) 即通过硬件或软件的方法提高原有图像的分辨率,通过一系列低分辨率图像来得到一幅或多幅高分辨率的图像过程。因其能够提供更高的像素密度和更多的细节,超分辨率技术在医学图像、卫星图像、监控等领域获得了广泛的应用。由于成本较高、工艺水平限制等原因,通过硬件提升获取高分辨率图像并不是经济的手段,所以现有的SR方法主要集中在软件领域,主要分为三类:基于插值的方法、基于重建的方法和基于学习的方法。

基于插值的方法简洁快速,但易产生模糊的边缘和不清晰的细节。常见方法有:双线性插值、双立方插值、基于自适应的2-D回归模型[1]等。基于重建的方法根据图像降质模型,利用各种先验知识来估计超分辨率图像,这类算法可以重建出较好的边缘,降低锯齿效应,但其使用的先验知识往往具有局限性,如轮廓梯度信息[2]、边缘信息[3]等。

基于学习的方法使用高分辨率和低分辨率图片训练集来预测低分辨图像中丢失的高频信息。通过训练字典,这类算法可以产生低分率图像中没有的细节信息,但是对训练集的依存度比较高,同时对噪声的抑制能力差。Freeman等[4]利用马尔可夫随机场,通过置信传播来建立低分辨图像块和高分辨率图像块之间的映射关系,需要的图片数量较大,且训练时间较长。Chang等[5]则采用流形学习算法,使用局部线性嵌入(Local Linear Embedding, LLE)规则,映射低分辨率图像块的局部特征到高分辨率图像块,然后通过近邻的线性组合来产生高分辨率图像块;该方法虽需要较少的样本图片,但易产生欠拟合或过拟合现象。Gao等[6]在LLE的基础上,提出了一种稀疏邻域选择算法来重建图像,该算法虽然解决了欠拟合和过拟合现象,但对于复杂结构图像的重建效果差。Yang等[7-9] 使用稀疏表示算法,利用高、低分辨率图像块之间的稀疏关联建立词典对,低分辨率的稀疏表示可用来重建高分辨图像;虽然这种方法重建效果较好,但训练时间过长,字典缺乏有效性。杨玲等[9]使用K-奇异值分解(K-Singular Value Decomposition, K-SVD)方法训练字典,利用RGB颜色通道的稀疏表示提取彩色图像块,训练速度较快;然而直接使用低分辨率图像本身作为训练集,虽保持了颜色信息,但造成特征冗余,易出现过拟合现象。Wang等[10]结合Yang[7]和Freeman[4]方法的优点,采用稀疏表示方法对图像中的中、低频信息进行编码,虽然提高了字典的有效性,但自适应能力差,训练时间长。

针对传统方法的缺点,本文提出一种使用改进稀疏编码的单张图像超分辨率算法。使用自适应阈值的

形态组成分析(Morphological Component Analysis, MCA)方法提取低分辨率图像的纹理和几何结构特征,采用高分辨率的高频分量构建训练集。针对训练集过大的缺点,使用主成分分析(Principal Components Analysis, PCA)算法对训练集进行降维,降低计算复杂度和字典尺寸。为了提高训练速度,使用改进的稀疏K-SVD算法进行稀疏字典的训练。同时,字典具有很好的灵活性和自适应性。根据图像块的重叠关系,优化求解高分辨率字典,所得字典质量更好。在图像重建时,利用Lab颜色空间的特点,避免颜色通道的操作对图像一致性造成的影响。

2 本文算法

基于稀疏表示的超分辨率模型的主要内容包含三个方面:特征提取、训练稀疏字典和重建超分辨率图像。本文使用自适应阈值的MCA方法提取低分辨图像特征与高分辨率图像块的高频分量作为训练集,用PCA方法对训练集进行降维;使用改进的稀疏K-SVD算法训练低分辨率字典,然后利用图像块的重叠关系求解高分辨率字典;在Lab颜色空间重建图像,所得图像质量更优。

2.1 稀疏字典学习

稀疏字典的训练方法可以分为两类:基于分析的方法和基于学习的方法。基于分析的方法一般首先构建数据的数学模型,然后使用一个分析结构去表示这个模型,Wavelets、Contourlets等均属于这类方法。在基于学习的方法中,稀疏字典是采用机器学习方法,从训练集中学习得到。这类方法具有很好的自适应能力,实际应用表现更好,但具有较高的计算复杂度,较多的限制条件和冗余,这类方法包含PCA、K-SVD等。

2.1.1 改进的稀疏K-SVD算法

Rubinstein等[13]在K-SVD[12]算法的基础上,提出了稀疏K-SVD算法。这种算法结合了两类学习方法的优点,采用加入“基字典”的稀疏模型,使用这个新的参数框架训练字典,具有较低的计算复杂度、更好的自适应性和稳定性;而且稀疏K-SVD可以和任意追踪算法组合使用,便于进行改进。

针对超分辨率传统字典训练方法耗时长、字典质量差的缺点,本文对使用类似Smith等[14]的方法对稀疏K-SVD进行改进,进一步提高其训练效率,当处理规模较大的训练集时,优势明显。改进措施在稀疏K-SVD的两个主要部分进行:字典更新阶段和稀疏编码阶段。在字典更新阶段,通过引入“更新循环”机制,即将仅循环一次的字典更新过程循环多次。这是因为字典训练时间大部分消耗在稀疏编码阶段,仅进行一次更新循环往往并不能得到最优的结果,而循环多次,也并不会明显增加训练时间,反而能够降低稀疏编码阶段的负荷,提高字典学习的效率。改进的稀疏K-SVD过程见算法2。

在稀疏编码阶段,使用上轮追踪过程后得到的k/3个(k为系数稀疏度)最大的系数进行初始化,然后计算剩余的2k/3个系数。系数重用操作更改OMP(Orthogonal Matching Pursuit)算法并不能带来明显的速度提升,当加入类似CoSaMP(Compressive Sampling Matching Pursuit)[15]中的“支集合并”和“剪枝”操作,改进Batch-OMP[17]就可以明显地提高编码的效率,达到快速执行编码的目标。“支集合并”操作:将当轮近似过程计算的结果与已经计算出的集合进行合并,然后计算稀疏表示。“剪枝”操作:从由最小二乘法计算出的近似结果中选出最大的k(或者小于k)个系数。具体过程见算法1。

算法1 改进Batch-OMP算法

2.2 图像特征提取与训练集构建

由于人眼对高频信息更加敏感,传统方法一般选择低分辨率图像的高频信息作为特征,例如拉普拉斯算子、高斯微分函数和梯度提取算子等。但是,它们通常只考虑到图像的几何特征,图像的纹理特性被忽略掉了,无法完整地体现图像的视觉特征。本文使用自适应阈值的MCA[17]来解决这个问题。

4 结语

本文提出了一种基于改进稀疏编码的图像超分辨率新方法。使用MCA/MOM方法提取低分辨率特征和高分辨率的高频分量作为训练集,对训练集进行降维,减少所需样本数量与字典训练所需时间,降低字典尺寸。使用改进的稀疏K-SVD算法和优化的字典对求解过程,能快速高效地得到超分辨重建所需字典。在Lab颜色空间重建所得图像能够保持颜色通道的一致性。虽然本文方法可以有效提高图像重建质量和计算效率,但利用图片本身的相似性来减少训练所需样本数量,提高特征提取效率;进一步提高该算法以应用到实时系统中;如何应用该算法到视频的超分辨率重建中都将是下一步的研究方向。

参考文献:

[1]

ZHANG X, WU X. Image interpolation by adaptive 2-D autoregressive modeling and soft-decision estimation [J]. IEEE Transactions on Image Processing, 2008,17(6): 887-896.

[2]

MARQUINA A, OSHER S J. Image super-resolution by TV-regularization and Bregman iteration [J]. Journal of Scientific Computing, 2008,37(3): 367-382.

[3]

TAI Y W, LIU S, BROWN M S, et al. Super resolution using edge prior and single image detail synthesis[C]// CVPR 2010: Proceedings of the 2010 IEEE Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE Press, 2010: 2400-2407.

[4]

FREEMAN W T, JONES T R, PASZTOR E C. Example-based super-resolution [J]. Computer Graphics and Applications, 2002, 22(2): 56-65.

[5] CHANG H, YEUNG D Y, XIONG Y. Super-resolution throughneighbor embedding[C]// CVPR 2004: Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE Press, 2004.:275-282.

[6]

GAO X, ZHANG K, TAO D, et al. Joint learning for single-image super-resolution via a coupled constraint [J]. IEEE Transactions on Image Processing, 2012, 21(2): 469-480.

[7]

YANG J, WRIGHT J, HUANG T S, et al. Image super-resolution via sparse representation [J]. IEEE Transactions on Image Processing, 2010,19(11): 2861-2873.

[8]

ZEYDE R, ELAD M, PROTTER M. On single image scale-up using sparse-representations [C]// Proceedings of the 7th International Conference, LNCS 6920. Berlin: Springer-Verlag, 2012: 711-730.

[9]

YANG L, LIU Y, HUANG R, et al. New approach for super-resolution from a single color image based on sparse coding [J]. Journal of Computer Applications, 2013,33(2):472-475.(杨玲, 刘怡光, 黄蓉刚, 等. 新的基于稀疏表示单张彩色超分辨率算法[J]. 计算机应用, 2013, 33(2): 472-475.)

[10]

WANG J, ZHU S, GONG Y. Resolution enhancement based on learning the sparse association of image patches [J]. Pattern Recognition Letters, 2010, 31(1):1-10.

[11]

DONOHO D L. For most large underdetermined systems of linear equations the minimal l1‐norm solution is also the sparsest solution [J]. Communications on Pure and Applied Mathematics, 2006, 59(6): 797-829.

[12]

AHARON M, ELAD M, BRUCKSTEIN A. K-SVD: an algorithm for designing of overcomplete dictionaries for sparse representation [J]. IEEE Transactions on Signal Processing, 2006,54(11): 4311-4322.

[13]

RUBINSTEIN R, ZIBULEVSKY M, ELAD M. Double sparsity: learning sparse dictionaries for sparse signal approximation [J]. IEEE Transactions on Signal Processing, 2010,58(3):1553-1564.

[14]

SMITH L N, ELAD M. Improving dictionary learning: multiple dictionary updates and coefficient reuse [J]. Signal Processing Letters, 2013, 20(1): 79-82.

[15]

NEEDELL D, TROPP J A. CoSaMP: iterative signal recovery from incomplete and inaccurate samples [J]. Applied and Computational Harmonic Analysis, 2009,26(3): 301-321.

[16]

RUBINSTEIN R, ZIBULEVSKY M, ELAD M. Efficient implementation of the K-SVD algorithm using batch orthogonal matching pursuit [R/OL]. [2012-10-10].http:///en/document/view/6635304/efficient-implementation-of-the-k-svd-algorithm-using-technion.

[17]

STARCK J L, MOUDDEN Y, BOBIN J, et al. Morphological component analysis[C]// Proceedings of the 11th SPIE Conference on Signal and Image Processing: Wavelet Applications in Signal and Image Processing. San Diego: SPICE, 2005, 59(14):1-15.

[18]

BOBIN J, STARCK J L, FADILI J M, et al. Morphological component analysis: an adaptive thresholding strategy[J]. IEEE Transactions on Image Processing, 2007,16(11): 2675-2681.

[19]

NING Q, CHEN K, YI L, et al. Image super-resolution via analysis sparse prior[J]. Signal Processing Letters, 2013, 20(4): 399-402.

[20]

IRANI M, PELEG S. Motion analysis for image enhancement: resolution, occlusion, and transparency[J]. Journal of Visual Communication and Image Representation, 1993, 4(4): 1993-12.

篇5

关键词:图像处理;非线性畸变;灰度校正

中图分类号:TP391.41 文献标识码:A 文章编号:1007-9599 (2012) 18-0000-02

用于普通扫描仪器扫描的书籍的时候由于装订线部分的部分无法与玻璃板紧贴,从而会使得扫描图像失真,不仅不利于阅读,也不利于光学识别(orc)。为了解决这个问题必须对这个图像进行校正。

基于以上分析,本文提出了一种图像校正方法,解决了包括背景灰度不均匀非线性畸变的校正方法,效果良好。

1 背景灰度非线性畸变校正

因为书籍的书脊部分远离扫描平面,并且有一定的倾斜角度,所以无法完全反射扫描仪发出的光,会出现扫描图像对应部分亮度下降的问题,造成靠近书脊装订线的部分页面出现黑影,并且明暗不均。越靠近中间书脊线的部分,越暗,灰度值越低,整个灰度值变化呈水平方向变化。

1.1 背景灰度畸变校正相关算法

目前主要的背景灰度畸变校正算法是采用背景灰度直方图估计法,来修正背景灰度值的分布。

背景灰度直方图估计法的原理:

首先估计出原始图像背景灰度分布,根据与标准图像背景灰度分布的比较,计算对比因子。然后根据灰度对比因子,恢复原始图像的背景灰度值至标准图像背景灰度。

对于原始图像背景灰度分布估计主要有两种方法:

(1)通过采样法,估计灰度分布。图像背景灰度不均匀分布,越靠近装订线背景越暗,灰度越小。在水平方向某一位置上,由于垂直方向上页面离开玻璃平板的距离基本一致,所以垂直方向上图像背景灰度也基本一致,所以空变的背景灰度只是在水平方向变化的一个函数。我们取一个采样窗口,以窗口内像素灰度直方图计算该处的背景灰度,采样窗口的设置需要符合两个标准:(1)每个区域内的像素点足够多,以使统计直方图有意义。(2)区域不要太大,区域内明暗应是基本均匀的。对于给定的采样窗口,背景是窗口中出现频率大的灰度区域,为此选取采样窗口内像素的灰度直方图中频率最大的15个灰度值,并由此计算这些灰度值上的像素平均灰度。此值为该处的背景灰度。随着采样窗口沿水平方向移动,可以得到一系列直方图,从而算出不同列上的背景灰度,为了把暗的背景校正为正常的背景灰度,定义背景灰度因子: , 为第n列的背景灰度, 为书页紧贴玻璃平板处的各列图像背景灰度的平均值,即为标准图像的背景灰度。那么根据扫描结果得出的空间变化的背景灰度因子 ,就可以使用这个公式 进行校正恢复。其中f(m,n)为原始畸变样图灰度值,g(m,n)为校正后的图像灰度值。

(2)通过投影法,估计灰度分布。根据图像分布的特点,第一步为去除图像四周的黑色区域。这里采用垂直和水平投影(即在水平或者垂直方向上求出像素的累加和)的方式,通过LoG算子找到突变区域为黑白分界线的位置。第二步为估计图像照度分布。由于扫描图像的对称性特点,照度的变化主要体现在水平方向的变化上。所以对图像做垂直投影,得到图像在水平方向的亮度变化曲线。对曲线进行高斯平滑,滤除字符和噪声等的干扰,再将曲线归一化到0~255的范围内(即根据最大值和255的比值对曲线进行缩放),再扩展为图像大小的矩阵,使矩阵的每一行等于刚才求得的曲线,即得到照度图像。根据照度图像对原始图像进行照度归一化(即,照度不足的区域使其变亮,照度充足的区域不变),即可达到消除阴影的目的。

2 背景灰度畸变校正的改进算法

基于对上述两种主要背景灰度畸变校正算法的研究,针对其不足之处,本文作出了一些改进,使其效果更好,效率更高。改进算法具体描述如下:

(1)提取背景灰度因子分布;

(2)对窗口采样法和投影法分析研究;

(3)采样法校正后会在部分页面出现灰度不连贯的块状条纹。

投影法校正后会使得部分页面区域灰度过白,过亮,特别是在书籍文字内容区域。

从比较中可以知道,造成图像校正效果误差的原因主要是来自背景灰度估计的不连续性。从图中的小波峰,小波谷,和锯齿跳变可以看到因为书籍文字内容的分布不均匀,造成背景灰度采样和投影的估计会出现跳变和误差。

采样法主要通过设置采样窗口,然后统计窗口内像素灰度直方图,选取采样窗口内像素的灰度直方图中频率最大的15个灰度值,并由此计算这些灰度值上的像素平均灰度。此值为该处的背景灰度,水平移动得到整个图像的背景灰度分布。因为在远离书脊中线的两边部分页面是紧贴扫描平板的,所以定义远离书脊中线的部分页面背景灰度像素值为标准背景灰度值。通过整个图像背景灰度和标准背景灰度值做比较,得到背景灰度因子分布图。

所以关键之处是在于背景灰度因子的估计,而背景灰度因子的估计主要取决于采样窗口的灰度直方图。

我们可以分析到,在采样窗口内由于部分文字内容的灰度像素值也会出现较大的频率,而我们选取了采样窗口内像素的灰度直方图中频率最大的15个灰度值,所以很大程度会对背景灰度的估计产生误差,这也是部分页面出现块状条纹的主要原因。这也是我们改进的主要部分。

投影法主要是通过对每列像素值进行投影累加,然后选取投影累加后像素和最大的为标准背景灰度,再用每列的投影累加后的像素和去和定义的标准背景灰度去对比,得到照度分布。也是由于书籍中部分文字内容分布不均,有黑体字,所以造成部分列的投影出现偏差,得到的照度就会出现跳变,造成校正的效果有部分页面出现过亮现象,部分文字模糊.而投影法定义的对每列投影累加,使得改进的地方很少,所以选取采样窗口法对非线性灰度畸变进行校正。

篇6

关键词: 吐蕃;小邦制;西北诸族;影响

中图分类号:C951

文献标识码:A

文章编号:1005-5681 2012 02-0083-04

Further Discussion on the Evolution of Tubo Chieftain System and the Outside Influence

YANG Ming

Abstract: According to the book Tubo Historical Document from Dunghuang version, there were a large number of chieftains in the Qinghai-Tibet plateau before founding up of the Tubo Kingdom by Songzanganpu. After having succumbed to the Tubo kingdom, most of the chieftains changed into local substantive authorities. In the second half of the Tubo Kingdom, only three small chieftains survived: Axia, Gongbu and Nyiangbu. With the help of Han and Tang historical records, the author found that the Tibetan chieftain system was influenced by the Minority Chieftain system in the northwestern area during Han and Tang dynasties. Thus the paper indicates that in the aspect of the political system, there was some interplay between the Tubo kingdom and the ethnic groups in the northwestern area.

Key words: Tubo Kingdom; chieftain system;northwestern ethnic groups;influence

据《敦煌本吐蕃历史文书》等古藏文文献记载,松赞干布建立吐蕃王朝之前,青藏高原上小邦(rgyal phran)林立,小邦之王称为“小王”(rgyal phran bgyid pa)。对此,台湾学者林冠群著有《唐代吐蕃的杰琛(rgyal phran)》一文,详尽地考证了吐蕃王朝建立前后rgyal phran的分布及其变化。{1}而笔者在此基础上,试图进一步探讨吐蕃小王制的演变,及其如何受到汉唐间西北诸族小王制的影响。

一、 传说时代的吐蕃“小邦”

法国藏学家石泰安曾经在其名著《川甘青藏走廊古部落》中指出:综合《红史》、《苯教源流史》以及《国王遗教》等藏文文献的叙事方法,经过了一系列不同的时代,每一个时代又都由一种特殊的魔鬼或小神所主宰。如:

第一个时代由夜叉或魔所控制;

第二个时代由怪所统治;

第三个时代由龙神所统治;

第四个时代由玛桑所主宰,玛桑六兄弟就是在这个时候归降的;

第五个时代由部落、氏族神所垄断;

第六个时代由十二位小国王(rgyalphran silma bcugnyis)或国王们所控制;

第七个时代由吐蕃的君主,即聂赤赞普所统治。[1]

而《贤者喜宴》在“吐蕃人类的起源”之后,具体地提出了十二个 “小王国”的顺序表,说到:

如是,人类众生广为繁衍。其时有十二小邦,然而,最后则有四十小邦割据。

1.琛地之楚许,琛王名古雍,大臣为囊及亭。

2.香雄之地,王为黎纳许,大臣为玛及热桑。

3.娘若琼嘎之地,藏王为童嘎,大臣为囊。

4.努域陵古地区,努王为米巴,大臣为梅鸟及卓 。

5.娘若香波地区,以洛昂王为钟,大臣为谢及苏。

6.吉日群云地区,有吉王为芒布,大臣为昂及卓。

7.昴雪查纳地区,有森王迟昌松,大臣为噶尔及年。

8.约甫邦卡地区,有邢王敦诚,大臣为俄及贝。

9.芝显瑞莫贡地区,有昌王贡囊,大臣为窄及秀。

10.工域芝纳地区,有工王嘎布,大臣为督及卡巴

11.娘域纳松地区,有娘尊囊杰为王,大臣为蒲及托杰。

12.达域楚奚地区,有达王莽波杰,大臣为朗及冈木二人。

篇7

关键词:小波变换;遥感图像;图像超分辨率重建

1 引言

遥感技术是从远距离感知目标反射或自身辐射的电磁波、可见光、红外线,对目标进行探测和识别的技术。例如航空摄影就是一种遥感技术。人造地球卫星发射成功,大大推动了遥感技术的发展。现代遥感技术主要包括信息的获取、传输、存储和处理等环节。完成上述功能的全套系统称为遥感系统,其核心组成部分是获取信息的遥感器。遥感器的种类很多,主要有照相机、电视摄像机、多光谱扫描仪、成象光谱仪、微波辐射计、合成孔径雷达等。传输设备用于将遥感信息从远距离平台(如卫星)传回地面站[1]。但是受遥感器成像系统的分辨率极限、调制传递函数及信噪比,以及大气传播介质干扰等方面的影响,往往难以直接获得分辨率高、模糊变形少的高质量遥感图像。若通过提高图像采集设备传感器的密度来提高遥感图像分辨率,由于摄像仪器的传感器排列密度的限制和高昂的设备价格使得这类方法在一般应用难以被广泛接受和应用。提高图像分辨率的另一方法是提高芯片尺寸,但这将导致电容的增加和电荷转移速度的下降。于是通过超分辨率图像重建技术提高图像分辨率成为研究热点。该方法提高图像分辨率不受成像硬件装置的分辨力限制,也降低了获取高分辨率图像的成本。

超分辨率图像重建的方法很多,本文主要介绍基于小波的方法。小波算法是一种电子技术的科学算法,是用于图形压缩并识别的一种高效的算法。目前应用于各个需要对数据进行压缩识别的领域。作为图像处理的工具,小波具有强大的功能。近年来,越来越多的研究人员开始使用小波来实现超分辨率图像的重建。最初将小波理论应用于超分辨率图像重建的是Ford和Etter[2],他们于1998年提出了一个基于一维多分辨小波基的超分辨率重构算法,该算法针对非一致采样的一维信号进行重建。2000年,Nguyen[3]等人将该方法拓展为基于多分辨框架的二维超分辨率图像重建算法。这些方法都是基于小波插值理论的算法,没有考虑噪声的影响。本文利用小波的多分辨分析的思想对低分辨率图像的二维模型进行分解后,得到行和列方向的信息后进行重建得到分辨率更高的图像。

2 基于小波的遥感图像超分辨率重建

2.1 小波的二维多分辨分析

多分辨分析是小波理论中最为重要的部分,并在实际中得到广泛应用。设二维信号f(x,y)∈L2(R2),对任一尺度可以将子空间Vm+1分解为四个子空间的直和,其表达式如下

上式中的上标d,h,v分别表示对角、水平、垂直方向,式子右边四个空间分别可以写成两个一维子空间 和 的Kronecker积,如下所示

上式中上标“(1)”是用来区分一维和二维子空间的。那么二维信号f(x,y)可以分解为

2.2 基于小波的图像超分辨率重建

假设一幅低分辨率图像有M×N个像素,经过重建后得到的高分辨率图像的分辨率是低分辨率图像的r倍,f(x,y)表示坐标为x,y像素的灰度值。将f(x,y)代入(1)式当中,分解得到某个尺度M上的拟合图像与尺度M或更高尺度上的水平、垂直和对角方向上的细节信息。其中 。需要求解的是尺度系数 和各方向上的小波系数 ,分别为

在选定小波的情况下, 都是已知的,将已知的低分辨率图像带入上式,组成关于α和 的超定方程组,通过迭代和正则化方法来解方程可以得到α,由 可以依次求得 。

3 实验

实验采用245×245大小拍摄船舶的遥感图像如图一,采用db2小波进行二层分解如图二,最后重建得到更高分辨率图像,如图三。

4 结论

遥感图像经过小波方法处理后,分辨率得到明显改善,充分显示了小波理论在图像处理应用中的强大功能。有些文献中介绍了基于学习的方法选择尺度系数和小波系数,这种方法使得重建的效果更好。

[参考文献]

[1]朱光良.高分辨率卫星遥感技术发展与应用问题的思考.浙江教育学院学报,2003.

[2]N.Nguyen and P.Milanfar,A wavelet-based interpolation-restoration method for Superresolution(wavelet superresolution).Circuits Systems Signal Processing. Vol.19(4),2000:321-338.

[3]Rafael C.Gonzalez and Richard E.Woods.Digital Image Processing.2006.

篇8

关键词: DSP; CPLD; 图像采集; 图像处理

中图分类号: TN919?34; TP368 文献标识码: A 文章编号: 1004?373X(2013)24?0081?05

Development of portable image acquisition device

WU Jie1, ZHU Ling?ming2, WANG Zhi?kun3, SONG Xiao?ru1

(1. School of Electron Information Engineering, Xi’an Technological University, Xi’an 710032, China;

2. Hunan Aerospace Management Bureau, Changsha 410205, China;

3. The 7801 Institute, China Aerospace Science and Industry Corporation, Changsha 410205, China)

Abstract: The image acquisition hardware system designed in this paper, taking DSP and CPLD are as the core, has the functions of the acquisition and quick processing of the digital signal output by image sensor. It is composed of power supply module, DSP peripheral circuit, digital image processing module and CPLD logic control module. It has the merits of small volume, low cost, flexible online programming, perfect real?time processing, etc. It can solve the practical application conflicts among the weight, size, cost, etc. It has the universality for amount of data which is less than 512 K×8 b. The debugging results show that the image acquisition system achieve the expected goal.

Keywords: DSP; CPLD; image acquisition; image processing

0 引 言

随着现代高科技电子技术的快速发展,图像采集与处理,尤其是嵌入式图像采集处理得到越来越广泛的应用。而传统基于计算机的图像采集处理系统,应用CCD图像传感器和视频解码芯片实现的图像采集系统,硬件组成复杂,体积庞大,不便于携带[1]。DSP(Digital Signal Processor)微处理器所特有的性能已被广泛应用于要求处理速度快、实时性要求高的各种场合,比如:信号处理能力比较强,体积较小,实时性相对高,便携性好等;而CPLD(Complex Programmable Logic Device)是EDA技术的不可缺少的组成部分之一。其特点是开发周期短、成本相对比较低、设计灵活性能比较强等。本文以DSP微处理器和CPLD为核心,应用CMOS图像传感器的图像采集处理系统既能较好满足处理的实时性又能满足小型化便携式的要求,有着十分广泛的应用前景。

1 便携式图像采集器系统总体方案设计

本系统主要由图像采集和图像处理两大部分组成。DSP微处理器是系统的核心,负责图像处理,同步逻辑时序控制主要由CPLD来完成,图像采集当然由图像传感器OV7660来完成。本文将图像数据采集和处理集成到同一系统中,实现嵌入式的最大特点,减小硬件电路的体积大小,把可编程逻辑器件的优势发挥尽致,提高整个系统的性能。USB接口方便了图像数据的输出。系统框图如图1所示。

2 图像采集模块

CMOS传感器具有功耗小、成本低、便于集成等优点[1]。OV7660的驱动过程遵循SCCB(Serial Camera Control Bus)协议。

图1 系统的整体框图

通过对仅需要更改的数据寄存器操作写数据,即可设置OV7660的寄存器值。因而文中采用三相写数据的方法。当SIO_C为高电平时,OV7660的ID地址被发送,再把寄存器地址送入,接着要写入寄存器中的数据送入;最后当SIO_C为高电平时,使SIO_D信号大约保持低0.6 μs的高电平,再保持1.3 μs的高电平,即满足结束条件。

根据CMOS图像传感器OV7660的数据手册中输出数据时序图[2],可知传感器在输出一帧同步信号(VSYNC)后,即输出一帧的数据。这一帧帧包括了144行图像数据。然后在输出1行数据时,输出HREF行同步信号。在PCLK像素同步信号的上升沿稳定输出,其中每行输出176个像素点。分析OV7660的时序图可知,VSYNC即帧同步信号,表示1幅图像数据开始采集。因此其可作为DSP的中断信号输,初始化接收和传送图像数据的DSP内部外设。

3 硬件系统设计

系统硬件设计主要包括电源模块、DSP电路模块(时钟电路、复位电路、外扩存储器等模块电路)、数字图像处理器电路模块和CPLD逻辑控制模块等。

3.1 嵌入式微处理器DSP的电路模块

3.1.1 电源模块

设计电源模块电路时,尤其是嵌入式系统,通常需考虑功率和散热问题。TMS320VC5402是DSP微处理器的典型芯片之一。其具有较好的电源性能,可双电源供电方式,其工作电压等级分别为3.3 V和1.8 V。考虑到双电压和上电次序,选择了TI公司专用电源芯片TPS73HD301。其性能指标:输入电压等级3.97~10 V,输出电压中,一路为3.3 V,另一路是可调的,其输出范围为1.2~9.75 V,芯片自身保证上电顺序;其电源电路硬件结构图如图2所示。

3.1.2 存储器扩展

对于图像处理往往对存储器容量的要求比较高,而VC5402的内部存储器资源很难满足要求,因而对其外部存储器的扩展是必要的。

图2 电源模块原理图

(1)扩展程序存储空间

由于文中大致有101 376×8 b的实验数据量,因而VC5402的本身数据空间远远不能满足要求,存储扩展是必须的。由于采集的图像数字暂时不存放在数据空间(由于考虑到较为复杂的数据空间),直接将其存储在程序空间。

考虑到本课题实验用到的图像系统的速度、电压和容量等参数要求,选用扩展的程序存储芯片是ISSI公司的静态RAM芯片IS62LV51216AL。该芯片特性:512K×16 b的容量大小,最短10 ns的读取时间,将,每页32 Kb大小,共4页的SRAM,即共128 Kb的容量,这样是可以满足图像数据容量的要求。

图3 数据存储器的扩展图

采集图像是通过CPLD_AB和OV7660_ DB给数据存储RAM中写如采集处理的图像数据信息。5片74LV245芯片可以实现CPU的AB、DB与数据存储RAM隔离驱动,整个采集系统的工作效率大大提高。当一帧图像数据采集完后,传感器OV7660采集停止,CPLD释放RAM总线的控制权,同时采集完成的中断信号通知微处理器读取并处理数据。图3中的74LV245被选通,数据存储器RAM总线释放给CPU控制权,来读取图像信息,完成图像处理。处理结束后,微处理器释放RAM总线的控制权,通知CPLD开始采集下一帧图像。

(2 扩展数据存储空间

便携式器件最大的特点是需要脱机运行,因此必须考虑到存放脱机程序。一些重要的启动程序、应用软件及重要数据等存储在FLASH存储器中,主要是利用了可擦写,易操作等的最大的特点。AT49LV4096A芯片是ATMEL公司的一款典型低功耗的FLASH存储器,其电压等级为3.0~3.6 V,512K×8 b或256K×16 b的存储容量,数据可以保存100年以上,高达10万次的可重复编程次数。

图4 FLASH存储的电路

3.2 图像数据采集模块

OV7660图像数据采集系统主要完成图像数据采集,其图像数据总线、帧图像数据时钟、帧同步信号、行同步信号与CPLD图像数据接收缓存板相连。其电路结构图如图5所示。

图5 CMOS数字图像传感器的电路图

该系统设计采用OV7660的电路如图5所示。其中, UV0~UV7及Y0~Y7是图像数据的输出总线,VSYNC是图像帧同步信号,HREF是图像的行同步信号,PCLK是图像数据时钟在时钟的上升沿,图像数据发生跳变。SBB引脚接跳线,用于设置OV7660在复位时读取引脚状态或I2C方式配置;PWDN引脚接地,OV7660不能工作在睡眠模式;UV0~UV7,Y0~Y7,XCLK1,HSYNC,VSYNC,PCLK,HREF,FODD,FREX接26针的插座,与CPLD相连,由CPLD输出时钟和控制信号控制OV7660。

3.3 CPLD逻辑控制电路

本课题控制的核心是CPLD模块。芯片的存储、时序控制和读写控制逻辑等是本设计的主要内容。微处理器DSP数据和程序空间的寻址靠[DS],[PS]以及[MSTRB]等信号来完成。其中[DS],[PS]以及[MSTRB]等信号来完成微处理器的数据空间和程序空间的寻址。

相应的器件选通后,CPLD实现译码功能,可大大简化硬件设计,比如SRAM、FLASH等的选通和控制,简化了DSP微处理器的软件设计量,系统的可扩展性增强了。为了更进一步完善系统性能,更多的逻辑控制可以利用CPLD来实现,CPLD控制模块功能框图如图6所示。

图6 CPLD的逻辑框图

如图6所示的CPLD逻辑功能说明如下:

(1)当CPLD与DSP通信时,通过读取XF电平和HOLD信号,来申请和释放总线控制权,来解决总线冲突问题;

(2)当图像采集过程时,图形采集器OV7660的HREF,VSYNC同步信号及时钟信号PCLK,可以逻辑控制数据锁存,产生地址信号,静态存储的读、写和片选信号;

(3)微处理器的控制信号(比如:片选RAM_CE、允许RAM_OE、写信号RAM_WE、片选Flash_CE、允许Flash_OE及写信号Flash_WE)和高位地址分页信号(A15,A16)在处理外部静态存储器和FLASH时,可以完成了锁存和译码的功能。

CPLD编程使用时,当HREF为高电平时,像素同步信号PCLK的分频时钟2PCLK是准确的;Y信号输出有效,将并行转为串行数据,即分频时钟2PCLK为并串转换电路的使能信号,其则转化时钟是实现对微处理器的多功能缓冲串口McBSP的初始化,由McBSP的BCLKR同步接收时钟来提供。CPLD软件也可实现串并转换功能,如图7所示。

图7 CPLD完成的时序转换功能

3.4 图像数据接收和传输

如图8所示为图像处理中数据的接收和保存。微处理器DSP内置的外设可以用来接收和传输图像数据。图中McBSP多功能缓冲串口可以接收图像数据[2]。DSP微处理器接收数据通过BDR口,以8位为一帧打包。BFSR接收帧同步信号以一帧8位信号来接收确定。微处理器DSP发出的BCLKR图像发送时钟信号,作为图像数据并串转换的时钟,通过BDR数据接收口接收串行的图像信息。接收到的信息暂存在RAM数据缓存区,同时也可以通过通信口送到上位机保存。

图8 图像数据接收和保存连接图

4 系统软件设计

系统软件设计主要包括DSP微处理器和CPLD逻辑控制两大部分。DSP微处理器作为整个系统的控制核心单元,主要负责系统的初始化、图像的采集和处理以及LED显示等功能;而CPLD逻辑控制功能适合系统的实时性要求。系统软件流程图如图9所示。

系统上电后,首先通过TPS73HD301的复位引脚进行复位工作。复位后,系统运行内部Bootloader程序,将用户程序搬运至指定地址后转移到程序入口开始主程序的执行。微处理器的I/O端口(McBCP多功能缓冲串口)可以用来模拟图像采集需要的SCCB可以对总线协议。可以实时发送采集图像的信号,可以对数字图像传感器OV7660进行初始化,还可以将采集到的并行数据转换为串行数据。同时OV7660的帧同步信号发出中断信号给DSP微处理器后。这样启动图像数据接收和传输的微处理器,即相应的图像处理功能在DSP内部执行。图像处理结束后,进入下一轮数据采集处理。

图9 系统软件流程图

5 系统测试

本系统中CPLD可编程逻辑技术提供存放图像信息的SRAM数据存储器的数据线、地址线、片选信号线和读写信号线等。当进行数据采集时,数据存储器的地址信号SRAM由计数器产生。其中用来作为地址计数器的计数时钟的是数据同步时钟信号PCLK。参考图像传感器OV7660的输出时序图,同PCLK下沿同步数据输出。因此文中用数据同步时钟信号PCLK的上升沿锁存,从而避免数据转换时产生的不确定状态。因此,在采集之前,假设初始地址是零,在数据同步时钟信号PCLK的上升沿实现地址加1操作,从而满足数据地址,相应地,HREF和PCLK反相分别作为片选信号和读写信号[2]。

CPLD检测DSP的XF为高电平时,说明TMS320VC5402马上就要访问存储器。外部ROM存储空间对应SRAM,外部RAM存储空间对应FLASH存储器。当微处理器访问存储器时,CPLD综合逻辑控制可以产生各个选通信号,其波形仿真图如图10所示。

具体的图像数据的采集验证如图10所示。由图10看出UV总线和Y总线输出的帧图像的各像素点的原始RGB值,在行有效时(HREF为高电平)为41,37,11(R1,G1,B1);40,44,11(R2,G2,B2)等。

6 结 语

本设计的总体方案为以CPLD控制图像的采集,微处理器DSP主要负责图像数据的处理。本图像采集处理系统最大的特点:较小的体积,较低的成本,且在线灵活编程,实时性较高等。本课题设计的图像采集系统实现了图像传感器OV7660输出的数字信号,可实时快速地进行采集并处理,尤其是图像容量小于512K×8 b容量的图像采集处理具有通用性。

图10 图像数据采集实验结果图

本文所设计的图像采集处理器配合相关的硬件,充实有关的软件,其应用领域还是比较广泛的。比如:医疗设备中图像的采集处理、指纹识别、人脸识别等。因此本次设计的图像处理系统,若是更完善,应用前景会更广阔,也将会有显著的社会效益和经济效益。

参考文献

[1] 涂晓昱.基于DSP的通用实时图像系统设计和研究[D].杭州:浙江大学,2004.

[2] Anon. OV7660FSG/OV7660FSL color VGA (640*480) concept camera module with Omni Pixel TM technology, version 1.2 [DB/OL]. [2005?04?13]. http://.

[3] ZARNOWSHI J. Active?pixel CMOS sensor improves their image [J]. Laser Focus World, 1999, 35(7): 111?116.

[4] 李芳.DSP在图像处理中的应用[D].杭州:浙江大学,2006.

[5] 胡晓飞,殳国华,张士文.基于视频处理芯片和CPLD的实时图像采集系统[J].电子技术,2002(10):28?30.

[6] 吴继华,王诚.Altera FPGA/CPLD设计[M].北京:人民邮电出版社,2005.

[7] CHANG M. Teaching top?down design using VHDL and CPLD [C]// Proceedings of IEEE Frontiers in Education Conference. Salt Lake City, UT: IEEE, 1996, 2: 514?517.

[8] 施先旺,王鹏武.发动机工况实时调节软件设计[J].火箭推进,2012(5):70?76.

篇9

关键词:图像分享;(t,n)门限;像素灰度值域GF(2m);代数几何编码;m位像素值的分拆与并行

中图分类号: TP309.7文献标志码:A

Secret image sharing and its algebraic coding method

英文作者名WANG Xiao-jing, FANG Jia-jia*, CAI Hong-liang, WANG Yi-ding

英文地址(Chengdu Institute of Computer Applications, Chinese Academy of Sciences, Chengdu Sichuan 610041,China)

Abstract: Image sharing is an attractive research subject in computer image information security field. Seeking for Perfect and Ideal image threshold secret sharing scheme (i.e. the complete image sharing scheme) is one of the unresolved challenging problems. By introducing into the methods of pixel matrix secret sharing over pixel value field GF(2m) and algebraic-geometry coding, a complete scheme of image sharing with a (t, n) threshold structure was achieved in this paper. The scheme could encode secret images into n shadow images in such a way that all the shadow images were in a Perfect and Ideal (t, n) threshold structure, while each shadow image had its own visual content assigned at random. This approach to image sharing was able to be applied to the new information carrier technology, e.g. network multipathed transmission of secret image in high security level, distributed storage control of secret image, bar-code in k dimension and Popcode. This paper also presented a method to cut down a great deal of computational time for image sharing based on a pixel field GF(2m), called "partition and paralleling of m-bit pixel".

Key words: image sharing; (t,n) threshold; pixel value field GF(2m); algebraic-geometry coding; partition and paralleling of m-bit pixel

0引言

给定正整数t≤n,如何将一幅秘密图像映射成n幅影子图像(即n个具有视觉意义的份额图像),使得从其中任何t个以上份额都可恢复秘密图像,而少于t个份额则无法恢复原秘密图像,属于视图的(t,n)门限秘密分享研究范围。视图秘密分享的目的是通过影子图像及其准入结构来保护秘密图像信息,影子图像的外在伪装视觉内容可以避免敌手的猜疑和攻击,而影子图像的准入结构是为了保证图像分享在密码学意义上的安全性,(t,n)门限结构则是一种备受青睐的准入结构。

图像分享的理念源于秘密分享理论。1979年,Shamir和Blakley[1-2]针对密钥等纯数据的安全保管问题,分别独立地提出了自己的(t,n)门限结构的数据分享方法。在秘密分享理论的发展中,一种秘密分享方案是否是完备的(Complete),即秘密分享的(t,n)门限结构是否同为完全的(Perfect)和理想的(Ideal),在信息安全上具有至关重要的基本重要性[3-4](完全的和理想的等概念详见本文第1章和第2章中的进一步说明)。Blakley的方案建立在空间平面交线(点)的简明几何观点上,但它不属于完备的方案。Shamir的(t,n)门限方案则基于素域Fp={0, 1, 2,…, p-1}上的插值多项式原理[1],其门限结构被证明既是完全的也是理想的[3-4],从而是一个完备的数据分享方案。由于数字图像是由像素值构成的,故图像分享可以视为秘密分享的一个专门领域。因此,和一般秘密分享一样,图像秘密分享方案是否是完备的(或准入结构是否既是完全的又是理想的)是安全性的主要考虑因素。然而,如果将秘密分享方法直接应用于图像分享上,得到的影子图像将是没有视觉意义的累赘数据集合(本文也称其为无视觉意义的份额),这很容易招致怀疑并被重点攻击、不利于保管。此外,在当代数字信息的许多应用场合中,保证恢复的秘密图像像素值的完整性和精确性也是十分必要的,因此适合准确描述图像分享的像素值域也需要建立起来。鉴于这些原因,发展针对图像分享这个专门领域的秘密分享方法是必要的,具有特殊重要的意义。

长期以来,人们尝试了各种方法去构造图像分享方案,力图让其影子图像各具独立的外在视觉意义、而其准入结构又是完全的和理想的。然而找到这样的完备方案并非易事[5-32]。早前图像分享的工作中,各种主要方案都是通过视觉秘密分享(Visual Secret Sharing, VSS)方法[7]来实现的。这种方法获得的影子图像的视觉效果一般都较差,恢复的秘密图像在像素数据上损失较大[7-24],与原秘密图像有明显差别。而且由于视觉密码方法固有的像素扩张问题[7-24],造成凡具有可视影子图像的VSS方案其准入结构都不是理想的。在随后发展的数字图像秘密分享理论中[6]26-28,33,人们把图像的门限秘密分享看成像素数据的秘密分享,依然沿用了早期数据秘密分享[1]所习惯的素域Fp={0,1,2,…,p-1}上的插值多项式的方法来构造(t,n)门限结构。此类方法先将秘密图像映射为若干没有视觉意义的份额数据,再将份额数据伪装在其他图像中,解决了影子图像的视觉意义问题和视觉质量问题。但这类方法构造的(t,n)门限结构迄今都不是理想的,因此这类方法尚欠缺密码学意义上的足够安全性。此外,由于数字图像的像素值在计算机等设备上是按照m位的比特值来表示的,故像素值域本质上是GF(2m)而不是素域Fp。而现有的数字图像分享方法仍然沿用Fp表示像素值域――它意味着图像的某些像素值不得不被“截短”或“填长”,这就必然造成像素数据的损失或冗余[6]。综上,迄今为止已有的各种图像分享方案[5-33]仍存在着明显的不足,尚不能很好地同时满足人们对安全性的期望和对视觉效果的追求,寻找针对图像分享的完备方案仍然是一个未解决的挑战性问题。

第3期 王晓京等:视图的秘密分享及其代数编码方法计算机应用 第32卷本文聚焦于解决当前图像分享领域中存在的上述根本问题,特别是其中理想的安全性问题。本文的新思路是:

1)不仅仅把图像分享看作像素数据的秘密分享,而且把图像秘密分享看作像素矩阵的秘密分享,由此可以构造像素矩阵的安全(t,n)门限结构。

2)由于秘密分享与编码理论的特殊相关性[34-36],对构造像素矩阵的(t,n)门限结构来说,采用最大距离可分码(Maximum-Distance-Separable, MDS)性质的编码公式[37]比采用传统的拉格朗日插值多项式更为方便,形式上也更具一般性。

3)通过像素灰度值域GF(2m)上的代数几何编码[37-39],很自然地实现了数字图像(t,n)门限秘密分享的一种完备方案:它的门限结构不仅是完全的而且是理想的,它的n个影子图像的外在视觉内容都是随机指定的,且影子图像的视觉质量与秘密图像几乎相同。

1相关研究

秘密分享的理论提出后,Naor等[7]于1994年提出了针对像素图的VSS方法,当时也称为视觉密码(Visual Cryptography Scheme, VCS),这是图像秘密分享的开创性工作。VSS的提出引起了多个领域学者们的广泛兴趣和研究参与,此后相继出现了许多关于黑白像素图像[19]和简单色彩图像[10]20-22的VSS方案。这类方案的一个典型例子是:在几张透明胶片上分别打印黑白像素点构成不同的影子图像(可以是没有视觉内容的点阵),其中某些胶片组合重叠在一起时人类视觉能辨认出预定的秘密图像,而其他组合则不会显露秘密图像。计算机屏幕也可以展示VSS的效果:用鼠标拖动某些数字图片重合一起时人眼可以看出预定的秘密图像,而其他图片的叠合则没有这种效果。VSS的基本特征是以人类视觉方法为主来实现像素图在视觉效果上的分拆与合成,不必采用复杂的密码算法,也不要求数据恢复的完整性,而(t,n)门限结构的VSS则是人们一直追求的目标。但是,VSS方案的影子图像和恢复图像普遍具有像素扩张膨胀的问题[10]19-22。为消除像素扩张,Kuwakado等[8]21,23-24后来补充了概率型视觉密码方法。付出的代价则是:恢复的秘密图像更加模糊不清,其影子图像一般也都是没有任何视觉意义的像素点阵。由于VSS主要依靠人的视觉感官而不是主要依靠逻辑计算来设计影子图像的像素,随着秘密图像的精细化及其恢复重构的精度提高,VSS的设计越来越困难,造成其固有的弱点:这类方案都无法保证像素数据的完整性和图像恢复的精确性,这使得其影子图像的视觉品质(清晰度和分辨率等)普遍比较粗糙[8]11,13,23,24,40,许多VSS方案也仅适用于非常简单的图像[7]12,15,22,由此恢复的秘密图像也只能粗略地与原始秘密图像相似[8]23,24,40,而且VSS的有效的(t,n)门限通常只局限于参数的特殊情形,例如,许多文献只给出了t=2或t=n[21]40的方案实例。因此,针对更复杂的视觉内容和更高的恢复精度,如何扩大门限参数t和n的自由度范围并保持图像像素不扩张,仍是发展视觉密码技术的一大难题。特别地,基于VSS的像素构造方法,目前还很难生成同时具有理想性质的门限结构和清晰视觉内容的影子图像。

图1中给出了VSS的一个(2, 2)门限方案实例[40]:该方案的图像视觉效果在VSS中属较好的一类。但该方案只有t=n=2的特殊情况下是可行的。

图片图1视觉秘密分享

2002年,Thien等[6]基于拉格朗日(Lagrange)插值多项式方法在计算机上实现了一种图像数据层的(t,n)门限秘密分享方案。该方案是完全的,并且可以处理高精度的彩色数字图像数据的任意(t,n)门限秘密分享,恢复的秘密图像数据也是完整的。该方案将一幅秘密图像视为像素数据的一个集合,然后把它映射为具有(t,n)门限结构的n个数据份额,其标志性的特点是把份额数据量缩小到了大约为原始秘密图像数据量的1/t,从而该方案的每个缩小份额都没有自己独立的视觉意义。但这样的缩小份额便于存储、传输以及隐藏(到其他宿主图像中)。在一系列研究中[26-30],许多后继工作按照Thien和Lin的方案思路沿着以下方向不断改进:通过无损或有损压缩的图像信源编码技术进一步缩小份额的数据量[26-28];将缩小份额隐藏在大尺寸[26-27]或小尺寸[33]的宿主图像中,从而赋予这些份额外在的视觉内容,成为秘密图像的影子图像。作为数字图像分享的这类新方法,这些方案通过付出一定的计算复杂性代价,最终克服了VSS的大部分固有缺陷。尽管如此,这些方案仍然存在着两方面的根本问题:

1)由于每个缩小份额所属的像素信息空间远比秘密像素空间要小,缩小份额导致了其门限结构不是理想的[1]3-4,基于这种门限结构的方案的安全性总归还是脆弱的(详见第2章和第4章)。尽管缩小的份额可以隐藏在另外一些宿主图像中[26-30]41,但是一个具有理想门限结构的图像分享方案比一个依靠信息隐藏[42-44]替代措施的图像分享方案在安全性上明显要强壮和可靠得多。Alvarez等[32]利用离散动力系统原理的可逆胞控自动机方法构造了一种图像秘密分享的理想方案。但该方案仅仅限制于平凡的门限参数时才是可行的,即它仅仅是一个(n, n)方案,而且该方案的影子图像只能是不具有外在视觉意义的乱码点阵。

篇10

关键字: 合成孔径雷达; 图像分类; 纹理特性; 变差函数

中图分类号: TN919?34 文献标识码: A 文章编号: 1004?373X(2013)06?0093?04

0 引 言

合成孔径雷达(Synthetic Aperture Radar,SAR)因其成像的高分辨、全天候特性而在各领域得到了广泛应用[1],对SAR图像的分类技术在军用和民用领域都具有十分重要的意义。目前SAR图像分类的重要方法多是基于纹理分析的方式,提取纹理特征的经典方法很多,M.Haralick已作了较为全面的总结[2],基本上可归纳为统计法、结构法、模型法和空间/频率域联合分析法等4类,它们有着各自的特点和不足。本文将讨论利用变差函数对图像进行分类的方法。变差函数是从描述图像空间相关性的角度刻画纹理。对于大幅面SAR图像而言,在利用变差函数分类法分析图像纹理特征时存在大量的冗余计算,若采用合理的算法设计,可以在很大程度上提高计算效率。

1 变差函数纹理分析的基本原理

2 基于变差函数的SAR图像分类方法

2.1 变差函数在图像纹理分析中的应用

在SAR图像中,建筑区灰度变化剧烈,而植被、水域等区域灰度变化相对较小,两种区域在非相似性上有较大的差异,这是通过纹理特征分析区分建筑区和非建筑区的依据。

变差函数用于纹理分析通常有以下2种方式:

(1)从1开始,递增取一系列离散间距,对每个间距值计算各加窗像素点的变差函数值,构成纹理特征矢量并以此作为分类依据。这种方式计算步骤简单,缺陷是需要较大的计算量来确保分类性能。

(2)逐点加窗计算变差函数曲线,利用模型拟合等方式求取相关参数。由于对大幅遥感图像进行逐点拟合时计算非常复杂,因而实用性较低。

2.2 变差函数纹理特征的计算

2.3 变差函数特征图的快速递推计算

(1)选定目标区域,计算该区域的变差函数曲线图,提取变程值a;

(2)以变程值a(一般a取为1)作为纹理间距,确定合适的纹理窗口尺寸W,计算变差函数特征图;

(3)采用FCM分类器对变差函数特征图进行分类。

3 实验与结果分析

4 结 语

与传统的统计类方法相比,变差函数从描述空间相关性的角度对图像纹理特征进行刻画,提取到的图像区域特征更加完整和均匀。利用变差函数纹理分析法可以有效地区分建筑区和非建筑区。与经典的GLCM等纹理分析法相比,在经过优化递推算法后,变差函数法在计算上要简单得多。由此可知,变差函数纹理分析方法是一种兼顾性能与效率的方法,具有很高的适用性和实用价值。

参考文献

[1] 孙即祥.图像处理[M].北京:科学出版社,2004.

[2] HARALICK Robert M. Textural features for image classification [J]. IEEE Transactions on Systems and Cybernetics, 1973, 3(6): 610?621.

[3] 朱彩英,蓝朝桢,靳国旺.纹理图像亮度阈值法提取SAR图像居民地[J].中国图象图形学报,2003,8(6):616?619.

[4] 吴樊,王超,张红.基于纹理特征的高分辨率SAR影像居民区提取[J].遥感技术与应用,2005,20(1):148?152.

[5] 高程程,惠晓威.基于灰度共生矩阵的纹理特征提取[J].计算机系统应用,2010,19(6):195?198.

[6] 谢菲,陈雷,霆邱航.基于纹理特征提取的图像分类方法研究及系统实现[J].计算机应用研究,2009,26(7):2767?2770.

[7] 赵凌君.高分辨率SAR图像建筑物提取方法研究[D].长沙:国防科技大学,2009.