解码技术论文范文
时间:2023-03-15 14:07:36
导语:如何才能写好一篇解码技术论文,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
0 引言
中文MARC是中国机读目录(China Machine-Readable Catalogue)的简称,中文MARC的主要作用是将各类书目信息编目成统一的标准计算机可读形式,便于读者检索以及各图书情报部门之间交流书目。学位论文是高校大学生为获取相应级别学位而撰写的关于在校期间所学知识的应用或所完成的科研成果。
目前,我国各高校的学位论文大部分都是用中文撰写的,也有一小部分是用外文撰写的。高校图书馆将学位论文收藏至自建特色数据库,就需要对学位论文进行编目,对学位论文编目时要保证编目产生的关于学位论文的数据的质量,以方便读者检索并利用学位论文。
1 中文MARC编目学位论文存在的问题
高校图书馆对文献资源进行有效的分类标引和主题标引,并用相应的著录、编目格式使文献资源的主要检索项及特点形成书目的形式就是高校图书馆的编目工作[1]。学位论文编目的工作流程一般为:回溯编目―审校―典藏―贴书标―入库上架。学位论文作为一种特殊的文献资源,其编目具有自己的特点:1)编目难度高。高校大学生研究的学术领域及学术方向繁多,其具体研究方向小而专,对非专业编目人员来说,分类编目比较困难;2)编目工作量巨大。教育事业飞速发展,各高校每年都在扩大招生,进而各高校每年产出的学位论文数量激增,而高校图书馆编目人员有限,而且图书馆每年还要有其他书目入馆需要编目,因此编目人员总的工作量非常大。3)学位论文撰写语种不统一。部分高校设有外国语学院,这些学院的部分学生所撰写的学位论文所使用的语种一般为外文。
中文MARC是以UNIMARC为基本依据,根据我国出版物的具体情况制定的[2]。中文MARC机读记录字段区有如下10个功能块:0―标识块;1―编码信息块;2―著录信息块;3―附注块;4―款目连接块;5―相关题名块;6―主题分析块;7―责任者块;8―国际使用块;9―国内使用块[3]。中文MARC通过对每个功能块增设功能不同的多种字段及子字段、对每个字段又增设不同要求的标识符的方式更为详细的记录文献信息。
高校图书馆编目学位论文最终要达到的目标是:1)精准、全面、直观的反映出学位论文所表达的科研成果,包括科研成果的领域,关键词等信息。2)准确标引学位论文,形成规范数据,方便读者进行检索。编目学位论文是读者可以使用学位论文的前提和基础,学位论文编目工作的质量直接关系到读者对学位论文的使用情
况[1]。因此,学位论文编目工作是高校图书馆工作中的一个重要分支,各高校对学位论文编目工作都很重视。但是由于学位论文本身具有的特殊性和中文MARC编目具有的高技术性,导致中文MARC在对学位论文进行编目的时候会出现一些问题,而这些问题的出现直接影响了学位论文编目的质量,进而影响到学位论文在高校图书馆乃至整个学术界的正常流通。中文MARC在高校图书馆学位论文编目中存在如下问题。
1)标准不统一。当前我国使用比较普遍的中文MARC编目标准有两种:一种是国家图书馆编写制定的全国图书馆联合编目中心系统标准;一种是北京大学图书馆编写制定的中国高等教育文献资源保障系统,即CALIS系统标准[3]。虽然采用这两种中文MARC编目标准编目的数据覆盖面都很广,共享性也比较强,但还是应该将这两种标准结合,制定一套唯一的编目标准。有了唯一的标准,各高校图书馆在选择编目系统时也不需要进行比较,既方便了高校图书馆编目工作,也能使图书信息流通更顺畅。
2)标引不规范。《中国图书分类法》是高校图书馆编目分类的主要依据。由于部分高校图书馆还有自己编写的《图书馆编目分类细则》,并结合这两个规范来进行编目,因此在很多编目细则上出现了不一致现象。
3)著录字段不完整。中文MARC编目虽然具有详细的编目规则,但是不同的编目员对规则的理解会有所不同。在中文MARC著录中,字段和指示符都有详细的规定,如果出现指示符的漏著、错著都会直接影响到学位论文的检索。
4)外文语种撰写的学位论文编目格式不统一。当前我国图书馆使用USMARC对外文图书进行著录,而有些图书馆认为只有原版外文书籍才应该用USMARC进行编目,其余外文图书应该按中文MARC格式来著录。因此,使用外文撰写的学位论文编目格式就出现了两种,即USMARC格式和中文MARC格式。这种不一致的编目格式会严重影响到学位论文的网上共享,对数字图书馆的建设也有不利影响。
高校图书馆每年进书量都很大,新进图书只有经过编目才能入库上架,读者才能在馆藏书目检索系统中检索到图书,而高校图书馆专业的编目人员非常有限,因此就会出现非专业人员对图书进行编目,比如燕山大学图书馆学位论文的编目工作就是由勤工助学的学生来完成的。编目工作对人员专业要求比较高,编目细则又非常繁杂,虽然专业的编目人员已经设定号学位论文编目格式,但是非专业人员在对学位论文进行编目的时候很容易就会出现漏著、错著的现象,而在对学位论文编目中出现的错误只有非常专业的编目人员才能及时发现,这样就会导致很多编目过程中出现的错误到最后都没有被发现,从而影响到读者对学位论文的检索。
2 改进与展望
篇2
(一)功能及主要技术指标要求
直读式电子压力计实现井下压力和温度参数的测量,并将测量结果通过单芯铠装电缆实时传送至地面解码控制仪,主要技术指标要求如下所示。
a)压力测量范围:(0~30、45、60、80)MPa;压力测量误差:0.04%F.S;
b)温度测量范围:(-20~+150)℃,测量误差:±1℃;
c)传输距离不小于6000m;通讯误码率1.0×10-7。
(二)基本方案及工作原理
直读式电子压力计由井下电子压力计和地面解码控制仪两部分组成,其中井下电子压力计由压力传感器、温度传感器、信号放大电路、模数转换电路、单片机系统、编码电路、数字通讯接口电路和装载于单片机系统中的相关工作软件组成,解码控制仪由解码电路、通讯接口电路、通用计算机(油田配置)和相关工作软件组成。
工作过程中,井下电子压力计由地面解码控制仪通过单芯铠装电缆提供能源,温度和压力传感器分别将环境压力和温度转换为电信号输出,该电信号经放大和模数转换后由单片机系统进行数据实时采集和处理,然后按一定周期经数字通讯口输出。井下电子压力计和井上解码控制仪之间通过单芯铠装电缆连接,解码控制仪中通讯接口电路接收井下电子压力计输出的压力和温度数据,并经解码后输入计算机中进行实时分析和处理。
2、数据传输方案选择
设备之间数据通讯通常有并行通讯和串行通讯两种方案,并行通讯的缺点是传输距离短,通讯信道所占点号多,而串行通讯与之相反。根据井下电子压力计与井上解码控制仪的数据传输特点,需选择串行数据传输方式。
在曼彻斯特编码中,用电压跳变的相位不同来区分逻辑1和逻辑0,即用正的电压跳变表示逻辑0,用负的电压跳变表示逻辑1。
在油田测井中,井下电子压力计在井下采集大量信息,并传送给地面解码控制仪;但井下电子压力计到地面解码控制仪这段信道的传输距离较长且环境恶劣,常用的NRZ码不适合在这样的信道里传输,而且NRZ码含有丰富的直流分量,容易引起滚筒的磁化。曼彻斯特编码方式使得信号以串行脉冲码的调制方式在数据线上传输,和最常用的NRZ码相比,消除了NRZ码的直流成分,具有时钟恢复和更好的抗干扰性能,这使它更适合于从井下到井上的信道传输,因而在井下电子压力计和地面解码控制仪之间选用曼彻斯特编码使数据传输可靠性更高、传输距离更远。
3、曼彻斯特码编码软硬件设计
每一周期井下电子压力计需将采集到的压力和温度两个参数分别进行曼彻斯特编码方式输出,井下电子压力计与地面解码控制仪之间按如下通讯协议进行。
a)压力与温度均以字为单位进行传送,先发送压力字,后发送温度字,一个压力字和一个温度字的组合称为一个消息;
b)每一个字由20位组成,第1~3位为3个起始位,第4~19位为16个数据位,第20位为奇偶校验位;
c)压力字3个起始位电平为先高后低,温度字起始位为先低后高,高低电平均各占一位半,压力字与温度字校验位均采用奇校验;
d)传输的波特率:5.7292kbps(175μs/位),传输一个消息共耗时3.5ms。为保证数据传输可靠性,井下电子压力计同一消息在一个采样周期内重复发送两次,地面解码控制仪根据校验位判断每个字的正确性。
由单片机编程输出两路I/O控制信号,经过滤波电路、运放电路、整型电路后,产生曼彻斯特编码双相电平信号,并经单芯铠装电缆送至地面解码控制仪。为满足曼彻斯特编码格式及井下电子压力计与地面解码控制仪之间的通讯协议,井下电子压力计软件采用如下的编程方式输出波形。
a)压力字同步头为262.5μs高电平后跟随262.5μs低电平,温度字同步头为262.5μs低电平后跟随262.5μs高电平;
b)若数据位为逻辑0,则在87.5μs低电平后跟随87.5μs高电平;
c)若数据位为逻辑1,则在87.5μs高电平后跟随87.5μs低电平;
d)校验位的波形产生方式与数据位相同。
4、曼彻斯特码解码软硬件设计
地面解码控制仪需将井下电子压力计输出的曼彻斯特码进行解码,并按通讯协议用软件将接收到的曼彻斯特码数据转换为井下电子压力计测得的压力和温度数据,即地面解码控制仪中的解码过程为井下电子压力计编码过程的逆过程。曼彻斯特码解码过程可分为如下三部分:
a)同步字头检测,并辨别其为温度数据还是压力数据。
b)对曼码形式的数据进行解码,从曼彻斯特码波形中分离出同步时钟,并将时钟和数据进行处理使曼码数据转化为非归零二进制数据。
c)将串行数据转化为并行数据,并进行奇偶校验,以检验数据传输的正确性。
经过几千米铠装电缆传输上来的数据,幅度衰减到毫伏级,因此井上需要精密的解码电路,才能保证数据传输无误码率。井下传输上来的数据经过滤波电路、精密运算放大器、双D触发器输出曼码波形给单片机,经过单片机的程序转化为井下的压力与温度数字量。
5、试验结果
直读式电子压力计首台产品完成厂内试验后,到油田用8000m的铠装电缆连接井下电子压力计和地面解码控制仪,将电子压力计下放到井下6500m的深度,在温度高达150℃、压力为30~60MPa的油井中测试压力和温度。在三次连续5个小时的测试过程中,数据传输准确可靠,没有出现丢点现象,误码率为零。
6、结束语
试验数据统计分析结果表明,本文研究结果解决了直读式电子压力计通讯方案、通讯协议、单芯远距离传输、曼彻斯特码编解码软硬件设计等关键技术,增强了电子压力计在油田测井领域的市场竞争力。
参考文献:
[1]1553B总线及其在测控网络中的应用.计量与测试技术.侯青剑.2005.3
篇3
Abstract: JPEG2000 is a new image coding standard which can provide better rate-distortion performanc than the JPEG standard. But a lot of computation redundancy exists in the traditional implementation of JPEG2000 encoder, in particular at the lower bit rate. That makes the encoder need more encoding time and working memory size. In order to reduce the computational complexity, the paper proposed a new JPEG 2000 image size conversion algorithm, the algorithm can greatly reduce the image conversion required computation amount and time.
关键词: JPEG2000;转换;频率域
Key words: JPEG 2000;transformation;frequency domain
中图分类号:TN919.81 文献标识码:A 文章编号:1006-4311(2013)26-0184-02
0 引言
JPEG2000是新一代的静态图像编码国际标准,与已有的JPEG标准相比,它可以提供更好的图像质量和更高的压缩率,但其计算的复杂度也远高于JPEG算法。一般在处理JPEG 2000图像时,若欲将其图像尺寸缩小,首先需由JPEG 2000解码器处理,将JPEG 2000图像解码到空间域图像后,在空间域里将图像缩小至所需尺寸后,再经JPEG 2000编码器将图像作编码,最后得到尺寸缩小后的压缩图像。但是由于在空间域里使用图像大小转换方法来缩小JPEG 2000图像,需要大量的计算量、繁杂的处理过程、以及占用大量的存储空间。为了加快图像尺寸转换处理速度、降低计算复杂度、以及有效降低存储空间占用,本论文提出一个快速的JPEG 2000图像尺寸缩小转换算法。流程如图1。
在我们的快速JPEG 2000图像尺寸缩小转换方法中,首先将原始JPEG 2000图像经EBCOT解码以及反量化步骤解出图像的频率域编码信息后,再透过频率域图像尺寸缩小转换方法,直接在频率域里缩小图像尺寸,最后再通过量化与EBCOT编码等步骤,将图像尺寸缩小后的图像频率域编码信息编成JPEG 2000图像。
本文所提的JPEG 2000图像尺寸缩小转换方法与空间域图像大小转换方法相比,所提的方法省掉反向小波转换、反向色彩转换、后置处理、前置处理、正向色彩转换、以及正向小波转换等六个步骤。由于所提的方法不需将频率域编码信息转成空间域图像,因此本论文所提的方法除了可更快速的转换图像大小外,也可省下存放空间域图像内容所需的存储空间以及减少所需的计算量。
1 简化JPEG 2000压缩与解压缩流程
在快速JPEG 2000图像尺寸缩小转换方法中,保留了EBCOT解码、反量化、量化与EBCOT编码等四个部分,主要原因说明如下:
1.1 EBCOT编/解码 JPEG 2000编码后的图像会储存成封包的格式,但封包并非以子频带为单位储存,所以要取得各子频带的内容,必须先经过EBCOT解码才行。再者本文的方法有可能需要对子频带再进行小波转换,因此EBCOT编/解码过程不可省略。
1.2 量化与反量化 保留量化与反量化步骤的主要原因在于图像经由正向小波转换后,会产生不同大小的子频带频率信息,不同子频带频率信息使用不同的量化步长值进行量化。
子频带与量化步长值这两者有相对应关系,换句话说以具有7个子频带的JPEG 2000图像而言,必须要有7个相对应的量化步长值。而子频带与量化步长值所产生的数目与小波转换的层数有关,对于一个经过m层小波转换的影像,所具有的子频带数目Nsubbands计算公式为:Nsubbands=3×m+1,图2所示为图像经由二次小波转换后所产生的七个不同的子频带。
每个子频带的量化步长值都是由一组独立的控制参数(ε,μ)决定,该组控制参数必须记录于JPEG 2000码流头部,供译码端还原量化步长值使用。图3所示为一张图像经过三次小波转换后所产生的频率域情况。
本文所提的频率域图像尺寸缩小方法会改变原本图像的小波转换层数,进而影响到量化步长值与子频带的对应关系。当使用不同小波转换层数时,每个子频带的量化步长值会不同。所以,当图像在进行尺寸缩小前,先使用原本JPEG 2000图像的量化步长值对图像进行反量化,还原频率域信息,当图像尺寸已调整缩小后,再用新的量化步长值来量化频率域信息,即可解决量化步长值与子频带不一致的问题。
在我们所提的方法中,分别会遇到小波层数足够与小波层数不足的情况。假设一张JPEG 2000图像小波层数为m层,欲要将图像尺寸缩小为原来的(1/2n×1/2n)大小时,假如n
若n>=m发生,也就是小波层数不足。首先经EBCOT解码后,产生不同的子频带信息。针对不同的子频带信息使用反量化,接着进行图像缩小的工作,将不需要的外频信息去除,保留的频率信息因小波层数不足(小波层数需为1层以上),要对保留的频率信息再进行小波转换。产生出来的小波频率域尺寸大小超过欲转换尺寸,可将外频的小波频率信息去除,保留LL子频带。此时图像大小虽已符合转换所需大小,但JPEG 2000规定图像至少要有一层小波转换,所以必须再做一次小波转换,得到一张小波转换层数为1的JPEG 2000图像,最后再经量化与EBCOT编码,得到尺寸缩小后的JPEG 2000图像。
2 频率域图像尺寸缩小转换方法
图1中间的频率域图像尺寸缩小转换方法主要工作包括缩小频率域图像尺寸与修改JPEG 2000图像码流主标头相关参数等步骤,详细步骤如下:
2.1 括缩小频率域图像尺寸
①小波转换层数足够的作法。假设当图像的小波层数为m层,欲将图像尺寸缩小为(1/2n×1/2n)大小时,若n
首先使用EBCOT解出频率域信息,再对需保留的频率域信息作反量化动作,接着将整张图像的尺寸缩小,并且丢弃不需要的外频频率信息,最后将所保留的频率域信息再重新经过量化与EBCOT编码,即可得到图像尺寸缩小后的JPEG 2000图像。
②小波转换层数不足的作法。假设当图像的小波层数为m层时,欲将图像尺寸缩小为(1/2n×1/2n)大小时,若n>=m,就是小波层数不足,则除了丢弃m个外层的中高频信息外,还需要将原来最内层的低频信息,进行(n-m)+1次小波转换,再将所产生的(n-m)层的中高频信息丢弃。由于以上的(n-m)次小波转换后的中高频信息最终将被丢弃,因此在进行以上小波转换时可直接省略许多计算工作,不必进行完整的小波转换。此法为本文提出的快速小波转换方法。
2.2 修改JPEG 2000图像码流主标头相关参数 JPEG 2000图像码流主标头记录原始图像大小、块状(tile)大小、小波层数、各子频带的量化步阶值参数(ε和μ)等数据信息。在我们所提方法中,并没有将图像解回空间域,而是在频率域信息缩小图像尺寸后,直接进行量化和EBCOT编码,产生新的JPEG 2000图像。新的JPEG 2000图像码流主标头数据无法像空间域转换方法由JPEG 2000压缩方式设定,而必须自行修改JPEG 2000图像码流主标头内的相关参数。
3 小结
JPEG 2000具有的多种特性使其有着广泛的应用前景。目前许多图形图像公司如Pegasus,Aware等在开发的图像软件中集成了JPEG 2000图像压缩技术;有的公司如ImagePower等已开发出JPEG 2000的DSP芯片。JPEG 2000将取代JPEG在图像压缩领域发挥重要作用。本论文提出一个新的快速图像压缩方法,可大幅降低使用空间域转换时的处理时间,以及所需存储空间,但是本文所提方法只针对静态图像实现固定大小的缩小转换,无法对图像作任意大小转换,对图像作任意大小转换是一个很好的发展方向,需作进一步研究。
参考文献:
[1]杜伟娜,孙军,倪强.基于JPEG2000的高效率控制算法[J].上海交通大学学报,2006,40(1):16-19.
篇4
由於在现今资讯流通普遍的社会中,影像的需求量越来越大,影像的数位化是必然的趋势。然而在数位化过的影像所占的资料量又相当庞大,在传输与处理上皆有所不便。将资料压缩是最好的方法。如今有一新的模式,在压缩率及还原度皆有不错的表现,为其尚未有一标准的格式,故在应用上尚未普及。但在不久的未来,其潜力不可限量。而影像之於印刷有密不可分的关系。故以此篇文章介绍小波(WAVELET)转换的历史渊源。小波转换的基础原理。现今的发展对印刷业界的冲击。影像压缩的未来的发展。
壹、前言
由於科技日新月异,印刷已由传统印刷走向数位印刷。在数位化的过程中,影像的资料一直有档案过大的问题,占用记忆体过多,使资料在传输上、处理上都相当的费时,现今个人拥有True Color的视讯卡、24-bit的全彩印表机与扫描器已不再是天方夜谭了,而使用者对影像图形的要求,不仅要色彩繁多、真实自然,更要搭配多媒体或动画。但是相对的高画质视觉享受,所要付出的代价是大量的储存空间,使用者往往只能眼睁睁地看着体积庞大的图档占掉硬碟、磁带和光碟片的空间;美丽的图档在亲朋好友之间互通有无,是天经地义的事,但是用网路传个640X480 True Color图形得花3分多钟,常使人哈欠连连,大家不禁心生疑虑,难道图档不能压缩得更小些吗?如此报业在传版时也可更快速。所以一种好的压缩格式是不可或缺的,可以使影像所占的记忆体更小、更容易处理。但是目前市场上所用的压缩模式,在压缩的比率上并不理想,失去压缩的意义。不然就是压缩比例过大而造成影像失真,即使数学家与资讯理论学者日以继夜,卯尽全力地为lossless编码法找出更快速、更精彩的演算法,都无可避免一个尴尬的事实:压缩率还是不够好。再说用来印刷的话就造成影像模糊不清,或是影像出现锯齿状的现象。皆会造成印刷输出的问题。影像压缩技术是否真的穷途末路?请相信人类解决难题的潜力是无限的。既然旧有编码法不够管用,山不转路转,科学家便将注意力移转到WAVELET转换法,结果不但发现了满意的解答,还开拓出一条光明的坦途。小波分析是近几年来才发展出来的数学理论。小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。可达到完全不失真,压缩的比率也令人可以接受。由於其数学理论早在1960年代中叶就有人提出了,而到现在才有人将其应用於实际上,其理论仍有相当大的发展空间,而其实际运用也属刚起步,其後续发展可说是不可限量。故研究的动机便由此而生。
贰、 WAVELET的历史起源
WAVELET源起於Joseph Fourier的热力学公式。傅利叶方程式在十九世纪初期由Joseph Fourier (1768-1830)所提出,为现代信号分析奠定了基础。在十九到二十世纪的基础数学研究领域也占了极重要的地位。Fourier提出了任一方程式,甚至是画出不连续图形的方程式,都可以有一单纯的分析式来表示。小波分析是近几年来才发展出来的数学理论为傅利叶方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波规范正交基。其後1984年,法国地球物理学J. Morlet在分析地震波的局部性质时,发现传统的傅利叶转换,难以达到其要求,因此引进小波概念於信号分析中,对信号进行分解。随後理论物理学家A.Grossman对Morlet的这种信号根据一个确定函数的伸缩,平移系 { a -1/2 Ψ[(x-b)/a] ;a,b?R ,a≠0}展开的可行性进行了研究,为小波分析的形成开了先河。
1986年,Y. Meyer建构出具有一定衰减性的光滑函数Ψj,k(x),其二进制伸缩与平移系 {Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}构成L2(R)的规范正交基。1987年,Mallat巧妙的将多分辨分析的思想引入到小波分析中,建构了小波函数的构造及信号按小波转换的分解及重构。1988年Daubechies建构了具有正交性(Orthonormal)及紧支集(Compactly Supported);及只有在一有限区域中是非零的小波,如此,小波分析的系统理论得到了初步建立。
三、 WAVELET影像压缩简介及基础理论介绍
一、 WAVELET的压缩概念
WAVELET架在三个主要的基础理论之上,分别是阶层式边码(pyramid coding)、滤波器组理论(filter bank theory)、以及次旁带编码(subband coding),可以说wavelet transform统合了此三项技术。小波转换能将各种交织在一起的不同频率组成的信号,分解成不相同频率的信号,因此能有效的应用於编码、解码、检测边缘、压缩数据,及将非线性问题线性化。良好的分析局部的时间区域与频率区域的信号,弥补傅利叶转换中的缺失,也因此小波转换被誉为数学显微镜。
WAVELET并不会保留所有的原始资料,而是选择性的保留了必要的部份,以便经由数学公式推算出其原始资料,可能不是非常完整,但是可以非常接近原始资料。至於影像中什度要保留,什麽要舍弃,端看能量的大小储存(跟波长与频率有关)。以较少的资料代替原来的资料,达到压缩资料的目的,这种经由取舍资料而达到压缩目地的作法,是近代数位影像编码技术的一项突破。即是WAVELET的概念引入编码技术中。
WAVELET转换在数位影像转换技术上算是新秀,然而在太空科技早已行之有年,像探测卫星和哈柏望远镜传输影像回地球,和医学上的光纤影像,早就开始用WAVELET的原理压缩/还原影像资料,而且有压缩率极佳与原影重现的效果。
以往lossless的编码法只着重压缩演算法的表现,将数位化的影像资料一丝不漏的送去压缩,所以还原回来的资料和原始资料分毫无差,但是此种压缩法的压缩率不佳。 将数位化的影像资料转换成利於编码的资料型态,控制解码後影像的品质,选择适当的编码法,而且还在撷取图形资料时,先帮资料「减肥。如此才是WAVELET编码法主要的观念。
二、 影像压缩过程
原始图形资料 色彩模式转换 DCT转换 量化器 编码器 编码结束
三、 编码的基本要素有三点
(一) 一种压缩/还原的转换可表现在影像上的。
(二) 其转换的系数是可以量化的。
(三) 其量化的系数是可以用函数编码的。
四、 现有WAVELET影像压缩工具主要的部份
(一) Wavelet Transform(WAVELET转换):将图形均衡的分割成任何大小,最少压缩二分之一。
(二) Filters(滤镜):这部份包含Wavelet Transform,和一些着名的压缩方法。
(三) Quantizers(量化器):包含两种格式的量化,一种是平均量化,一种是内插量化,对编码的架构有一定的影响。
(四) Entropy Coding(熵编码器):有两种格式,一种是使其减少,一种为内插。
(五) Arithmetic Coder(数学公式):这是建立在Alistair Moffat s linear time coding histogram的基础上。
(六) Bit Allocation(资料分布):这个过程是用整除法有效率的分配任何一种量化。
肆、 WAVELET影像压缩未来的发展趋势
一、 在其结构上加强完备性。
二、 修改程式,使其可以处理不同模式比率的影像。
三、 支援更多的色彩。可以处理RGB的色彩,像是YIQ、HUV的色彩定义都可以分别的处理。
四、 加强运算的能力,使其可支援更多的影像格式。
五、 使用WAVELET转换藉由消除高频率资料增加速率。
六、 增加多种的WAVELET。如:离散、零元树等。
七、 修改其数学编码器,使资料能在数学公式和电脑的位元之间转换。
八、 增加8X8格的DCT模式,使其能做JPEG的压缩。
九、 增加8X8格的DCT模式,使其能重叠。
十、 增加trellis coding。
十一、 增加零元树。
现今已有由中研院委托国内学术单位研究,也有不少的研究所的硕士。国外更是如火如荼的展开研究。相信实际应用於实务上的日子指日可待。
伍、 影像压缩研究的方向
1. 输入装置如何捕捉真实的影像而将其数位化。
2. 如何将数位化的影像资料转换成利於编码的资料型态。
3. 如何控制解码影像的品质。
4. 如何选择适当的编码法。
5. 人的视觉系统对影像的反应机制。
小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。
陆、 在印刷输出的应用
WAVELET影像压缩格式尚未成熟的情况下,作为印刷输出还嫌太早。但是後续发展潜力无穷,尤其在网路出版方面,其利用价值更高,WAVELET的出现就犹如当时的JPEG出现,在影像的领域中掀起一股旋风,但是WAVELET却有JPEG没有的优点,JPEG乃是失真压缩,且解码後复原程度有限,能在网路应用,乃是由於电脑的解析度并不需要太高,就可辨识其图形。而印刷所需的解析度却需一定的程度。WAVELET虽然也是失真压缩,但是解码後却可以还原资料到几乎完整还原,如此的压缩才有存在的价值。
有一点必须要提出的就是,并不是只要资料还原就可以用在印刷上,还需要有解读其档案的RIP,才能用於数位印刷上。等到WAVELET的应用成熟,再发展其适用的RIP,又是一段时间以後的事了。
在网路出版上已经有浏览器可以外挂读取WAVELET档案的软体了,不过还是测试版,可是以後会在网路上大量使用,应该是未来的趋势。对於网路出版应该是一阵不小的冲击。
图像压缩的好处是在於资料传输快速,减少网路的使用费用,增加企业的利润,由於传版的时间减少,也使印刷品在当地印刷的可能性增高,减少运费,减少开支,提高时效性,创造新的商机。
柒、 结论
WAVELET的理论并不是相当完备,但是据现有的研究报告显现,到普及应用的阶段,还有一段距离。但小波分析在信号处理、影像处理、量子物理及非线性科学领域上,均有其应用价值。国内已有正式论文研究此一压缩模式。但有许多名词尚未有正式的翻译,各自有各自的翻译,故研究起来倍感辛苦。但相信不久即会有正式的定名出现。这也显示国内的研究速度,远落在外国的後面,国外已成立不少相关的网站,国内仅有少数的相关论文。如此一来国内要使这种压缩模式普及还有的等。正式使用於印刷业更是要相当时间。不过对於网路出版仍是有相当大的契机,国内仍是可以朝这一方面发展的。站在一个使用其成果的角度,印刷业界也许并不需要去了解其高深的数理理论。但是在运用上,为了要使用方便,和预估其发展趋势,影像压缩的基本概念却不能没有。本篇文章单纯的介绍其中的一种影像压缩模式,目的在为了使後进者有一参考的依据,也许在不久的将来此一模式会成为主流,到时才不会手足无措。
参考文献
1.Geoff Davis,1997,Wavelet Image Compression Construction Kit,。
2.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(上), 峰资讯股份有限公司。
3.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(下), 峰资讯股份有限公司。
4.施威铭研究室,1994,PC影像处理技术(二)图档压缩续篇,旗标出版有限公司。
5.卢永成,民八十七年,使用小波转换及其在影像与视讯编码之应用,私立中原大学电机工程学系硕士学位论文。
6.江俊明,民八十六年,小波分析简介,私立淡江大学物理学系硕士论文。
7.曾泓瑜、陈曜州,民八十三年,最新数位讯号处理技术(语音、影像处理实务),全欣资讯图书。
附录:
嵌入式零元树小波转换、 阶层式嵌入式零元树小 波转换、阶层式影像传送 及渐进式影像传送
目前网路最常用的静态影像压缩模式为JPEG格式或是GIF格式等。但是利用这些格式编码完成的影像,其资料量是不变的,其接受端必须完整地接受所有的资料量後才可以显示出编码端所传送的完整影像。这个现象最常发生在利用网路连结WWW网站时,我们常常都是先接收到文字後,其网页上的图形才,慢慢的一小部份一小部份显示出来,有时网路严重塞车,图形只显示一点点後就要再等非常久的时间才再有一点点显示出来,甚至可能断线了,使得使用者完全不知道在接收什麽图案的图形,无形中造成网路资源的浪费。此缺点之改善,可以使用嵌入式零元树小波转换(EZW)来完成。
阶层式影像传送系统的主要功能为允许不同规格之显示装置或解码器可以从同一编码器中获得符合其要求之讯号,如此不需要对於不同的解码器设计不同的编码器配合利用之,进而增加了其应用的 范围,及减低了所架设系统的复杂度,也可以节省更多的设备费用。利用Shapiro所提出的嵌入式零元树小波转换(EZW)技术来设计阶层式影像传送系统时,其编码的效果不是很好。主要的原因是,利用(EZW)技术所设计的编码器是根据影像的全解析度来加以编码的,这使得拥有不同解析度与码率要求的解码器,无法同时分享由编码器所送出来的位元流。虽然可以利用同时播放(Simulcast)技术来加以克服之,但是该技术对於同一影像以不同解析度独立编码时,将使得共同的低通次频带(Lowpass Subband)被重复的编码与传送,而产生了相当高的累赘(Redundancy)。
基於上述情况,有人将嵌入式零元树小波转换(EZW)技术加以修改之,完成了一个新式的阶层式影像传送系统。该技术为阶层式嵌入的零元树小波转换(Layered Embedded Zerotree Wavelet,简称 LEZW技术。这个技术使我们所设计出来的阶层式影像传送系统,可以在编码传送前预先指定图层数目、每层影像的解析度与码率。
LEZW技术是将EZW技术中的连续近似量化(SAQ)加以延伸应用之,而EZW传统的做法是将SAQ应用於全部的小波转换系数上。然而在LEZW技术中,从基层(Base Layer)开始SAQ一次仅用於一个 图层(Layer)的编码,直到最高阶析度的图层为止。当编码的那一图层码率利用完时,即表示该图层编码完毕可以再往下一图层编码之。为了改善LEZW的效率,在较低图层的SAQ结果应用於较高图层的SAQ过程中,基於这种编码的程序,LEZW演算法则可以在每一图层平均码率的限制下,重建出不同解析度的影像。因此,LEZW非常适合用於设计阶层式影像传送系统。
LEZW技术也可以应用於渐进式传送,对於一个渐进式影像传送系统而言,控制其解析度将可以改善重建影像的视觉品质。而常用的渐进式传送方法有使用向量量化器或零元树资料结构编码演算法则。但是向量量化器需要较大的记忆体及对与传送中的错误敏威,而利用EZW技术所设计的渐进式影像传送系统,可以改善这些缺点,所以享有较好的效能。但是它也有缺点就是,应用於渐进式传送时是根据全解析度来做编码及传送,因此在低码率的限制之下时,若用全解析度来显示影像将使得影像模糊不清。所以在低码率传送时的影像以较低的解析度来显示时,则可以使影像的清晰度有所改善。
篇5
由於在现今资讯流通普遍的社会中,影像的需求量越来越大,影像的数位化是必然的趋势。然而在数位化过的影像所占的资料量又相当庞大,在传输与处理上皆有所不便。将资料压缩是最好的方法。如今有一新的模式,在压缩率及还原度皆有不错的表现,为其尚未有一标准的格式,故在应用上尚未普及。但在不久的未来,其潜力不可限量。而影像之於印刷有密不可分的关系。故以此篇文章介绍小波(WAVELET)转换的历史渊源。小波转换的基础原理。现今的发展对印刷业界的冲击。影像压缩的未来的发展。
壹、前言
由於科技日新月异,印刷已由传统印刷走向数位印刷。在数位化的过程中,影像的资料一直有档案过大的问题,占用记忆体过多,使资料在传输上、处理上都相当的费时,现今个人拥有TrueColor的视讯卡、24-bit的全彩印表机与扫描器已不再是天方夜谭了,而使用者对影像图形的要求,不仅要色彩繁多、真实自然,更要搭配多媒体或动画。但是相对的高画质视觉享受,所要付出的代价是大量的储存空间,使用者往往只能眼睁睁地看着体积庞大的图档占掉硬碟、磁带和光碟片的空间;美丽的图档在亲朋好友之间互通有无,是天经地义的事,但是用网路传个640X480TrueColor图形得花3分多钟,常使人哈欠连连,大家不禁心生疑虑,难道图档不能压缩得更小些吗?如此报业在传版时也可更快速。所以一种好的压缩格式是不可或缺的,可以使影像所占的记忆体更小、更容易处理。但是目前市场上所用的压缩模式,在压缩的比率上并不理想,失去压缩的意义。不然就是压缩比例过大而造成影像失真,即使数学家与资讯理论学者日以继夜,卯尽全力地为lossless编码法找出更快速、更精彩的演算法,都无可避免一个尴尬的事实:压缩率还是不够好。再说用来印刷的话就造成影像模糊不清,或是影像出现锯齿状的现象。皆会造成印刷输出的问题。影像压缩技术是否真的穷途末路?请相信人类解决难题的潜力是无限的。既然旧有编码法不够管用,山不转路转,科学家便将注意力移转到WAVELET转换法,结果不但发现了满意的解答,还开拓出一条光明的坦途。小波分析是近几年来才发展出来的数学理论。小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。可达到完全不失真,压缩的比率也令人可以接受。由於其数学理论早在1960年代中叶就有人提出了,而到现在才有人将其应用於实际上,其理论仍有相当大的发展空间,而其实际运用也属刚起步,其後续发展可说是不可限量。故研究的动机便由此而生。
贰、WAVELET的历史起源
WAVELET源起於JosephFourier的热力学公式。傅利叶方程式在十九世纪初期由JosephFourier(1768-1830)所提出,为现代信号分析奠定了基础。在十九到二十世纪的基础数学研究领域也占了极重要的地位。Fourier提出了任一方程式,甚至是画出不连续图形的方程式,都可以有一单纯的分析式来表示。小波分析是近几年来才发展出来的数学理论为傅利叶方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波规范正交基。其後1984年,法国地球物理学J.Morlet在分析地震波的局部性质时,发现传统的傅利叶转换,难以达到其要求,因此引进小波概念於信号分析中,对信号进行分解。随後理论物理学家A.Grossman对Morlet的这种信号根据一个确定函数的伸缩,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展开的可行性进行了研究,为小波分析的形成开了先河。
1986年,Y.Meyer建构出具有一定衰减性的光滑函数Ψj,k(x),其二进制伸缩与平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}构成L2(R)的规范正交基。1987年,Mallat巧妙的将多分辨分析的思想引入到小波分析中,建构了小波函数的构造及信号按小波转换的分解及重构。1988年Daubechies建构了具有正交性(Orthonormal)及紧支集(CompactlySupported);及只有在一有限区域中是非零的小波,如此,小波分析的系统理论得到了初步建立。
三、WAVELET影像压缩简介及基础理论介绍
一、WAVELET的压缩概念
WAVELET架在三个主要的基础理论之上,分别是阶层式边码(pyramidcoding)、滤波器组理论(filterbanktheory)、以及次旁带编码(subbandcoding),可以说wavelettransform统合了此三项技术。小波转换能将各种交织在一起的不同频率组成的信号,分解成不相同频率的信号,因此能有效的应用於编码、解码、检测边缘、压缩数据,及将非线性问题线性化。良好的分析局部的时间区域与频率区域的信号,弥补傅利叶转换中的缺失,也因此小波转换被誉为数学显微镜。
WAVELET并不会保留所有的原始资料,而是选择性的保留了必要的部份,以便经由数学公式推算出其原始资料,可能不是非常完整,但是可以非常接近原始资料。至於影像中什度要保留,什麽要舍弃,端看能量的大小储存(跟波长与频率有关)。以较少的资料代替原来的资料,达到压缩资料的目的,这种经由取舍资料而达到压缩目地的作法,是近代数位影像编码技术的一项突破。即是WAVELET的概念引入编码技术中。
WAVELET转换在数位影像转换技术上算是新秀,然而在太空科技早已行之有年,像探测卫星和哈柏望远镜传输影像回地球,和医学上的光纤影像,早就开始用WAVELET的原理压缩/还原影像资料,而且有压缩率极佳与原影重现的效果。
以往lossless的编码法只着重压缩演算法的表现,将数位化的影像资料一丝不漏的送去压缩,所以还原回来的资料和原始资料分毫无差,但是此种压缩法的压缩率不佳。将数位化的影像资料转换成利於编码的资料型态,控制解码後影像的品质,选择适当的编码法,而且还在撷取图形资料时,先帮资料「减肥。如此才是WAVELET编码法主要的观念。
二、影像压缩过程
原始图形资料色彩模式转换DCT转换量化器编码器编码结束
三、编码的基本要素有三点
(一)一种压缩/还原的转换可表现在影像上的。
(二)其转换的系数是可以量化的。
(三)其量化的系数是可以用函数编码的。
四、现有WAVELET影像压缩工具主要的部份
(一)WaveletTransform(WAVELET转换):将图形均衡的分割成任何大小,最少压缩二分之一。
(二)Filters(滤镜):这部份包含WaveletTransform,和一些着名的压缩方法。
(三)Quantizers(量化器):包含两种格式的量化,一种是平均量化,一种是内插量化,对编码的架构有一定的影响。
(四)EntropyCoding(熵编码器):有两种格式,一种是使其减少,一种为内插。
(五)ArithmeticCoder(数学公式):这是建立在AlistairMoffat''''slineartimecodinghistogram的基础上。
(六)BitAllocation(资料分布):这个过程是用整除法有效率的分配任何一种量化。
肆、WAVELET影像压缩未来的发展趋势
一、在其结构上加强完备性。
二、修改程式,使其可以处理不同模式比率的影像。
三、支援更多的色彩。可以处理RGB的色彩,像是YIQ、HUV的色彩定义都可以分别的处理。
四、加强运算的能力,使其可支援更多的影像格式。
五、使用WAVELET转换藉由消除高频率资料增加速率。
六、增加多种的WAVELET。如:离散、零元树等。
七、修改其数学编码器,使资料能在数学公式和电脑的位元之间转换。
八、增加8X8格的DCT模式,使其能做JPEG的压缩。
九、增加8X8格的DCT模式,使其能重叠。
十、增加trelliscoding。
十一、增加零元树。
现今已有由中研院委托国内学术单位研究,也有不少的研究所的硕士。国外更是如火如荼的展开研究。相信实际应用於实务上的日子指日可待。
伍、影像压缩研究的方向
1.输入装置如何捕捉真实的影像而将其数位化。
2.如何将数位化的影像资料转换成利於编码的资料型态。
3.如何控制解码影像的品质。
4.如何选择适当的编码法。
5.人的视觉系统对影像的反应机制。
小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。
陆、在印刷输出的应用
WAVELET影像压缩格式尚未成熟的情况下,作为印刷输出还嫌太早。但是後续发展潜力无穷,尤其在网路出版方面,其利用价值更高,WAVELET的出现就犹如当时的JPEG出现,在影像的领域中掀起一股旋风,但是WAVELET却有JPEG没有的优点,JPEG乃是失真压缩,且解码後复原程度有限,能在网路应用,乃是由於电脑的解析度并不需要太高,就可辨识其图形。而印刷所需的解析度却需一定的程度。WAVELET虽然也是失真压缩,但是解码後却可以还原资料到几乎完整还原,如此的压缩才有存在的价值。
有一点必须要提出的就是,并不是只要资料还原就可以用在印刷上,还需要有解读其档案的RIP,才能用於数位印刷上。等到WAVELET的应用成熟,再发展其适用的RIP,又是一段时间以後的事了。
在网路出版上已经有浏览器可以外挂读取WAVELET档案的软体了,不过还是测试版,可是以後会在网路上大量使用,应该是未来的趋势。对於网路出版应该是一阵不小的冲击。
图像压缩的好处是在於资料传输快速,减少网路的使用费用,增加企业的利润,由於传版的时间减少,也使印刷品在当地印刷的可能性增高,减少运费,减少开支,提高时效性,创造新的商机。
柒、结论
WAVELET的理论并不是相当完备,但是据现有的研究报告显现,到普及应用的阶段,还有一段距离。但小波分析在信号处理、影像处理、量子物理及非线性科学领域上,均有其应用价值。国内已有正式论文研究此一压缩模式。但有许多名词尚未有正式的翻译,各自有各自的翻译,故研究起来倍感辛苦。但相信不久即会有正式的定名出现。这也显示国内的研究速度,远落在外国的後面,国外已成立不少相关的网站,国内仅有少数的相关论文。如此一来国内要使这种压缩模式普及还有的等。正式使用於印刷业更是要相当时间。不过对於网路出版仍是有相当大的契机,国内仍是可以朝这一方面发展的。站在一个使用其成果的角度,印刷业界也许并不需要去了解其高深的数理理论。但是在运用上,为了要使用方便,和预估其发展趋势,影像压缩的基本概念却不能没有。本篇文章单纯的介绍其中的一种影像压缩模式,目的在为了使後进者有一参考的依据,也许在不久的将来此一模式会成为主流,到时才不会手足无措。
参考文献:
1.GeoffDavis,1997,WaveletImageCompressionConstructionKit,。
2.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(上),峰资讯股份有限公司。
3.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(下),峰资讯股份有限公司。
4.施威铭研究室,1994,PC影像处理技术(二)图档压缩续篇,旗标出版有限公司。
5.卢永成,民八十七年,使用小波转换及其在影像与视讯编码之应用,私立中原大学电机工程学系硕士学位论文。
篇6
关键词:转码;实时;MPEG-2;H.264
中图分类号:TP37 文献标识码:A 文章编号:1009-3044(2017)06-0219-04
1 概述
多种视频压缩标准的同时存在,导致视频设备间急需解决兼容问题,而视频转码是有效解决这种兼容问题的一种技术。H.264作为新一代的视频压缩标准,具有比其它视频压缩标准拥有更高的压缩率。然而,当前保留的大多数视频节目都是由 MPEG-2压缩得到的,为了适应实际的需要,由 MPEG-2到 H.264的标清分辨率实时转码是很 有必要的。本文的研究工作就是围绕标清实时转码技术展开的。
2 转码方案选取
在转码器中,编码部分的耗时远远大于解码部分。本论文研究的目的,是在尽可能少增加码流和尽量少降低图像质量的前提下,实现MPEG-2到H.264在D1分辨率(720x576)的实时转码。为此,需要从输入的MPEG-2码流中提取可复用参数并用于H.264 编码端,以减轻编码端的编码时间。
MPEG-2 转 H.264 转码器属于不同标准间的转码。在其转码过程中,如果直接使用解码端产生的运动矢量,将导致转码的运动估计不准、视频质量下降等许多问题, 所以需要对运动矢量进行调整。文献[2]使用mobile-calendar序列对CPDT转码结构和两种DCT域转码结构做了测试。测试的结果是, 象素域级联转码器转码后的图像质量(以PSNR为标准)明显高于DCT域转码。象素域级联转码结构有着低复杂度和高灵活性等特点,并且有最好的PSNR效果,对错误偏移也有很好的抗误码性,非常适合作为MPEG-2转H.264转码器的结构。因此,本文研究的转码器采用了运动矢量重估计的象素域级联转码结构。
3 转码器的实现
转码器的输入端是正确的 MPEG-2 码流,输出端是可包含 I、P、B 三种帧类型的 H.264 码流,其中 B 帧以及 IDR 帧的频率可由转码器参数设定。这里详细讨论三种帧类型转码的算法。
3.1 I帧转码的实现
本文研究的转码器针对D1分辨率视频流,每帧分辨率为720x576,即每帧有1620个宏块需要编码。如果I帧中宏块的帧内预测包含所有预测模式,将会有非常大的计算量,而且由于标准间较大的差异,转码器在帧内预测方面可复用信息非常少。为了达到比较高的转码速度,并且不影响图像质量,本转码器采用了简化帧内预测模式的方法:转码器在帧内预测部分只采用16x16帧内预测的4种模式,同时降低量化参数。这样,每个帧内预测宏块最多只需进行16次预测即可,远远小于选用全部帧内预测模式的592次。这种方法虽然使转码器中I帧的压缩率少量下降,但是大大提高了I帧转码速度。I帧宏块的转码流程如图1所示。
3.2 P帧的转码
本文研究的D码器其运动估计算法主要有以下几个重点:
宏块的模式选择:由于MPEG-2和H.264中运动矢量的相关性,MPEG-2中得到的基于宏块16x16的MV对于H.264中的7种帧间预测模式来说是比较准确的。如果只采用H.264的16x16,16x8,8x16,8x8四种分割方式进行预测,虽然会使预测更加准确从而减少10%的码流,但是使运动估计部分的计算复杂度增加了4倍以上。本转码器对运算速度的要求很严格,所以为了提高转码速度,本转码器尽可能采用16x16模式对宏块进行预测编码。当16x16模式预测的块其SAD超过阈值时,再进行8x8块分割编码。
亚像素搜索精度:一般来说编码器在编码每帧之前都要对当前帧做插值。H.264对亮度最高可达1/4像素,其半像素点需要通过复杂的6头滤波,而1/4像素点由一对对角半像素点线性内插得出。其计算量很庞大。本转码器最高搜索精度使用半像素,从而在略微增加码流大小的情况下大大减少了运动估计的时间。
半像素插值范围:普通视频编码器在编码P帧前需要对整幅图像进行插值。本论文研究的转码器为了提高转码效率,避免了对所有块都进行半像素插值。方法是:当整像素匹配块的SAD小于某个阈值时,直接以该匹配块为最佳匹配块进行残差编码,而不在半像素域内进行搜索。这样可以在对码流影响不大的情况下,减少半像素6头滤波的计算次数以及半像素域的运动搜索。
搜索窗口:转码器中输入流包含的运动矢量和在全局范围内重新搜索得到的最佳运动矢量比较接近,为了减少6头插值滤波的次数和搜索范围,同时考虑到MPEG-2解码产生的指向半像素的运动矢量与H.264编码的最佳运动矢量有差距,本文转码方案中运动矢量在复用前首先进行取整操作。在对坐标为(x,y)的宏块做运动估计时,如果需要进行半像素域搜索,则仅搜索其上下左右四个半像素点,从中找出SAD最小的块作为最佳匹配块。
宏块模式复用:在MPEG-2码流中我们还可以得到宏块模式。对于非帧间预测块可以直接利用此信息,将此块作为H.264中的帧内模式来处理。这样就避免了此块的模式选择部分,节约了时间。
转码器的编码端在进行P帧宏块转码时,必须首先判断出16x16宏块的最佳参考块位置。
每个P帧宏块的转码流程为:
(1)判断该块是否为帧间预测块,如果不是,则进行16x16帧内预测编码;
(2)如果该块属于帧间预测,则读取该块在解码中对应的运动矢量;
(3)如果该块有两个运动矢量,则分别对其进行(4)(5)步,并选取SAD小的运动矢量作为参考;
(4)根据解码中对应的取整运动矢量从参考帧中找到参考块,并计算参考块亮度与当前块亮度之间的SAD;
(5)判断SAD值是否超过阈值,如果两个运动矢量所指向的参考块其SAD均超过阈值,则到(6),否则选取使得SAD小的运动矢量作为运动重估计的参考,并到(10);
(6)根据该块周围块的运动矢量,计算该块的PMV,并计算该PMV所指向参考块与当前块之间的SAD;
(7)选取使SAD最小的运动矢量作为运动重估计的参考;
(8)如果SAD大于阈值,计算参考块色差U和V相对于当前块的SAD是否都小于阈值。如果是则选取参考块为最佳匹配块并运行(10),否则运行(9);
(9)对参考块周围进行6头滤波插值,并在参考块顶点像素上、下、左、右、顶点5个点的范围内搜素最佳匹配块;
(10)根据最佳匹配块和运动矢量判断该块是否属于SKIP宏块。如果是则按SKIP宏块编码,否则对该块进行残差编码。
从P帧宏块转码流程可以看到,本转码器采用的运动重估计无需对整幅图像进行插值,并且计算过程中可大大减少半像素6头滤波插值,从而提高转码器P帧转码的速度。
3.3 B帧的转码
P帧与B帧最大的区别在于,B帧编码可以有三种预测方向:前向,后向和双向。B帧预测方式如图2所示。
3.3.1 MPEG-2中B帧的编码
在MPEG-2标准中B帧不可以作为参考帧参与运动估计和运动补偿,所以编码器不存储B帧的编码重构图像。根据运动矢量的不同,MPEG-2的B帧宏块编码可分为三类:
如果只有一个前向预测运动矢量,那么该B帧宏块仅参考前一个I帧或者P帧。这种仅采用前向预测的B帧宏块的压缩方法与P帧中帧间预测宏块的压缩方法类似;
如果只有一个后向预测的运动矢量,那么该B帧宏块参考的是后向的一个I帧或P帧,其预测方法与P帧的帧间预测原理相同,只不过预测方向相反;
当前向和后向运动矢量都存在时,说明该B帧宏块需要做双向预测。它需要从前后两个I帧或P帧中做预测,其残差块为当前原始宏块像素与前向、后向两个预测块的像素平均值的差。
MPEG-2中B帧的模式选择树形结构如图3所示。
3.3.2 H.264中的B帧编码
H.264中B帧的编码原理和MPEG-2类似,不过其编码方案有3个重要改进:
允许对B帧宏块进行划分,允许对其子块进行运动估计和运动补偿;
允许B帧在过去和将来有限的多幅参考帧中使用多个参考帧进行运动估计,参考帧的数量随不同档次而变;
允许B帧作为其它帧的参考帧。
图4显示了H.264中3种B帧编码方式:一个前向和一个后向预测;两个前向预测;两个后向预测。
和MPEG-2相比H.264在B帧的模式中增加了一种DIRECT模式。这种模式与SKIP模式有些类似,其运动矢量不编码,而是根据周围宏块的运动矢量进行预测得到的。不过它与SKIP模式最大的不同在于,SKIP模式的宏块没有像素残差,而DIRECT模式有像素差。这样在编码过程中可以节省运动矢量的编码位数,从而增大压缩比。
在B帧中可以对宏块进行4种分割,分别是16x16、16x8、8x16、8x8。不同的分割方式可以采用的预测模式也不尽相同。表1所示为B帧的宏块预测选择。
3.3.3 B帧转码的实现
B帧的转码和P帧转码相似,也需要对运动矢量进行调整。B帧预测在H.264中是非常消耗时间的,如果使用多参考帧,其计算量远远高于P帧编码。为了使转码器在高速转码B帧的同时,尽量少影响码流大小,设计合理的模式选择算法非常重要。
本文研究的转码器其B帧宏块模式选择方法有以下几个关键:
一般来说,输入MPEG-2码流中B帧的预测模式选择是比较准确的,所以转码器对MPEG-2码流中B帧宏块的预测方向进行复用。如果编码宏块对应MPEG-2码流中采用的是单向预测,则直接复用该预测模式。如果该宏块采用的是双向预测,则在H.264编码时根据计算决定预测方式。这样可以在码流压缩率基本不变的情况下,使预测模式的选择时间减少到原来的三分之一;
H.264标准中的DIRECT模式支持16x16宏块分割方式,并且使码流压缩率有明显提高,所以本转码器在处理双向预测块的运动估计时,采用双向预测和DIRECT预测模式,并从中选出最合适的模式进行宏块残差编码。虽然和仅采用双向预测相比增加了一种预测模式,从而增加了运动估计的运算,但是使得压缩后B帧码流比特率大大减少。
如果B帧宏块在解码端采用前向或后向预测,则H.264编码端该宏块采用和解码时相同的预测模式进行编码。当B帧宏块解码端采用双向预测时,其模式选择过程为:
取前向预测运动矢量,按前向预测方式找到最佳匹配块,并计算SAD。如果SAD小于阈值,则按前向预测进行编码,否则继续进行预测模式的选择;
取后向预测运动矢量,按后向预测方式找到最佳匹配块,并计算SAD。如果SAD小于阈值,则按后向预测进行编码,否则继续进行预测模式的选择;
进行DIRECT预测,找到最佳匹配块,并计算SAD。如果小于阈值,则按DIRECT模式进行编码,否则继续进行预测模式的选择;
进行双向预测,并与DIRECT预测模式进行比较,选择COST小的模式进行编码。
B帧双向预测块转码流程如图5所示。
4 测试结果
4.1不使用去方块滤波器的转码效果
测试环境为PCIntel(R)Core(TM)2CPU2.0GHz,内存1G。在试验中D1(720x576)测试码流选用广电提供的大话西游片段序列和Tank序列,帧数均为25fps,GOP均为15,码流格式为IBBP。转码输出端输出格式同输入码流格式,帧数均为25fps。测试转码时测试200帧,量化参数选用QP=32,不使用去方块滤波。
大话西游测试码流属于运动不是很剧烈的码流。使用本转码器测试后,PSNR平均值35.3712,最低值33.8383,最高值39.0904。前4帧PSNR为:
PSNR (YCbCr Y Cb Cr): 37.6093 36.2018 43.9715 43.8465
PSNR (YCbCr Y Cb Cr): 35.3219 33.7641 44.1130 43.7948
PSNR (YCbCr Y Cb Cr): 35.1656 33.6160 43.7726 43.4904
PSNR (YCbCr Y Cb Cr): 35.3718 33.8730 43.0355 42.8159
转码后200帧的码流大小共1.296kb,转码速度为平均每帧24.184ms。在实时要求的每帧40ms情况下,可以实现实时转码器。
Tank序列和上一个序列相比运动比较剧烈。测试得到PSNR平均值为33.3818,最低值31.2469,最高值37.0915。前4帧PSNR为:
PSNR (YCbCr Y Cb Cr): 34.4716 32.8147 45.2238 46.8538
PSNR (YCbCr Y Cb Cr): 31.8217 30.1360 43.4940 46.3854
PSNR (YCbCr Y Cb Cr): 32.0798 30.3967 43.7334 46.2518
PSNR (YCbCr Y Cb Cr): 33.2598 31.6105 43.2837 46.0296
转码后200帧的码流大小共2.540kb,转码速度为平均每帧27.3ms。可以实现实时转码。虽然在剧烈的运动视频进行转码时PSNR会有所下降,但是从视觉上感觉差异不大。
由实验结果可见,在对运动不是很剧烈的码流进行转码时,码流压缩率比较高,图像质量比较好,转码速度很快,在对运动比较剧烈的码流转码时,码流压缩率和图像质量都有所下降,但是都在可以接受的范围内。虽然转码速度也略有下降,但是还是能保证实时转码。
4.2使用去方块滤波器的转码效果
测试时使用大话西游片段序列和Tank序列,同样测试200帧,选用量化参数QP=32,转码时使用去方块滤波器。
大话西游码流平均转码速度为每帧29.61ms,其中V波耗时平均每帧5.43ms。PSNR平均值35.6615,最低值34.1878,最高值39.4467,前4帧的PSNR为:
PSNR (YCbCr Y Cb Cr): 37.5639 36.1336 44.2403 44.0461
PSNR (YCbCr Y Cb Cr): 35.4928 33.9397 44.2055 43.8518
PSNR (YCbCr Y Cb Cr): 35.3602 33.8116 43.9539 43.6541
PSNR (YCbCr Y Cb Cr): 35.5582 34.0564 43.3320 42.9935
该测试条件下的PSNR和不使用滤波器时测得的PSNR平均值35.3712,最低值33.8383,最高值39.0904相比,有明显的提升,且块效应有明显的消除。码流大小1,292kb,与不使用滤波时压缩的1,296kb相比有少量下降。
Tank码流平均转码速度为每帧35.199ms,其中滤波耗时平均每帧7.90ms。PSNR平均值33.5520,最低值31.4689,最高值37.2467,前4帧的PSNR为:
PSNR (YCbCr Y Cb Cr): 34.2591 32.5901 45.6571 47.0037
PSNR (YCbCr Y Cb Cr): 31.8855 30.1968 43.7478 46.5964
PSNR (YCbCr Y Cb Cr): 32.1336 30.4466 44.0063 46.5356
PSNR (YCbCr Y Cb Cr): 33.2226 31.5645 43.6591 46.2399
该测试条件下的PSNR和不使用去方块滤波时PSNR平均值为33.3818,最低值31.2469,最高值37.0915相比,图像质量有明显提高。转码后码流大小为2,512kb,比不使用滤波时的2,540kb有所下降。
由实验结果可见,两个码流在转码器添加去方块滤波功能的情况下,图像质量有所提升,码流大小略有下降,转码速度仍然达到了D1分辨率实时转码的目的。
5 结束语
本论文的研究目标是基于 PC 环境,在保证图像质量少量损失的前提下实现 MPEG-2 到 H.264 的 D1 分辨率实时转码。当前,分辨率为 D1 电视格式的视频编码大多是通过 MPEG-2 压缩的,而 H.264 由于其性能的卓越,注定会在当今与将来有更广泛的应用,所以研究 MPEG-2 到 H.264 的转码是很必要的,有很强的现实意义与价值。
参考文献:
[1] 毕厚杰.新一代视频压缩编码标准H.264/AVC[M].北京:人民邮电出版社,2005:22-24.
[2] Werner N.Requantization for transcoding of MPEG-2 intraframes[J]. IEEE Trans image Process,1999,8(2):.
[3] Assuncao P, Ghanbari M. Buffer analysis and control in CBR video transcoding[J].IEEE Trans. Circuits Syst. Video Technol,2002(12): 1009-1020.
篇7
关键词:嵌入式系统,802.11协议,无线视频传输,楼宇智能化
1.引言
目前楼宇门禁装置大多为一个简单的可控电子开关,一般采取语音对话的有线控制方式,不具备可视化能力和无线控制能力,其存在交互效果差、有线网络布线繁琐、智能化程度不够高的缺点。。随着视频编、解码技术和无线传输技术的快速发展,智能化楼宇系统也得到了快速的发展。嵌入式无线网络产品以其体积小、成本低、使用灵活方便等优点,得到了越来越广泛的应用。随着市场上智能化楼宇的不断升温, 门铃系统已作为智能化办公室和智能化小区的一个重要组成部分。
本研究介绍的智能小区无线可视化门铃系统正是在这样的应用前景下,基于802.11无线网络协议进行设计的。
2.系统整体结构设计与工作原理
如图1所示,该系统采用低功耗、高性能的嵌入式IDTRC32434 作为主控芯片,使用VW2010芯片进行硬实时编解码以提高编解码效率,采用PHILIPS公司的BGW200无线芯片进行音视频码流的转发控制。整个系统由服务器端和客户端两部分组成,主要实现音频视频数据采集和高质量编解码以及无线网络传输功能。
服务器端工作原理
由CCD Sensor和音频端口进来的输入信号,经过视频A/D和音频A/D转换后,进行MPEG4视频编码和MPEG MP3音频编码。编码后的视音频码流送到网络复用模块打包后,将压缩编码后的数据流经过802.11x无线网络送到客户端。如下图1所示:
系统客户端工作原理
由无线网络接收的音视频码流数据,经过网络解复用模块解复用后,获得的视频码流和音频码流分别送至视频解码模块和音频解码模块进行MPEG4
视频解码和MP3音频解码。解码后的数据经过视频模拟编码、D/A和音频D/A转换后送到可视终端显示。如下图2所示:
3.硬件设计
系统的硬件设计主要分四个部分:主控制系统、音视频采集系统、多媒体编解码系统、无线网络系统。。
3.1 主控芯片采用IDT RC32434
它是一款64位MIPS,内部集成了NAND Flash控制器(FlashC)、32位PCI总线控制器(PCIC)、4通道DMA控制器、4通道SDRAM控制器(SDRAMC)、外部总线控制器 (EBUSC)、外部总线接口(E―BUSI)以及2个通用串口等,并通过内部总线对它们分别进行控制。该芯片提供高达400MHz的频率,集成了标准外围元件互连(PCI)接口,可与802.11a/b/g和串行Ⅵ、等先进外围设备连接。处理速度快,功能强,性价比高,能很好满足嵌入式ucLinux系统的需求。
3.2 CCD 摄像头和A/D 转换芯片
SAA 7110 是Philip s 公司生产的可编程前端视频解码器,它可将输入的视频模拟信号转换为YUV 数字信号。其内部包含三路模拟处理通道, 能实现视频源的选择, 数据输出格式有YUV4: 1: 1 (8bit) 和YUV 4: 2: 2 (8bit) 两种。它还包括抗混叠滤波,A/D 转换, 自动嵌位, 自动增益控制, 时钟产生, 多制式解码及亮度、对比度和饱和度的控制等功能。
3.3多媒体编解码芯片
该系统采用VW2010作为多媒体编解码芯片,它是一种实时MPEG-4音视频压缩/解压芯片。其片内集成有3个信号处理/控制单元,包括一个视频编码(压缩)器、一个视频解码(解压)器和一个片内CPU(内部扩展一个音频编码DSP、一个音频解码DSP、一个多路复合单元和一个多路解复合单元)。具有可编程、高性能和低功耗特点,因为每个信号处理/控制单元都由一个RISC处理器和专用的硬件加速器构成。
3.4802. 11b 芯片
无线模块采用的芯片是PHILIPS公司的BGW200,该芯片通过高速串口SPI2与处理器的SPI1口连接。SPI(SerialPeripheral Interface,串行外设接口)是一种同步外设接口,允许MCU与各种外围设备以串行方式进行通信、数据交换。当IDT RC32434与BGW200之间互相通信时只能通过BGW200的SPI2口进行,此时IDT RC32434是主(HOST),BGW200是从机(SLAVE),传输的时钟由HOST控制。
4.软件设计
本系统软件设计按层次划分主要分为三层:系统初始化引导和嵌入式系统内核移植、外设驱动程序编写(包括USB摄像头驱动、无线网络模块驱动等)、数据采集与无线传输。
4.1 系统引导、内核移植和文件系统的建立
虽然Linux 内核小、效率高,但嵌入式系统的硬件资源毕竟有限,因此不能直接把Linux作为操作系统,要针对具体的应用通过配置内核、裁减shell和嵌入式C库对系统进行定制,使整个系统能够存放到容量较小的Flash中。嵌入式Linux系统主要由4 个部分组成:引导内核启动的文件(bootloader)、Linux内核文件(kernel)、虚拟磁盘文件(ramdisk)、用户空间文件(user)。把它们分别放在DataFlash内的4个分区模块中。对于不需要动态改变,使用较节省空间的ROMFS只读文件系统;user模块内需要进行较多的读写操作,所以使用支持动态擦写保存的JFFS2文件系统。在构建完软件平台后,下面就主要涉及到USB摄像头驱动和无线驱动模块设计、视频采集模块和基于802.11无线网络传输模块的程序设计。
4.2 USB摄像头驱动
搭建好嵌入式Linux的开发环境后,下一步就首要完成USB摄像头驱动工作。。Video4Linux(V4L)是Linux中关于视频设备的内核驱动,它为针对视频设备的应用程序编程提供一系列接口函数。对于USB口摄像头,其驱动程序中提供了基本的I/O操作接口函数open,read,write,close的实现。当应用程序对设备文件进行系统调用操作时,Linux内核将通过file-operations结构访问驱动程序提供的函数。在编译时选取动态加载模式,确定USB摄像头被正常驱动后,下一步就是使用Video4Linux提供的API函数集来编写视频采集程序。
4.3 音视频数据采集
在完成USB摄像头驱动后,就可以针对设备文件/dev/video进行视频捕捉方面的程序设计。其中用到的主要函数有:Camera open():用来开启视频设备文件;Camera get capability():取得设备文件的相关信息;Cameraget picture():获取图像的相关信息
Cameraclose():用来关闭设备文件;Camera grab image():用来抓取图像,采用mmap方式,直接将设备文件/dev/ video0映射到内存,加速文件I/O操作,还可以使多个线程共享数据。如图3.
图3
4.4音视频压缩编解码
获取图像数据后,可以直接输出到FrameBuffer进行显示,由于本系统要将采集到的音视频通过无线网络传输出去,所以在传输之前要对原始的图像数据进行压缩编码,在此选用VW2010芯片来实现MPEG- 4视频编解码方案。和其他标准相比,MPEG-4压缩比更高,节省存储空间,图像质量更好,特别适合在低带宽条件下传输视频,并能保持图像的质量。对视频流进行压缩编码以后,接下来就要实现网络传输部分的功能。
4.5无线网络模块驱动
无线驱动模块的软件架构分为三部分:客户驱动(client driver)、主机硬件抽象层(HHAL)、主机操作系统抽象层(HOSAL)。设备驱动程序本质上来说就是一组相关函数的集合。它利用结构体file_operations与文件系统联系起来,内核使用该结构体访问驱动程序的函数,该数据结构定义再<linux/fs.h>头文件中。在这个数据类型中,每一个成员变量指向驱动程序定操作的函数,对于没有的操作函数,相应的成员函数可以设置位NULL。
设备驱动程序通常包含下面3个最主要的部分:(1)驱动程序的注册和注销;(2)设备的打开和释放;(3)设备的读写操作。
对于需要动态加载的模块,通过执行Makefile文件,在当前目录会生成目标文件wireless.o。将目标文件wireless.o下载到已经烧写好的文件系统中。当目标板重新启动后,运行命令:insmod wireless.o 即可将无线驱动模块链接到内核中。一旦驱动程序被注册到内核表中,对驱动程序的操作就和它的主设备号对应起来了。当应用程序对设备文件进行某种操作时,内核会从file_operations结构中找到并去调用正确的函数。卸载模块可输入下面的命令:rmmodwireless.o。
4.6无线网络传输控制过程
(1) 初始化
系统初始化包括对SAA 7110、VW2010、RC32434、BGW20 等芯片的初始化。初始化过程主要包括对一些数据寄存器、地址寄存器、中断服务寄存器等进行相应的操作以形成系统运行环境的初始状态。
(2) 传输控制策略
上电开始初始化程序后,服务器端USB摄像头的模拟视频信号在程序控制下通过SAA7110 视频解码芯片完成模数转换,接着mpeg4 编码芯片VW2010将接收的数字图像信号进行DCT变换、量化编码、熵编码后,把数据流输出到相应的SDRAM内部的FIFO中。RC32434MCU在FIFO中查找帧同步标志,如果找到,判断缓冲区内是否有一帧的数据,如果有则微处理器读出压缩数据流并发送到BGW20进行扩频、调制发射出去。客户端初始化过程与服务器端类似,在系统初始化完毕后通过与服务器端交互,建立网络连接,并将SDRAM 用作硬解码时的数据缓冲区,采用LCD 接口连液晶屏用来显示图像。整个系统中,由RC32434完成对各器件的初始化、协调整个系统的工作。
5.结论
系统采用64位MIPS芯片IDT RC32434作为主控制器,以VW2010作为MPEG-4编、解码芯片实现网络端口输入和输出的MPEG-4码流、采用BGW200无线模块进行音视频数据传输,在uclinux平台上结合先进的多媒体无线传输技术实现的,结果表明其具有较高的传输效率、和普遍的门禁设备相比,本系统具有更好的灵活性与扩展性、交互能力、控制能力更强。而且该无线音视频传输技术也可广泛用于IP电视、卫星电视、安防系统、智能楼宇系统和基于MPEG-4标准的数字电视广播系统中,应用前景十分广阔。
参考文献
[1] 杜春雷编著,《ARM 体系结构与编程》, 清华大学出版社,2003.
[2]Philips Semi conductor,《SAA 7110 Enhanced Video Input Processor (EVIP) Data Sheet》, May 1998.
[3] 魏永明、骆刚等译,《Linux 设备驱动程序》第二版, 中国电力出版社, 2002.
[4] 广州周立功单片机发展有限公司. P89LPC932A1 FLASH单片机使用指南.
[5]Thomson, J. An integrated 802.11a baseband and MAC processor. Solid-State Circuits Conference,ISSCC,2002(1):12~21
篇8
【关键词】数模结合;收费公路;监控联网;方案
0 概述
甘肃省省公路管理局作为甘肃省公路系统的主管部门,管辖13个公路总段和1个公路分局。各公路总段和公路分局分管各自辖区内的二级公路收费所,每个收费所又分管有1至3个收费站。目前,各个收费站监控系统只停留在其上级单位――收费所中。监控视频和音频未能进一步传输至公路总段,更未能上传至省省公路管理局。因此,省公路管理局和各公路总段对所辖收费所的管理及各收费站车流量情况的监控都无法达到可视化的效果,不能及时给公路总段和省公路管理局的相关领导提供交通一线的决策信息。随着信息技术的发展,省公路管理局根据自身现象,提出将监控信号、IP视频传输、中心(分控中心)显示、点播、存储、大屏幕显示系统有效的结合为一个整体,构建一个优质的基于网络平台的数字视频管理系统,从而实现全省二级公路联网监控。
1 方案目标
省公路管理局此次建设智能视频监控系统,实现对整个二级公路收费站的实时视频监控、图像存储、历史图像查询、云台操作控制;实现监控网络和监控内容的广度覆盖,监控网络应全面覆盖重点地区,监控内容应适应二级公路收费系统视频监控业务的需求;实现监控信息反馈的快速反应,确保信息的快速、高效和安全流动。具体建设目标:建成省级二级路收费站监控网络,建成省级主控室和中心机房,建设智能视频监控管理平台。
2 系统功能
根据各收费所监控系统的实际情况,经过综合分析,要实行联网监控,最好的方案是监控数据逐级汇总,最终传输至省公路管理局,省公路管理局可随时根据需要点播对应收费站的相关视频,并进行监听。我们可以将系统归纳为监控资源、传输网络、监控中心、视频管理平台四个部分。
(1)监控资源是监控信息的起始点,包括图像信息、音频信息、报警信息甚至还包括区域监控系统。在本案中监控资源指收费站视频监控摄像机。
(2)传输网络是监控信息的传输通道。传输网络可分为模拟和数字两种。本方案的传输网络为IP传输网,采用光纤线路(租用或敷设)和租用运营商MSTP(10M)线路两种方式来实现联网。
(3)监控中心是各种监控资源的处理和响应中心。同时包含查看监控资源、大屏幕电视墙图像显示、音视频录相及各种终端设备的控制及管理。本方案中包括三级监控中心,第一级为省公路管理局监控中心、第二级为公路总段监控中心、第三级为收费所监控中心。收费所监控中心为监控资源的汇聚中心,也是目前全省各收费的已建成的比较完整的监控中心,都具备相对独立、完整的CATV监控系统。
(4)视频管理平台是整个系统的调度、管理核心,负责系统内各种监控资源信息的调配和记录、用户的管理、设备的管理工作。同时负责与第三方系统接口工作等。
3 数模结合技术下的整体设计框架
视频编码器和解码器应用到模拟监控系统中,将传统的模拟视频信号转换为数字信号,通过计算机网络来传输,这就实现了视频/音频的数字化、系统的网络化、应用的多媒体化和管理的智能化。ivsIP智能监控解决方案,通过视频管理平台实现图像信息的调配、存储、回放以及用户、设备的管理,实现了整个系统的智能化。总体设计如图1所示:
图1 系统总体设计图
IVSIP智能解决方案:最底层的监控资源在经过监控接入层的编码器编码后,通过媒体交换层的IP承载网,将监控音、视频信息传送至控制管理层和视频应用层。不同于传统的监控模式,监控视频流和音频流以IP数据包的形式在网络中传输。因此,可以很方便地通过媒体交换服务器MS、视频管理服务器VM和DC解码器对监控音、视频资源进行统一管理。还可以很方便地应用IP SAN技术,对音、视频数据进行集中存储和备份。另外,通过开发相应视频应用程序,可以更深层次的应用音、视频监控信息。如图2所示。
图2 iVS IP智能监控解决方案示意图
3.1 视频编、解码器
编解码器支持H.264、MPEG2、MPEG4、MJPEG等多种标准编码格式,提供从单路到16路各种密度的规格,支持实时流和存储流双流设计,支持高至8Mbps的高清码流或低至128Kbps的标清码流并且可以根据用户需求任意调整,采用电信级制造工艺,可以基于各种网络环境高质量、可靠的满足各类网络监控前端编码、存储和解码的需求。
3.2 网络视频存储系统
专业的IP存储技术和强大的数据管理服务器构建完善的网络存储系统,存储资源可以根据需求分布式部属并加以统一资源管理和调度,支持动态存储资源管理、在线部属,可以基于统一平台满足不同存储质量、容量和服务质量的客户需求,可以提供完善的备份和存储生命周期管理功能,同时支持NAS备份功能。
3.3 系统管理平台
包括专用的视频管理服务器、数据管理服务器、客户端和流媒体服务器,视频管理服务器是用于集中认证、注册、配置、控制、报警转发控制的专用信令服务器,可以实现完善的视频编解码设备网络管理功能,支持多台信令管理服务器相互协同工作组建多级多域的管理平台。数据管理服务器主要功能为管理存储设备、存储资源和视频数据,支持对系统所有存储资源进行全方位的监控和管理,支持不间断的视频检索、回放等业务。客户端可以提供友好方便的人机界面功能,包括监控对象的实时监视监听、查询、云台控制、接警处理,并集成了基本的GIS功能方便用户操作。
3.4 承载网络系统
采用充分组播优化的系列交换机对前端视频编码器传输的数据进行接入、汇聚、交换。通过设备自身安全特性和防火墙等实现对边界安全接入的控制。同时可通过网络本身的设备、协议冗余实现整个监控网络的稳定性。
篇9
关键词:SC2262;SC2272;智能手机;无线寻呼
静脉输液是目前疾病治疗的主要手段。然而因我国人口众多,医疗资源不充足,经常出现医院病床紧张的情况,因此,医院设立了输液大厅,类似于门诊治输液方式,其存在患者众多,人员流动性大,医护人员分配少的特点。输液人数众多护士工作强度大,无法定期查看患者输液进行状况。患者一但输液结束,没有及时换药或拨针将出现血液回流等不良状况,必然会增加医疗事故发生的概率。针对上述现状,为了缓解护士的工作压力,为患者提供可靠优质的治疗服务,国内外部分厂家相继研制了有线寻呼系统,因其存在布线施工复杂、成本高、维护难的不足,已不能很好的用于输液大厅这种场合[1]。基于上述背景,本文顺应物联网理念的发展潮流,本着低成本,高可靠性、稳定性的原则,将WIFI技术、无线射频技术、智能手机技术相结合,设计了一款低成本、移动性好、多种模式无线主机接收,可灵活组网进行无线扩展的输液无线寻呼系统。
1 系统总体结构设计
系统总体框图如图1所示,由呼叫终端、接收主机、护士站PC机及智能手机终端构成。在实际使用中,呼叫终端由病人手持或安放在输液椅子边上,(注意:椅子的编号与呼收终端地址相对应)。当输液结束时,病人按下呼叫终端上的按键,通过无线射频发射呼叫信息帧到接收主机,接收主机收到有效信息后通过WIFI模块以WIFI网络通信技术,转发到护士站的PC机进行语音报号,同时还可转发到护士的智能手机上。接收主机也可以通过无线路由扩大网络覆盖范围。
2 硬件设计
2.1 呼叫终端模块
呼叫终端分别由射频发射模块、电源电路、编码电路组成。射频发射模块选用XY-FST射频发射模块。编码电路选取SC2262,通过查阅其用户手册中的引脚定义[2],设计的终端模块电路如图2所示,R6用于调节编码振荡器的频率;SC2262的第17为串行输出发送引脚,与射频模块的数据引脚相接。10、11、12、13为数据编码,可设为0或1;1---8为三态地址引脚,设置时必须与主机的解码接收模块SC2272相同。其中J11、J12在设计PCB时做编码状态设置跳线,以便于对不同模块对应的输液座位进行对应编号设置。其工作流程是:当按键S4没有按下时,模块不通电,所以不耗电,为电池供电提供了较好的可能性。当按键按下时模块得电立即传送已设好的编码数据。
2.2 接收主机模块
2.2.1 超外差接收射频模块
超外差接收射频模块由解码模块与XY-FST射频接收模块构成。接收终端的呼叫号码,通过SC2272解码后,将结果输出单片机的P10~P13口线。通过查阅SC2272的用户手册可知[3],接在15、16脚间的电阻值选取很关键,要与SC2262的对应。同时其地址也要与2262设置相同。正确解码后17脚会输出由0到1的脉冲信号,将其连接到单片机的P14口线用于通知单片机读取数据。
2.2.2 处理器模块及WIFI模块
处理器模块的主要任务是通过I/O口读取SC2272接收到的终端呼叫号,然后通过串口控制WIFI模块,将数据上传到WIFI网络,WIFI终端接收。因处理器不需要做复杂运算处理,因此选用成本较低,通用性好的AT89S51单片机来实现。
为了降低开发的难度,缩短开发的周期,近而降低开发成本,综合考虑成本高低、技术支持是否良好等多方面的因素,最终选用了济南有人物联网技术有限公司的串口转WIFI模块USR-WIFI232。USR-WIFI232系列产品具有超小体积、支持无线工作在STA/AP/AP+STA/WDS(WDS即无线漫由功能)模式等特点,能够使本文设计的寻呼系统便于实现灵活的组网模式,组成一个覆盖范围较广的WIFI网络,进而提高了系统的通用性。模块的接口定义及管脚说明详见参考文献[4]。
3 软件设计
3.1 接收主机软件设计
单片机上电后,首先完成串口初始化,接着进入主循环,通过P14口线不断检测解码模块SC2272的第17脚是否有0到1的信号跳变,以确定是否有终端呼叫。如果有就读取呼叫值,然后按特定的数据帧格式通过串口发送到WIFI模块,WIFI模块不对数据做任何处理直接传输到整个WIFI网络,供护士站PC主机接收和安卓智能手机接收。
3.2 护士站PC软件设计
基于VB6.0平台开发的显示界面如图3所示,包括当前呼叫号码显示区域,网络连接设置与状态显示区及语音调节区域。对于网络的连接编程选用WinSock控件能通过TCP协议(数据传输协议)连接到接收主机的WIFI网络。同步号码语音播报是通过在VB环境中添加Win32 speech API中的对象库来完成。可根据PC操作系统中已安装的语音库设为中英文男女音四种模式。
4 结论与讨论
本系统整体调试通过,调试显示如图3所示。经过多次测试,本系统能够很好的实现对终端呼叫信号的接收、显示、播报及转发。接收范围也能满足应用要求。本方法设计的系统克服了有线系统的缺陷,具有成本低、移动性好、多种模式无线主机接收,可灵活组网进行无线扩展的优势。
[参考文献]
[1]于沛.基于无线传感器网络输液监测系统设计[D].硕士论文,黑龙江大学,2012,1-5.
[2]拓迪电子有限公司.SC2262数据手册.佛山市拓迪电子有限公司,2010,1-30.
[3]拓迪电子有限公司.SC2272数据手册.佛山市拓迪电子有限公司,2010,1-28.
[4]有人科技有限公司.USR-WIFI232芯片技术手册.济南有人科技有限公司,2012,1-26.
篇10
【关键词】智能家居 GSM模块 单片机
随着网络技术的发展,网络化智能家居系统可提供遥控、家电控制、照明控制、窗帘自控、防盗报警、可编程定时控制及计算机控制等多种功能和手段,使生活更加舒适、安全和便利。本文设计的基于GSM网络的智能家居监控系统由智能监控模块、数据采集系统和用户手机构成,通过GSM短信息的收发实现对家庭设备的远程监控。
1 总体设计方案
系统由中心控制模块和各分散控制模块组成。中心控制模块实现控制用户手机和各分散控制功能模块。选用AT89S52单片机作为该监控系统的核心控制元件。主控单片机模块接收用户手机发送的短信息,根据短消息的内容控制各子功能模块;同时主控单片机模块将家居系统的控制信息以短信形式发送到用户手机,由单片机构成各控制模块子系统。
1.1 系统硬件部分
根据任务需要,合理选择单片机、传感器、GSM模块和设备来构成系统。为使硬件设计尽可能合理,系统的电路设计遵循了以下几个方面:
(1)选择标准化、模块化的典型电路,提高设计的成功率和结构的灵活性。
(2)选用功能强、集成度高的电路或芯片。
(3)选择通用性强、市场货源充足的元器件。
(4)在对硬件系统总体结构考虑时,考虑通用性的问题,采用模块化的设计方式。
(5)系统的扩展及各功能模块的设计应适当留有余地,以备将来修改、扩展之需。
(6)在电路设计时,充分考虑应用系统各部分的驱动能力
最终确定采用AT89S52单片机作为处理芯片。西门子的TC35系列的TC35iGSM模块,TC35i与GSM2/2+兼容、双频(GSM900/GSMl800)、RS232数据口、符合ETSI标准GSM0707和GSM0705,且易于升级为GPRS模块。该模块集射频电路和基带于一体,向用户提供标准的AT命令接口,为数据、语音、短消息和传真提供快速、可靠安全的传输,方便用户的应用开发与设计。
1.2 系统软件部分
软件部分由以下几部分构成:数据采集单元、手机短信信令识别与分析单元、GSM模块TC35 modem接口程序部分、分析控制部分。其中数据采集部分和手机短信信令识别需要作实时处理;GSM模块TC35 modem接口程序部分和分析控制部分则是根据采集和手机短信信令进行分时操作有利于提高系统效率。
2 系统软件设计
软件设计部分主要有数据采集部分、手机短信信令识别、TC35Modem接口程序部分、分析控制部分。其中数据采集部分和手机短信信令识别需要作实时处理;GSM模块TC35Modem接口程序部分和分析控制部分则是根据采集和手机短信信令进行分时操作有利于提高系统效率。本智能家居监控系统软件设计的内容主要有主控模块程序、TC35Modem模块通信程序、串口通信初始化程序和短消息的编码解码程序。软件设计模块如图1所示。
2.1 单片机系统软件设计
为了实现单片机与TC35I模块的通信顺畅,必须使二者的串口波特率一致,如果单片机F=11.0590MHZ,设置串行口波特率为9600,工作方式为方式3,Tl定时器采用工作方式2。其中串行口和定时器的工作方式和初值可以根据具体情况加以更改。
本系统的软件设计是将整个短信处理模块放入单片机的中断服务子程序中。发送和接收串行口数据采用中断方式进行,这样可以大大节省CPU资源。当接收一帧数据进入一位寄存器,送入接收SBUF中,同时将Rl置1;当发送数据载入发送SBUF中开始向外发送,发送完毕后即将TI置1。无论Rl置1还是TI置1,均会激发串口中断,执行中断服务程序。响应中断时,首先判断中断是接收程序还是发送程序,若为接收中断则将SBUF中的数据存入接收队列缓冲区;若为发送中断便将待发送的数据帧发送到SBUF中。
2.2 短消息PDU模式编码解码程序
在GSM标准中,中文编码采用UTF-8的编码,不是目前国内常用的GB-2312编码,因此需要对中文编码进行转换才能与采用GB-2312汉字库相配合,方可正确显示出短消息中汉字字型。由于UTF-8和GB-2312编码之间不存在一一对应的线性关系,因此需要采用查表的方式进行转换。
2.3 短消息收发程序设计
发送短信息的主要工作是将发送的内容进行相应的编码,其次就是将发送所用的SMS服务中心号码、目标号、有效时间和短信内容按照PDU编码的格式发送出去。如果是接收短信息,其工作就是将接受到的短信息内容进行解码,发送和接收的PDU串的结构是不同的。接收程序流程图如图2所示。
3 运行结果
运行结果如图3所示。
4 结论
本文设计了一个基于GSM网络的无线传感智能家居监控系统。系统在运行中还有改进之处,还需进一步对程序结构进行优化。本设计只是智能家居控制中的一部分,目前国内很多公司都在致力于智能家居产品的开发,随着相关技术的进一步发展,我国将全面普及智能家庭网络系统和产品。
参考文献
[1]黄欣荣.基于GSM短信模块的家庭防盗报警系统的设计[J].中国新通信,2010(06),19-22.
[2]曾志永,凌振宝,王君.基于GSM技术的智能家居系统的设计[J].电子技术应用,2005(10),33-35.
[3]齐赵毅,陈杰浩,罗颖等.基于GSM的智能家居远程监控系统[J].科技信息,2013(04),19.
[4]申利民,刘冬香.基于GSM智能家居控制系统的设计[J].传感器世界,2011,17(1):32-36.
[5]王骐,何嘉斌.单片机控制GSM模块实现短信收发的软件设计[J].单片机与嵌入式系统的应用,2005.
[6]马忠梅.单片机的C语言应用程序设计[M].北京:北京航天航空大学出版社,2007.
[7]邱文静.基于GSM短信息的家居设施遥控监测系统设计[D].南京:南京理工大学硕士学位论文,2009.
[8]苏江福.基于GSM网络的智能家居监控系统设计与实现[D].哈尔滨工程大学硕士学位论文,2008.