视频广播数字化管理论文

时间:2022-08-01 10:25:00

导语:视频广播数字化管理论文一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

视频广播数字化管理论文

近一段时间在电视技术方面呼声最高的莫过于数字化,因为数字化的视频和音频具有高保真、易存储等优点,所以它们一面世就极受欢迎。在此情况下,加快进入数字化领域的步伐选用数字录象机就显得尤为重要。

随着数字视频技术的迅速发展,磁带记录方式的数字录象机开始采用数据压缩技术,出现了价格适中、且有较高的图像和声音录放质量、更高记录密度的新格式录象机,主要有sony的betacam-sx、dvcam、松下的dvcpro、dv和jvc的digital-s。在这些同类产品中,只有betacam-sx采用了mpeg-2压缩方式,可以采用更大的压缩比从而降低数据率,并且填补了mpeg-2压缩方式在电视信号处理的全过程中录象编辑制作领域的空白,因此有利于数字设备的配套性及发展性。本文就betacam-sx这种记录方式进行阐述,并同现存的其它平行记录格式作有限的比较,以用来说明betacam-sx格式的某些技术特点。

一.取样比方面的比较

从表一可以看出在取样比方面dvcpro(25mbps)与dvcam未满足ccir601规定的亮度信号与色度信号r-y、b-y的取样比4:2:2,这是衡量数字视频信号是否达到广播级的一个重要标准。不满足此标准就与广泛采用4:2:2的多数数字切换台与特技机较难以兼容。在制定此国际统一的分量编码的标准时,亮度信号抽样频率的选择必须兼顾不同的扫描制式,由于现行的扫描制式主要有625行/50场和525行/60场两种,它们的行频分别为15625hz和15734.265hz,因此itu-r建议的分量编码标准的亮度抽样频率为13.5mhz,这恰好是上述两种行频的整数倍,另外按照国际现行电视制式,亮度信号最大带宽是6mhz,根据奈奎斯特抽样定理,抽样频率至少要大于2×6=12mhz,可见取13.5mhz也是合适的。另外由于人眼的视觉对亮度变化比对色度变化敏感度更高,色差信号的带宽可以比亮度信号带宽窄得多,所以在分量编码时两个色差信号的抽样频率可以低一些,同时也考虑到抽样的样点结构满足正交结构的要求,itu-r建议两个色差信号的抽样频率均为亮度信号抽样频率的一半,即6.75mhz,因此,对演播室数字电视设备进行分量编码的标准是:亮度信号的抽样频率是13.5mhz,两个色差信号的抽样频率是6.75mhz,其抽样频率之比为4:2:2,称为4:2:2格式。4:1:1取样格式又在4:2:2取样格式的基础上把色差信号的取样频率降低了一半,即色度清晰度又降低了一半,因此它的色度信号要差一些。而在4:2:0的取样比情况下,一场中相连两行的色度取样被插入以产生一个单色度取样,它不仅色差信号要差一些,而且它还具有许多缺点。首先,由于使用隔行扫描,垂直方向的清晰度已经被降低,而采用4:2:0取样比的视频,在垂直方向上色度清晰度又降为只有水平方向上的一半;另外,垂直插入色度取样的过程很复杂,当场处理或垂直方向上有移位时会使色度清晰度再度下降,虽然直接显示人眼看不出来,但当有较多色度处理时就显得不足,更会导致糟糕的多代复制效果;再有,它无法把水平和垂直方向上色度信号取样密度的差别考虑在内。表二总结了包括ntsc和pal制在内的不同视频格式色度信号的取样密度。

显而易见,4:2:0无法在水平和垂直两个方向上降低等量的色度清晰度,水平对垂直色度清晰度是处于3:1的比例,即使把4:3的宽高比考虑在内时,水平到垂直的比率仍是2.25:1。很明显,4:1:1取样结构能在水平及垂直方向上,提供平衡的色度清晰度。如果目的是使用一种ntsc或pal的复合标准来分配一个信号,那么4:2:0就比较差,它的水平色度清晰度比ntsc或pal更高,但垂直色度解析度却比这些复合标准更差。

在纠错能力方面betacam-sx是四种格式中纠错能力最强的。数字录象机都采用二维rs纠错编码,即里德-索罗门码(reed-solomon),它是利用伽罗华创造的伽罗华域(galoisfield)中的数学关系来把传送数据包的每个字节映射成伽罗华域中的一个元素(又称符号),每个数据包都按码生成多项式为若干个字节的监督校验字节,组成rs的误码保护包,接收端则按校验矩阵来校验接收到的误码保护包是否有错,有错时则在错误允许的范围内纠错。rs纠错编码具有很强的纠正突发误码的能力。在里德-索罗门编码中,通常以符号为单位来处理,一般选用8比特符号,这样做可以处理非常大量的数据,8比特伽罗华域最长的序列为28-1=255个符号,总共有255×8=2040比特。在此编码中每个符号要乘以某个基本元素的幂次方后再模2加,如图一所示。因此,我们必须定义两个符号伽罗华域的乘法如表三所示。

在里德-索罗门编码中一系列误码可以用码字除一定数量的一次多项式,如果要纠正t个错误,那么码字必须要被2t个不同的形式如x+an的一次多项式整除。这里的n取值为直到2t的所有整数值。a是基本元素,以3比特伽罗华域为例,基本元素a是010,输入是5个符号,每个符号3比特,与相应的元素相乘后直接模2加输出。因为有两种系数,所以得到两个校验字,由于没有出错,所以在校验时,两个校验式的结果都为零,即:

s0=a⊕b⊕c⊕d⊕e⊕p⊕q=0

s1=a7a⊕a6b⊕a5c⊕a4d⊕a3e⊕a2p⊕aq=0

当接收到的符号有错时,通过计算可以得到与符号有关的错误信息,举例如图二所示。此时有错的码用加撇表示,s0是错误码,真正的d=d’+s0=101⊕001=100,错误的位置将由s1与s0的关系决定。s1和s0是同一个错误的不同的码,由于s1是由乘an次方的各接收符号模2加得到的,因此s1/s0=ak的k恰好是乘2n的那一个符号。

为了纠正一个符号错,要2个符号的检测码,一个用来确定位置,一个用来纠错,纠t个错误需要2t个检验符,这时要计算2t个等式,确定t个位置和纠t个错,能纠t个符号的rs码生成多项式为:

g(x)=(x+a0)(x+a1)(x+a2)…(x+a2t-1)

如果由某种方式预先知道哪一个符号出错,则可以用同样数量的检验符纠正同样数量的错误符号。

另外,为了适应不同的码组长度可使用截短的rs码,例如dvb和ga。ga采用rs(207,187,10),即分组码符号长度为207个,187个信号符号,可检出207-187=20个错,可纠正(207-187)÷2=10个错。该码就是从rs(255,235,10)码截短而得到的,实际上可以看成255个符号中除207个有具体的值外,剩余的48个符号全部添零,可以用同样的电路进行编解码。

在dvcpro、dvcam、digital-s格式中视、音频数据的内码组为rs(85.77)码,检错能力为85-77=8byte,纠错能力为(85-77)÷2=4byte。视频数据的外码组为rs(149.138),在内码组指出错误位置时能纠错149-138=11byte。音频的外码组为rs(14.9)码,在内码组指出错误位置时14byte中有不多于14-9=5byte的错误都能得到纠正。而betacamsx的视频内码组为rs(124.112)外码组为rs(64.50),声音的内码组为rs(124.112)外码组为rs(14.6),其外码组的纠错能力明显高于其它格式,加上磁迹宽度又比其它格式宽了许多,即使一个gop中有两根磁迹丢失,误码校正仍可正常进行,其误码校正数据块的组成如图三所示。

三.压缩方面的比较

在压缩方面dvcpro、dvcam和digital-s采用类似于m-jpeg的dv方式(包括dct、自适应量化、之字形读取游程与可变字长编码),m-jpeg是可以实现对视频图像的实时压缩和解压缩的帧内编码,故不必采取复杂的措施就能实现零帧精度的编辑,但是帧内信息冗余量太小,不能有过大的压缩比,否则会丢失一部分图像数据,影响图像质量,因此数据率较大,不利于高速传输与存储。而sony的betacamsx采用mpeg-2压缩方式,即运动图像的帧间编码,它的主要机制是:

1.消除时间冗余,即利用连续图像各帧之间的相关性以传输帧间小量的差值代替传输邻帧图像的全部信息。

2.消除空间的冗余和基于人眼视觉特性的量化以压缩待传信息。

3.利用游程零和变字长编码技术减少所传码率量。

基本的mpeg-2视频压缩系统是由帧内及帧间压缩共同组成的,如图四所示。压缩是从空间冗余的减少开始的,使用帧内部压缩便可以达到此目的。帧内部压缩使用有损和无损的信号处理方法来减少图象中的数据,它不使用任何来自之前或之后的图象信息。另外,在视频信号中还有一种冗余便是时间冗余,对一个给定的图像顺序,帧与帧之间的图像内容通常只有微小的变化,这种帧间的相对图像内容位置的变化是帧间压缩的一个重要组成部分。帧间压缩一般是在未压缩的图象上进行的,是一个无损过程。在图四中稳定帧存储器有一幅完全解析度、完整数据的前一幅图象,在运动补偿区,最能预测当前帧的矢量被计算出来,已预测的帧存储器拥有一个根据前一帧和运动矢量所建立的预测的当前帧,输出的是预测当前帧跟实际的当前帧相减以后的差。如果没有运动或其它变化,当前帧便可得到完美的预测,差分帧的输出为0(极易压缩);当前一帧跟后一帧有点不同时,差分帧仍有少量数据需要压缩。预测帧是从一个被dct量化、解码后的图象发展而来的。在mpeg-2系统中包含有三种帧结构,即:

·i帧:只包含有帧内编码。

·p帧:是从对i帧或其它p帧进行向前预测而得到的。

·b帧:是从对i帧或其它p帧进行双向预测而得到的。

由于mpeg-2不仅消除了空间上的冗余,而且消除了时间上的冗余,因此使用mpeg-2可以在比较大的压缩比的情况下保持较好的图像质量,sony的betacam-sx采用10:1压缩,数据率为18mb/s是现有数字录象机中最低的,有利于高速传输与存储。另外,mpeg-2还具有如下特色:

1.输出码率流速率可适应同步或异步传输,无需固定;

2.适应于逐行或隔行扫描系统;

3.可用于4:2:0、4:2:2、4:4:4等亮、色取样;

4.按清晰度可以将图象分为4个等级,高级解码器可与低级解码器实现下兼容;

5.按使用的工具和方法不同分为5种类型,即允许分层性编码,以保证不同的传输与接收要求。

mpeg-2的这种开放性的优点,决定了betacam-sx将来可直接与众多公司生产的数字视频系统连接,进行数据交换、传输、制作而不需任何数字的转换设备,就连一贯采用m-jpeg数字压缩算法的非线形编辑领域也在积极向mpeg-2靠拢。matrox、品尼高等一些非线形软、硬件主流产品厂商也已经宣布将于99年第一季度推出采用mpeg-2压缩算法的视频板卡及软件,无疑这其中受益的是betacam-sx,而且betacam-sx本身还推出了一种盘带结合型录象机,为进行非线形编辑提供了更加优越的条件。另外,mpeg-2将是广播电视向全数字化过渡的最佳选择也逐步被大多数视频专业人士认可,所以美国以及西方各国普遍以mpeg-2标准作为数字hdtv图像压缩编码系统的核心,这无疑又为betacam-sx的未来发展提供了一个优越性。

四.betacam-sx的零帧编辑

最初的mpeg-2标准是为视频分配而设计的,为家庭提供一个可接受的图象质量,但是由于有限的数据率(最大为15mb/s)和采用4:2:0取样,它的质量并不适合专业制作和后期制作,4:2:0的取样结构也不能达到演播室对多代复制所要求的图象质量,采用小型gop(groupofpicture)结构和15mb/s的数据率不能产生所需的图象质量,大型的gop结构又令演播室的信号切换很困难也不能实现零帧编辑,因此很多的录象机采用帧内dct处理,造成在整个节目到播出的链条中,节目制作是唯一不使用mpeg-2的部分。sony公司在与大批厂商的共同努力下,顺应了发展的趋势率先推出采用mpeg-2mp@ml的改进型mpeg-24:2:2p@ml压缩算法的betacam-sx,以两帧(i帧和b帧)作为一个gop,既保证了广播级的图像质量,又实现了高稳定性以及高速的数据传输,但是最初我们还是有一点疑问,就是betacam-sx如何实现零帧编辑,这恐怕也是很多家电视台在选择数字录象机时的疑虑之处。在解释betacam-sx如何实现零帧编辑之前,首先让我们先看一看其它采用帧内压缩的数字录象机是如何进行零帧编辑的。

在进行复制或编辑时,目前数字录象机通常都使用串行数字(sdi)或模拟接口相连接的。因为即使装配了传输压缩数字信号的接口(如:sdti、qsdi等),那么它只能应用在复制操作中,而一旦需要叠加字幕或在系统使用时,也必须使用sdi或模拟接口。

betacam-sx有两种类型的录象机,一种是盘带结合型的录象机,它主要利用硬盘进行编辑,然后在复制到磁带上;另一种是磁带录象机,即在磁带上完成编辑,下面分别描述一下它们是如何进行零帧编辑的。

betacam-sx盘带结合型录象机实现零帧编辑的关键是装备了两个相同的mpeg解码器,原理如下:(如图六所示)

1.磁带中的素材上载到硬盘上。

2.编辑时,将记录在硬盘上的素材(压缩信号)转换为基带信号(不压缩信号),生成编辑决定表(edl)。

3.最后复制到磁带上。edl会控制两个mpeg解码器读取硬盘上的素材,然后在经过mpeg编码器记录在磁带上。

betacam-sx磁带录象机实现零帧编辑的关键是装备有超前重放系统(advancepbsystem)。超前重放系统主要是在录象机记录磁头之前安装了超前重放磁头(advancepbhead),它可以先将磁带上的betacam-sx信号重放,经过解压缩处理转换为基带信号,再进行编辑,然后将完成的节目进行压缩,最后记录在磁带上。但它的位置必须是十分精确,它超前的时间应该等于重放的时间与记录的时间之和。下面我们举例加以说明。(如图七所示)

以装在一个盒子中的两个圆形来表示处于一个gop中的两帧压缩图象,以一个三角形表示外部的信号(如:sdi),我们将看到betacam-sx是如何利用超前重放系统实现零帧编辑的。

1.重放超前重放磁头先读取记录在磁带上的betacam-sx信号,即拿出一个装有两个圆形的盒子。

2.解码经过解压缩等的处理后,betacam-sx信号被转换为基带信号,即将盒子打开,圆形可以显示出来。

3.编辑与外部的信号进行编辑制作(零帧精度),好比用一个三角形来替换一个圆形。

4.记录将完成的节目进行压缩,然后记录在磁带上,好比最后再用盒子将一个三角形和一个圆形包装起来放回去。

由此可见,betacam-sx完全能够实现零帧精度的编辑,但是在此还存在一个问题就是会影响编辑图象的质量,主要指以下两点:

·为实现零帧编辑,编辑过程的数据必须是解压缩的,不能直接使用压缩信号编辑。多次解压缩与压缩过程会影响图象质量;

·放机输出的解压缩信号在录机再次压缩时,如果出现i帧与b帧的交换(几率为50%)会产生图象质量下降。但一般情况下的编辑图象质量仍可以接受,至于多次编辑图像质量到底会有多大损失,是否仍在允许范围之内还有待于实践来证明。

另外,值得说明一点,为了实现零帧编辑betacam-sx加装了超前重放磁头,从而形成了betacam-sx的双磁头结构。当其中任何一个磁头发生故障时,录象机会产生报警信号,不能再实现零帧编辑,但在重放过程中仍可以应用另一个磁头正常运行。可见这种双磁头结构在录象机的重放过程里无形中又提高了它运行的可靠性。

五.与现有设备的兼容性方面

最后,我们还有一个要着重考虑的方面,即为了节省资金利用原有设备要达到现有设备与新设备的兼容性。如果原有设备主要为betacam-sp录象机,由于betacam-sx录象机是由betacam-sp发展而来的,该机向下兼容,使用磁带也完全相同,这样就充分保持了设备发展的连贯性。在使用过程中,可以完全忽略摄象机是数字还是模拟,回到台里要用哪一套设备编辑等一系列问题,这样就更充分发挥了原有的betacam-sp设备的使用能力,避免了选用新型设备而产生老型设备的问题。同时该格式的录象机的机械部分与betacam-sp机型完全一致,保持了betacam-sp的高稳定性,维护、保养的方法也基本相同,这样在后期服务上省去了大笔人员培训费和零配件费用。如果原有设备是其它的机型,则需要考虑与其它数字录象机的兼容性,在此不再加以分别说明。

详述了betacam-sx的一些特点之后,再简单介绍一下betacam-sx的主要记录参数。betacam-sx使用的磁带是宽度为12.65mm的金属涂布带,磁迹的组织与其它录象机不同,不是按照帧来组织,而是按gop(相当于两帧,即i帧和b帧)来组织。对于525/60制式,每个gop加纠错码后组成10条磁迹;而对于625/50制式,使用12条斜磁迹。在磁速的安排上,视频磁迹放在两侧,中间安排8段音频数据和两段系统数据,另外还有3条纵向磁迹,一条辅助磁迹,一条时码磁迹和一条控制磁迹。betacam-sx的主要参数总结如下:

视频处理:525/60625/50

4:2:2处理4:2:2处理

8比特/样值8比特/样值

507行/帧608行/帧

视频辅助数据:一行/场

磁迹数:10条/gop12条/gop

带速:59.515mm/s59.575mm/s

磁迹间距:32um

磁鼓直径:81.4mm

磁鼓转速:75hz

记录码率:约40mbps

视频压缩:10:1压缩,输出码率约18mbps

视频质量:y:25hz-5.5mhz,金属带

r-y,b-y:25hz-2.0mhz,金属带

s/n>48db

音频:4声道线性pcm

16比特/样值

48khz抽样

硬盘容量:90分钟dnw-a100p

硬盘编辑:最小编辑段0.5秒

edl表编辑及输出

磁带到硬盘:4倍速装载

视频输入输出接口:sdi,sddi,模拟分量,模拟复合

音频输入输出接口:aes/ebu数字,模拟

以上所述betacam-sx数字分量录象机格式的技术特点,主要是从记录格式本身得到的,至于录象机的图像和声音质量以及功能,还与机内的电路、机械系统的设计有关,这里就不再阐述。