图像处理技术论文范文
时间:2023-04-08 05:05:58
导语:如何才能写好一篇图像处理技术论文,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
基于图像采集卡的视频图像处理系统
计算机图像处理系统从系统层次上可分为高、中、低档三个层次,目前一般比较普及的是低档次的系统,该系统由CCD(摄像头)、图像采集卡、计算机三个部分组成,其结构简单,应用方便,效果也比较不错,得到的图像较清晰。目前网上基于VC开发经验的文章不少,可是关于如何在VC开发平台上使用图像采集卡的文章确没发现,笔者针对在科研开发中积累的使用图像采集卡经验,介绍如何自己是如何将采集卡集成到图像开发系统中,希望能够给目前正需要利用图像采集卡开发自己的图像处理系统的朋友有所帮助。
使用的摄像机采用台湾BENTECHINDUSTRIAL有限公司生产的CV-155L黑白摄像机。该摄像机分辨率为752x582。图象采集卡我们采用北京中科院科技嘉公司开发的基于PCI总线的CA-MPE1000黑白图象采集卡。使用图像采集卡分三步,首先安装采集卡的驱动程序,并将虚拟驱动文件VxD.vxd拷贝到Windows的SYSTEM目录下;这时候就可以进入开发状态了,进入VC开发平台,生成新的项目,由于生产厂家为图像采集卡提供了以mpew32.dll、mpew32.lib命名的库文件,库中提供了初始硬件、采集图像等函数,为使用这些函数,在新项目上连接该动态库;最后一步就是采集图像并显示处理了,这一步要设置系统调色板,因为采集卡提供的是裸图形式,既纯图像数据,没有图像的规格和调色板信息,这些需要开发者自己规定实现,下面是实现的部分代码:
CTestView::CTestView()
{
W32_Init_MPE1000();//初始化采集卡
W32_Modify_Contrast(50);//下面的函数是为了对采集卡进行预设置
W32_Modify_Brightness(45);//设置亮度
W32_Set_HP_Value(945);//设置水平采集点数
wCurrent_Frame=1;//当前帧为1,获取的图像就是从这帧取得的
//设置采集信号源,仅对MPE1000有效
W32_Set_Input_Source(1);
W32_CACardParam(AD_SETHPFREQ,hpGrabFreq);
W32_Set_PAL_Range(1250,1024);//设置水平采集范围
W32_Set_VGA_Mode(1);
wGrabWinX1=0;//采集窗口的左上角的坐标
wGrabWinY1=0;
firstTime=TRUE;
bGrabMode=FRAME;
bZipMode=ZIPPLE;
/
lpDib=NULL;//存放获取的图像数据
}
CTestView::~CTestView()
{
W32_Close_MPE1000();//关闭采集卡
}
////显示采集的图象,双击鼠标采集停止
voidCTestView::OnGraboneframe()
{
//TODO:Addyourcommandhandlercodehere
wCurrent_Frame=1;
//设置采集目标为内存
W32_CACardParam(AD_SETGRABDEST,CA_GRABMEM);
//启动采集
if(lpDib!=NULL)
{
GlobalUnlock(hglbDIB);
GlobalFree(hglbDIB);
}
//分配内存
hglbDIB=GlobalAlloc(GHND,(DWORD)wImgWidth*(DWORD)wImgHeight);
lpDib=(BYTE*)GlobalLock(hglbDIB);
hdc=GetDC()->GetSafeHdc();
if(lpDib!=NULL)
{
cxDib=wImgWidth;
cyDib=wImgHeight;
SetLogicPal(hdc,cxDib,cyDib,8);
SetStretchBltMode(hdc,COLORONCOLOR);
bGrabMark=TRUE;
while(bGrabMark==TRUE)
{
if(msg.message==WM_LBUTTONDBLCLK)
bGrabMark=FALSE;
W32_ReadXMS2Buf(wCurrent_Frame,lpDib);
SetDIBitsToDevice(hdc,0,0,cxDib,cyDib,0,0,
0,cyDib,(LPSTR)lpDib,
bmi,
DIB_RGB_COLORS);
}
//停止采集
W32_CAStopCapture();
::ReleaseDC(GetSafeHwnd(),hdc);
return;
}
////将下面这个函数添加在视图类的CTestView::OnSize()函数中,就可以对系统的调色板进行设置。
voidWINAPIInitLogicPal(HDChdc,shortwidth,shortheight,WORDbitCount)
{
intj,i;
shortcxDib,cyDib;
LOGPALETTE*pLogPal;
j=256;
if((pLogPal=(LOGPALETTE*)malloc(sizeof(LOGPALETTE)+(j*sizeof(PALETTEENTRY))))==NULL)
return;
pLogPal->palVersion=0x300;
pLogPal->palNumEntries=j;
for(i=0;ipLogPal->palPalEntry[i].peRed=i;
pLogPal->palPalEntry[i].peGreen=i;
pLogPal->palPalEntry[i].peBlue=i;
pLogPal->palPalEntry[i].peFlags=0;
}
hPal=::CreatePalette(pLogPal);
deletepLogPal;
::SelectPalette(hdc,hPal,0);
::RealizePalette(hdc);
cxDib=width;cyDib=height;
if((bmi=(BITMAPINFO*)malloc(sizeof(BITMAPINFOHEADER)+j*sizeof(RGBQUAD)))==NULL)
return;
//bmi为全局变量,用于显示图像时用
bmi->bmiHeader.biSize=40;
bmi->bmiHeader.biWidth=cxDib;
bmi->bmiHeader.biHeight=cyDib;
bmi->bmiHeader.biPlanes=1;
bmi->bmiHeader.biBitCount=bitCount;
bmi->bmiHeader.biCompression=0;
bmi->bmiHeader.biSizeImage=0;
bmi->bmiHeader.biXPelsPerMeter=0;
bmi->bmiHeader.biYPelsPerMeter=0;
bmi->bmiHeader.biClrUsed=0;
bmi->bmiHeader.biClrImportant=0;
for(i=0;ibmi->bmiColors[i].rgbBlue=i;
bmi->bmiColors[i].rgbGreen=i;
bmi->bmiColors[i].rgbRed=i;
bmi->bmiColors[i].rgbReserved=0;
}
}
视频"画中画"技术
"画中画"这个概念类似与彩色电视机"画中画",就是在一幅大的图像内显示另外一幅内容不同的小的图像,小图像的尺寸大小一般地说为大图像尺寸的1/4或1/9,显示位置在大图像的右上角。这种技术不仅在电视技术中,在可视电话系统也可以发现这种技术的身影,它们都是依靠硬件来实现的,但是如何在VC开发平台上用编程语言来将该功能添加到自己开发的视频监控软件,为使用者提供更大的信息量呢?也许读者最容易想到的是首先显示大图像,然后再在一个固定位置画第二幅小图像,这种技术技术如果对于静止图像当然没有问题,但是对于视频流,由于每一秒钟需要画25幀,即25幅图像,这样一来计算机需要不停的画不停的擦除,会给用户以闪烁的感觉,如何解决这个问题呢?有的参考书上将大小图像分快显示,这种方法要将待显示的图像数据与显示位置的关系对应起来,容易出错不说,而且麻烦,且速度慢,为此,我对该方法进行了改进,得到了满意的效果。实现的代码如下:
voidpictureinpicture()
{
………………………..
CBitmapbitmap,*oldmap;
pData1=(BYTE*)newchar[biWidth*biHeight*3];//biWidth和biHeight为视频采集卡获取//的图像尺寸。
Read(pData1,bih.biWidth*bih.biHeight*3);//该函数从采集卡中获取数据
CClientDCdc(this);
m_pBMI1=newBITMAPINFO;//自定义的BMP文件信息结构,用于后面的图像显示
m_pBMI1->bmiHeader.biBitCount=24;
m_pBMI1->bmiHeader.biClrImportant=0;
m_pBMI1->bmiHeader.biClrUsed=0;
m_pBMI1->bmiHeader.biCompression=0;
m_pBMI1->bmiHeader.biHeight=biHeight;
m_pBMI1->bmiHeader.biPlanes=1;
m_pBMI1->bmiHeader.biSize=40;
m_pBMI1->bmiHeader.biSizeImage=WIDTHBYTES(biWidth*8)*biHeight*3;
m_pBMI1->bmiHeader.biWidth=biWidth;
m_pBMI1->bmiHeader.biXPelsPerMeter=0;
m_pBMI1->bmiHeader.biYPelsPerMeter=0;
////////////////////////////////////////////////////////////////////////
pData2=(BYTE*)newchar[biWidth1*biHeight1*3];//申请存放小图像的缓冲区
Read(pData2,biWidth1*biHeight1*3);////向该缓冲区读数据
m_pBMI2=newBITMAPINFO;
m_pBMI2->bmiHeader.biBitCount=24;
m_pBMI2->bmiHeader.biClrImportant=0;
m_pBMI2->bmiHeader.biClrUsed=0;
m_pBMI2->bmiHeader.biCompression=0;
m_pBMI2->bmiHeader.biHeight=biHeight1;
m_pBMI2->bmiHeader.biPlanes=1;
m_pBMI2->bmiHeader.biSize=40;
m_pBMI2->bmiHeader.biSizeImage=WIDTHBYTES(biWidth1*8)*biHeight1*3;
m_pBMI2->bmiHeader.biWidth=biWidth1;
m_pBMI2->bmiHeader.biXPelsPerMeter=0;
m_pBMI2->bmiHeader.biYPelsPerMeter=0;
//下面实现画中画的显示
CDCMemDc;
MemDc.CreateCompatibleDC(&dc);
bitmap.CreateCompatibleBitmap(&dc,biWidth,biHeight);
oldmap=MemDc.SelectObject(&bitmap);
::StretchDIBits(MemDc.m_hDC,0,0,biWidth,biHeight,0,0,—biWidth,biHeight,pData1,m_pBMI1,DIB_RGB_COLORS,SRCCOPY);//首先将大图像画在内寸上下文中
::StretchDIBits(MemDc.m_hDC,20,20,biWidth1,biHeight1,_
0,0,biWidth1,biHeight1,pData2,m_pBMI2,DIB_RGB_COLORS,SRCCOPY);//再将小图像画在内寸上下文中
::StretchBlt(dc.m_hDC,0,0,bih.biWidth,bih.biHeight,_
MemDc.m_hDC,0,0,bih.biWidth,bih.biHeight,SRCCOPY);//将结果显示在屏幕上。
MemDc.SelectObject(oldmap);
deletepData1;
deletem_pBMI1;
deletepData2;
篇2
1.1加强对Photoshop图像处理应用
案例分析总结就是一种间接的自我学习,通过案例分析总结可以让自己展开丰富的想象力,加强对Photoshop图像处理应用。这是一组人居环境适宜的景观设计效果处理前后变化展示,前一张图片是用3Dmax配合V-ray插件进行渲染的最终效果,为了进一步美化效果图,这是就需要Photoshop图像处理,结合中间这一张照片,采用图层处理、素材插入、调整图层、图层蒙版、创建亮度\对比度调整层等方式最终合成想要的效果。在案例分析过的成中,应注意多观察多总结多思考,设计最终效果的高低,一方面是和自己所拥有的知识水平有关,另一方面还和自己的审美能力高低有关,这就需要告诫我们平时多注意学习,学习不仅仅局限在书本上,还应该多参观欣赏较好的作品,从中得到审美能力的提高。
1.2模仿和创造相结合,提高Photoshop图像处理动手能力
模仿是人的本能天性,是人类进行各种学习活动的最基本方法。在平时的Photoshop图像处理模仿使用中,通常就是通过网上视频,如金鹰视频来自己分析Photoshop软件的各个功能。在视频观看的过程,可以根据视频中的实例操作,最终达到理解,这个过程就是模仿。例如:模仿给图片添加阴影效果,通常情况下,可以选择Photoshop菜单栏图层—图层样式—阴影就可以完成。而通过视频模仿,就可以快速的通过浮动图层菜单,选定此图片图层,并把鼠标快速放到缩略蓝色区域双击就可以打开图层样式浮动菜单完成阴影效果。在提高Photoshop图像处理动手能力上,还要发挥自己的创造能力。例如给此图片添加完阴影后,图层样式还有内外阴影、内外发光、光泽、斜面和浮雕、颜色叠加等方式,我们尝试可以根据图片实际情况试着添加,达到最佳效果。这里就需要发挥创造性对图片处理创新性在里面。
1.3结合科研项目,带动Photoshop图像处理实践能力
如在科研项目:西部山地型小城市人居环境问题及保护策略研究——以商洛市商州区为例上,需要收集大量的本地环境有关的图片素材并进行美化处理,这就可以亲自参与商州区大气质量恶化、丹江主要河流体固体废物污染、交通混乱等图片的处理,
1.4参与企业设计,增强Photoshop图像处理灵活性
参与企业设计,就是参与设计公司的工作。例如:在商洛市西街片区的旧城改造过程中,学生负责收集照片,并对旧城的原始照片进行处理规范化。
2小结
篇3
【关键词】图像处理 偏微分方程 模型构建 处理步骤
一、图像处理的基本方式
(一)信号分析处理
信号处理的方式是利用空间变化的思路,空间变换的方法就是从早期的频域变换发展而来形成了小波变换。小波变换在时域同时有良好的的局部分析特征,可以实现在多个尺寸上的多分辨特性。小波变换在图像压缩中获得了较好的效果。
(二)随机建模的处理
数字图像在形成的过程中有随机性,所以二维的图形实际是一个随机的场。所及建模的方式是按照随机场对图像域建模,以此描述图像域邻域像素的分布情况,从而完成对图形的描述。通常采用的随机建模方式有高斯混合模型等。随机场模型可以对图形的纹理进行细致描述。
(三)偏微分处理
偏微分方程是一种数学方式,对数字影像进行处理,利用空间域内的像素灰度值进行微分处理,利用二阶方程表征图形中区域边界的特征。微分方程具有各项异性的扩展特征,在不同的图像特征上显示的扩展性能也就不同,所以利用方程迭代处理图形可最大限度的保持边缘特征,同时获得重建的平滑区域。
二、偏微分方程和图像处理的应用
当前利用物理学和力学的变分和偏分方程方法的图像处理技术在计算机图形处理领域已经开辟了新的领域,基于偏分方程的图形处理方式已经获得了重视和良好的效果。其基本的思路就是在一个偏微分方程模型中发展一个图形,一条曲线、一个曲面等,利用求解这个偏微分方程来获得图形处理的期望值。变分和偏微分方程使得数字图像处理进入了一个新的领域。
(一)偏微分方程处理的主要领域
对图形进行去噪处理:图形去噪的典型分析与计算方法是高斯低通滤波器,也即是热扩散方程,因为高斯滤波器在去找的过程中不能保持良好的边缘特征,所以多数研究都是对该特征进行改进,其中较为有效的方式就是由Perona 和 Malik 提出的 P-M 方程,公式如下:
公式中,迭代步长dt,It是迭代项,ΔI则是拉普拉斯算子,c则代表传导系数。其中div是散度算子,代表梯度算子, Δ是拉普拉斯斯算子。在实际的应用中为了保证模型的收敛性,通常利用经验值,取迭代步长dt值为0.25。在此基础上,PDE去噪的基本思路如下:1)在图像相同质量特征的区域内进行减弱噪声扩散的处理;2)控制区域边界未知不扩散,并保持边缘的基本特征。因为P-M是一个病态问题,所以有研究提出对梯度值正则化处理,然后获得相对稳定的P-M方程。有人提出直接使用扩散张量作为扩散项,从而实现张量偏微分的方程模型。这个模型可以在一个方向上获得快速扩散,而在正交的另一个方向缓慢扩散,由此获得边缘去噪的效果。
图形的放大处理:对图像进行插值放大,获得超分辨率的分析。偏微分方程可以按照图像边缘、水平曲线等几何特征实现插值放大。所以偏微分方程可以最大限度的保持边缘的细节特征,同时可以减弱噪声的影响。在研究中提出基于偏微分方程拟合水平集曲线的图形像素重构。也就研究提出了一种复扩散偏微分方程被放大模式,在减弱锯齿效应的同时,可以锐化边缘的特征。
图形的分割处理:图形的分割也是图像处理的重要内容,计算机和图像处理按照使用的图像特征进行分类处理,可以分为基于边界的分割、基于区域的方法,以及混合分割的方法。如按照使用数学工具和模型,其主要的方法有:基于聚类的方法;基于统计学的方法;基于数学形态的方法;基于偏微分方程的方法,主要有蛇形模型等;基于Graph cut的方法。
(二)图像处理的偏微分模型
在图形处理中,偏微分方程模式有很多种,其中一种是在变分原理的基础上对函数进行优化,这个方式首先对一个特定的图形处理模式,通过变分原理实现对能量函数模型的优化,这样就可得到偏微分方程,通过对偏微分方程数值求解由此完成图形的处理任务。如:整体变分能量泛函
利用此模式就可完成对函数的优化。
三、基于偏微分方程的图形处理的步骤
作为图像处理的一个重要工具,在变分和偏微分方程的图像处理的基本框架和基本步骤如下:1)明确实际问题的出现和处理思路建立,因为不同的应用问题有不同的处理思路和特征,因此采用的处理方式也就不同,所以在处理图像问题时应先掌握问题的关键。2)构建相关数学模型,这一步骤是处理图像的重要步骤,其影响的是处理的过程和结果,数学模型构建将直接影响处理的效果,对微分方程、变分方法、微分几何等进行合理选择与组合,以此获得较好的处理结果,提高处理的有效性。3)模型分析:主要是对模型的适应性进行分析,了解模型解是否存在、解是否唯一、方法是否稳定等,4)分析计算:利用数学模式进行求解,进行微分方程的数值分析,利用有限差分、有限元、迭代法等进行计算,这一步骤会影响相关数学求解的收敛性、稳定性、计算量等。5)程序实现:这个步骤是解决问题的最终步骤,这一步骤的一些问题可以导致前面工作的重新修改,必须慎重操作。
四、结束语
偏微分方程是一种高效的数学处理工具,在图像处理中也获得了较好的效果。连续区域上建立模型,方便对实际问题的处理和数值计算。数学上丰富的偏微分方程处理理论和计算方式,对图形处理的理论分析和算法都给予了较大的帮助,同时不断完善的计算和处理方式将帮助偏微分方程提高图像处理的效果。
参考文献:
[1]李艳霞.基于变分偏微分方程的图像分解研究与应用[D].中国海洋大学学位论文,2009.
篇4
关键词:PBL模式 数字图像处理 实践教学
中图分类号:TP399 文献标识码:A 文章编号:1007-9416(2013)03-0242-01
在高校教学体系中,数字图像处理成为了包括理工科、农医科在内专业必选课程或者重点选修课程。作为一门理论知识丰富、实践性非常强的高校课程,当前PBL模式已经成为了包括美国在内的多个国家的主要教学模式。
1 PBL模式与数字图像处理结合探索背景
PBL模式作为一种较为先进的教学模式,英文名称Problem-Based Learning,其含义为问题式教学模式或者基于问题的学习模式,PBL模式的主要思路是以问题为前提进行教学的展开活动,这一教学方法的特点在于在教师的直接参与和指导之下,将学生放在主体地位,通过小组讨论的方式,通过以某一具体问题为中心的研究讨论和加强学习的过程,将教学的焦点放在某学科的重要原理以及关键概念之上,通过帮助学生自己构建知识体系的过程,养成学习独立学习、独立思考的基本能力,数字图像处理具有其本身独特的特色。
其一,该门课程的理论知识丰富,知识点较为深奥难懂[1];其二,日常生活中,应用到的数字图像处理相关课程知识点较多,对学生综合能力要求较高,尤其在工科专业的基础知识学习中要求较高,需要对计算机、数学等学科知识进行综合运用,例如,湖南省某学院部分专业在开设这门课程时,每一学期的课时量为30至40课时,该学院部分立刻专业设置了选修课程的的课时量。依靠传统的教学模式进行数字图像处理已经不适宜当前的教学实际,须对高校包括机械制造专业、自动化等专业的数字图像处理能力进行要求,才能全面提升学生的综合能力。
2 基于PBL模式的实践教学改革方案探索
2.1 对数字图像处理实践教学方式方法的研究
以上述湖南某城市学院为例,为推进数字图像处理的PBL模式改革,该校自行编撰了验证性课程指导实践用书,该书的主要内容包括了30多个实践项目,涵盖了图像分析、图像滤波、数字处理软件的使用以及图像分割等多个板块知识点,该学院学生中计算机普及程度广,所以在进行图像处理实践时可自行下载相关的支持软件。改变以往该课程集中实践方式,升级成分散与集中结合的模式,即第一步学生利用业余时间或者在专门实验室内完成数字图像处理分散实验,第二步教师对学生教学实践中产生的问题进行一对一面谈解决或者利用网络通讯工具解决问题,第三步,通过多次的分散式课程实践活动,利用4个至6个课时进行集中式教学。
2.2 突破数字图像处理理论教学模式
其一,确保在对数字图像处理完整性以及整体性进行维护前提下,在实践教学课堂中尽量避免对数字处理相关公式的重复推导[2],主要对相关算法以及关键原理进行说明,如在对均衡处理数字图像知识点进行讲解过程中,直接引用推导公式,利用均衡化图像的原理以及关键算法进行处理技术的编程;其二,在对相关的信息进行筛选之后重点对处理图像的算法进行编程和实践应用,在对图像处理边缘检测知识进行运用过程中,可以将Hough的变换、路经检测加强联系,更好进行编程;其三,在解决实践问题的过程中,多进行实例的例举,可利用2至3个课时对实践教学的背景、已有的实践教学成果的、重要技术流程、重要算法进行演示等。
3 基于PBL模式的数字图像处理教学方案设计
仍以湖南某城市学院信息学院为例,从PBL模式出发,针对于数字图像处理建立了处理库,这一项目中涵盖处理图像、分析图像、识别图像等多类别项目,例如“门禁系统视觉识别系统”、“指纹识别”、“二维码检测”等,学院每学期建立了不低于36个的项目,学生可在这些项目中进行选修,另外,以40个课时为标准,数字图形处理理论课程教学学时为30个,实践性教学课时为10个,每周保证3个学时,总共教学时长为13个教学周。
第一,在进行教学的前两个周内,将数字图像处理课程PBL模式实践考察和教学方式进行明确和推介,并将以往的学生实践教学成果进行分享,为学生在选修过程中提供参考,学生进行是否选修的决策;第二,在3至4周,拟定学生课程选修名单,进行实践性教学任务的布置,确定36个以上的实践项目给学生,学生自动组成项目合作,保持每组在3个人左右,学生自行数字图像处理选择题目,对实践项目进行图像加文字型的介绍,尽快确定目标,尽快对实践应用难度进行确定以及评分;第三,在5至6周的时候确定数字图像处理实践目标书,确定相关参考资料;第四,在7周至12周时间内实施实践项目,学生利用课余时间完成分散型实验,这段时间内适当安排集中型实验,对实践项目进行验证,在这一过程中,特别注意积极提出实践项目存在的问题,及时检查问题解决的进度,教师有针对地进行问题解答,帮助实践小组完成任务目标;第五,在第13周时,组成专业或者班级为小组的实践项目答辩,实践项目的成果进行答辩与说明;最后,数字图像处理课程教师完成总结,学生对实践项目进行报告,教师根据实际情况对学生进行打分。
4 结语
基于PBL模式的数字图像处理的教学形式,能帮助高校学生快速了解和吸收处理数字化图像过程中必要的技术、方法与原理等知识点[3],还能帮助学生掌握数字图像处理实践项目的实践研究方法和思路,提升学生利用图像处理的基础知识灵活解决生活实际问题能力,提升学生的学习积极性以及创新、实践能力,对于全面提升数字图像处理相关课程的教学质量具有重要作用。
参考文献
[1]何林锦,翟云波,李彩亭.项目式实验教学模式及其可行性评价方法[J].实验室研究与探索,2010,29(2):94-96.
篇5
论文摘要:针对硕士研究生在学习“数字图像处理与模式识别”课程中面临的理论与实际脱节、书本知识陈旧和教学手段单一等问题,本文从教材选择、讲授内容和手段、讲授形式和考核方法等方面进行了教学改革的探讨,通过在教学活动中不断实践探索,使学生在学习中不仅学到了丰富的理论知识,而且通过开放的实验环节找到理论应用到实际之中的关键所在,同时带领学生放眼于本领域的热点技术,激发了大家的研究兴趣。本课题已获得“211工程”三期的资助。
1 绪论
学生刚从本科阶段走入研究生阶段,都怀着极大的热情要投身于科学研究中,他们需要通过更多更专业的课程来夯实自身的理论基础,以便使他们能够在科学研究工作中充分发挥自身才华,所以研究生阶段的文化课程具有更强的针对性和实用性。可反观研究生课程现状,选用的教材往往是五年甚至十年之前出版的,其内容已非常陈旧,与信息时代的要求相差甚远;学生反映学到的知识不知如何在实际科研中应用,不了解本领域最新发展方向,学习过程单调枯燥,没有达到研究生课程应有的效果。针对这些问题,作者在多年的教学过程中不断总结原因,不断进行教学改革探索,并在国家“211工程”资助下,开展了研究生“数字图像处理与模式识别”课程的教学改革课题研究。
2 教学改革内容
“数字图像处理与模式识别”课程面对的授课对象包括电子、自动化、计算机、光电、机械、车辆等各个专业的硕士研究生,他们在各自的研究领域都将面临图像处理及识别的实际问题,为了培养学生掌握该领域的基础知识,并能迅速地在研究工作中发挥作用,必须学习本课程,并能灵活应用到各自的研究工作中。本课程从数字图像处理技术的整体知识框架出发,对图像进行一系列处理技术的讨论,经过参数分析与模式识别,使数字图像处理与模式识别技术融为一体,为各个应用领域的理论研究和实际应用奠定基础。
2.1为学生量身打造教材
目前图像处理领域发展非常迅速:3D图像处理技术、3G可视化图像通信技术、高速公路不停车收费技术等都在日常生活中得到广泛的应用,可研究生教材中涉及的教学内容还停留在上世纪90年代的水平,远远不能满足当今社会的需求。为此,作者所在的课题组三位老师撰写的国家“十一五”规划教材《数字图像处理及模式识别(第二版)》,教材更新了一些经典算法,同时根据我们课题组近年在图像处理领域的最新科研成果,将新算法新技术融合到教材当中,使学生能够接触到本领域的前沿技术。另外作为教材的最后一章,作者将一个实际科研项目作为典型实例编入教材中,向学生展示了如何把教材中涉及的理论方法应用到实际工程之中。通过学习本教材,既可掌握经典的图像处理算法,又接触到目前比较先进的图像处理算法,同时又可根据教材提供的很多应用实例和算法源代码,促进学生掌握理论知识与实际问题的结合方法,尽快地运用学到的理论知识进行创新性科学研究。该教材也于2008年获得北京市高等学校精品教材称号。
另外教材附带了一套自主开发的实验软件系统,为学生提供实验平台,包含六个实验:图像的二维傅里叶变换及性质、图像的编码、图像的参数分析、图像的平滑与锐化、图像的运动模糊及去模糊、图像的匹配识别。该软件界面友好,通用性强,结构开放,可二次开发,可以激发学生在完成实验的基础上积极动脑去完善现有实验,开发新的实验。
2.2改进授课内容
根据研究生的特点,课堂上除了讲授基础的理论知识以外,主要针对当前比较热门和先进的数字图像处理方法,以及学生们比较感兴趣的知识点,以专题研讨的形式进行研究和讨论。例如针对预防犯罪分子进行犯罪活动方面,可以通过人脸识别的方法在可视频监控的区域进行自动人脸特征提取,并用犯罪分子图库进行比对。大家对这个技术很感兴趣,对技术细节进行了热烈的讨论,各抒己见,通过这种专题讨论,活跃了课堂气氛,增加了学生主动参与的机会,激发了学生的学习热情和创造灵感。
同时教学中注重设计了一些新颖的课题,留给学生课后思考、调研,课上教师与学生进行研究和讨论,增强教与学的双向互动和交流,避免被动式灌输知识,激发学生的学习积极性、主动性和创造性。
结合实际科研成果,将一些数字图像处理系统的实例引入教学。例如将嵌入式多通道数字图像采集处理系统作为例子,讲解系统实现的原理、图像处理算法的应用及编程实现过程等等,这样既避免了抽象知识的讲授,又满足了学生对数字图像处理系统的软、硬件平台设计方法的掌握,真正达到学以致用。 2.3讲授手段综合应用
除了常规的教学手段以外,更多地应用现代多媒体技术来授课,包括展示图片、播放视频。恰巧多媒体教学技术本身就是多种数字图像处理技术的一个综合应用,所以利用多媒体教学技术来讲课就是本门课程涉及的各种技术在实际生产生活中的一个很好的应用实例。目前教学主要采用课堂讲授,电子课件与板书相结合,课内实验与课外实验相辅助,摒弃灌输式教学方法,倡导启发式教育,讲授课本知识的同时注意拓宽学生知识面,加强学生创新能力的培养,使学生的理论基础和实践应用能力同步得到提高,取得了较好的教学效果,几位教师的学生评价结果皆为优秀。
通过搭建一些算法平台,给学生提供可选择、有侧重、可设计的实验环境,弥补本课程没有专门实验的缺点,通过这些平台可以开启学生的创新研究和实践欲望。实践环节提供自主开发的图像采集与跟踪系统软硬件实验,学生可自己对实验进行设计并实时验证,另外提供一些比较新颖的实验题目供学生选做,在学习同时通过实验加深对知识的理解和掌握。同时将相关课件、资料等放置到网络,供学生访问下载,并提供Email信箱与学生答疑和沟通。
2.4讲授人员因需而变
除了授课教师外,根据当前研究热点和学生感兴趣的方向,邀请具有专门科研经验和知识的博士生,以研讨的形式进行某个知识点的讨论,以拓展学生的知识面,实现宽泛的知识教育,同时使学生了解最前沿的学科方向。
2008年邀请了张健博士做了“H.264转换编码研究与改进”的专题讲座;2009年邀请了姜薇博士做了“人脸识别算法研究”专题讲座。通过博士生的讲座,大家了解了研究生阶段的科研工作,极大带动了学生的求知欲,课堂讨论热烈,很多同学与两位博士课下进行了多次交流,为他们在学术上起到启迪作用。同时,大胆地邀请了一名同年级的硕士生站到讲台上,就“基于四元数FFT的水印嵌入算法”进行了专题讨论,面对这个全新的领域,很多同学被深深震撼了,同时感到了压力和差距,触动学生从主观意识上对本门课产生兴趣,掀起理论课程联系实际项目的学习热潮。
2.5教学思想的讨论与转变
研究生教学的目的不是要学生只掌握书本的知识,也不是必须进行卷面考核。特别是本门课程的实践性很强,所以本课程通过提供几个具有综合性、设计性的命题,结合我们提供的一些平台,让学生自己完成方案设计、命题的实现,更鼓励同学自己提出命题来进行研究实现,以期使学生真正融会贯通本门课程的思想精髓,更好地解决理论知识和科研能力的衔接,也真正实现本门课程的以素质为基础、知识为手段、实践为中介、能力为目标的教学宗旨。
3 教学改革总结
由于本课题组教师在“数字图像处理与模式识别”这门课中一直贯穿着先进的教育理念,得到了全校学生的认可,教学效果良好,2010年听课人数达到了169人,并有不同专业的多名博士生进行了旁听。
经过了几位教师的努力,本门课的教学改革已见成效,使“教”与“学”达到了有机的平衡和统一,教师知道学生想学什么,学生知道理论知识如何应用,真正达到学以致用,并会在实际科研工作中总结问题,运用理论知识来解决实际问题,也达到了研究生教学改革的目的。
参考文献:
[1]冈萨雷斯.数字图像处理[M].第2版.北京:电子工业出版社,1998.
篇6
关键词:神经网络 图像处理 机器人 草莓
中图分类号:TP301.6 文献标识码:A 文章编号:1007-9416(2012)07-0091-02
国内外对图像处理技术和神经网络理论在果蔬商品化应用中的部分成果已进入了实用阶段。随着计算机科学的飞速发展和在许多领域中的成功应用,果蔬采收分级的实时自动化已经变得完全可能。但是,生物特征的多变性和随机性与工业产品有着很大区别。在草莓采收、分级这一过程中,为了提高检测的精度、速度和准确性,需要解决多种技术问题,如:光源的选择和设置;图像的采集方式和图像的质量;硬件处理速度;模式识别算法;要求有更多分级算法的训练样本等。从长远看,应该对拣选对象的形状、表面、光学、热学、化学、生物学等各方面的特征和生理机能进行更加深入的研究,这样才有利于检测技术改进,促使新的信息采集技术和传感技术的产生。
草莓是一种营养丰富的高级水果,随着人们生活水平的提高,草莓按其颜色、形状及大小进行拣选分类、包装将成为趋势。因此,草莓形状的判别的研究和草莓拣选设备的开发具有很重要的现实意义。
1、草莓形状的判别
收割后的草莓按其颜色、大小、形状均可分为不同的等级。因此,草莓形状的判断是拣选者根据对标准草莓规格的理解和经验来判断出结果。本设计中草莓形状的识别部分采用了神经网络的识别技术,神经网络具有学习功能和很强的模式识别能力,即使当局部网络受损时,仍然能够恢复原来信息。神经网络的信息分布式存储于联结权值系数中,使网络具有很高的容错性,而图像识别中往往存在噪声干扰或输入图像的部分损失,因此,神经网络可以很好地解决图像识别问题。另外,神经网络的自组织和自学习功能,使其对图像问题的识别和处理较传统图象识别方法显示出极大的优越性。因此,草莓拣选设备只要通过对标准形状草莓的学习就可得到非常接近人的判别效果。
为此,本论文提出了一种新的算法来解决草莓拣选的问题,该算法是基于图像处理技术、神经网络算法而生成的一种草莓形状判别算法。并利用该算法开发了草莓拣选设备。
2、草莓拣选设备的构成
草莓拣选设备硬件系统组成如图1所示。CCD摄像机将所要识别、解释的对象以图像的形式记录下来;插入计算机内部的图像采集卡可以将摄像机采集的电信号转变为数字信号,即图像数字化,以便计算机对其进行各种必要的处理;照明装置为图像采集提供合适的光源,以便对图像进行处理和分析。
3、草莓形状图像分割及特征提取
人工拣选草莓时很容易根据草莓果实部分的形状特征来判别其等级,但对草莓拣选设备来说,草莓是任意放置在传送带上的,计算机采集到的草莓图像其方位是不确定的。因此,本设计采用了彩色图像处理技术。图2中,(a)图是图像卡采集到的草莓图像信号以RGB彩色模型显示在监视器上。它的R辉度图像如图(b)所示。想要得到草莓的形状特征图像,就要对采集到的草莓彩色图像做以下处理:
第一步:把彩色图像转换成黑白的二值图像,经过滤波、填充、提取边缘信号等处理后,最终得到整体轮廓线图像(c);
第二步:彩色图像减去R辉度图像产生目标图像(d);
第三步:目标图像经二值和边缘提取处理后,得到了果实轮廓线图像,如(e)所示;
第四步:最后把整体图像轮廓线图像和果实轮廓线图像这两种图像进行逻辑运算,然后得到曲线型草莓形状特征图像,如(f)所示。
4、基于神经网络的判别
得到的草莓形状特征可以用一组八参数来表示,要划分A、B、C等级就需要控制两个空气驱动器。我们建立的人工神经网络是基于BP算法的前向三层神经网络,如图3所示。选用了两个结构简单的BP网络,输入为8,正好每个参数对应一个输入端单元;输出为2,每个输出单元控制一个空气驱动器。在进行前向多层神经网络的学习时,不断调整隐层节点数,经过试验,采用8-4-2结构。
5、软件程序的功能
判别草莓形状的系统软件程序是实现草莓的拣选功能的关键。系统软件在功能上划分为训练部分和判断部分。训练部分包括图像处理、特征提取和网络训练;判断部分包括图像处理、特征的提取和判断以及草莓的移动控制。系统程序用MicrosoftC语言编写,程序流程图如图4所示。
6、结语
本文通过计算机图形处理技术、模式识别等理论的研究,结合神经网络算法进行了草莓形状判别的设计,在草莓形状的有效特征提取和分类识别方面进行了理论上的研究,提出了基于前向三层神经网络和计算机图像处理的一种能对草莓形状进行自动判别的新方法,为草莓的拣选机器人的开发提供了理论基础。草莓拣选设备乃至其他水果拣选设备的开发对将要进入老龄化社会的我国来说是很有意义的。
参考文献
[1]王耀南,李树涛,毛建旭.计算机图像处理与识别技术[M].北京:高等教育出版社,2001.237~260
[2]曹其新,吕恬生,永田雅辉等.草莓拣选机器人的开发[J].上海交通大学学报,1999,33(7):880~884.
[3]王年,任彬,黄勇等.基于神经网络的汽车车型图象自动识别[J].中国图象图形学报1999,4(8):669~672.
[4]福利(Foley,J.D.)等著.计算机图形学原理及实践C语言描述[M].北京:机械工业出版社,2002.6~36.
[5]徐丽娜.神经网络控制[M].哈尔滨:哈尔滨工业出版社,1999.4~34.
[6]田村秀行编著,金喜子,乔双译.计算机图像处理[M].北京科学出版社,2004.86~115.
篇7
关键词:小波变换,可操纵金字塔,滤波器,纹理
0.引言:纹理特征是图像的基本特征之一,是一种全局特征,它描述了图像或者图像区域所对应的景物的表面性质。包括表面结构组织及其与周围环境关系的许多重要信息,纹理特征是一种统计特征,具有旋转不变性,并具有较强的抗噪音能力,它被广泛应用于图像识别以及图像检索技术中。图像的纹理特征的提取及其分析方法的采用对识别及其检索的准确率具有很大的影响。小波变换和可操纵金字塔被广泛应用于图像处理问题中,比如图像的融合,图像分割,图像增强,边缘检测等,小波变换和可操纵金字塔同样可应用于图像的纹理特征分析。
1.图像纹理特征
纹理特征是图像的基本特征之一,是一种全局特征,它描述了图像或者图像区域所对应的景物的表面性质。通常图像纹理特征可用这些参数表征:能量、信息熵、梯度、尺度共生距、峰值、不变性。
2.小波变换与可操纵金字塔
篇8
关键词:PCB;图像处理;视觉检测
中图分类号:TP277文献标识码:A文章编号:1009-3044(2012)07-1648-06
当今世界科技发展日新月异,电子产业的发展直接制约着国民经济的腾飞与否,而PCB电路板制作工艺的提高对促进电子产业的发展至关重要,能否有效精确地检测PCB电路板的缺陷一直都是电子行业的研究热点。国外的印刷电路板自动检测技术一直领先于国内,国内的很多厂家不得不采用昂贵的外国技术,虽然近年国内的印刷电路板自动检测技术发展迅速,但大都没有取得令人非常满意的结果。加入研究这一领域的热潮,赶超外国的先进技技水平,打断外国垄断技术,对于发展国民经济具有十分重要的意义。
1 PCB检测系统的硬件设计
1.1 PCB检测系统的硬件组成框图
虽然本文所做的工作主要是软件方面,但对于硬件系统的设计也是至关重要的,它对于建立有效的计算机视觉识别检测系统,起着决定性作用。因此,必须在综合考虑系统性价比和系统性能的基础上,设计出合理的硬件系统[9]。PCB检测系统的硬件组成框图如图1所示:图1 PCB检测系统硬件组成框图
1.2系统的硬件组成
系统的硬件组成[10]主要包括:计算机主机、CCD摄像机、图像采集卡、照明系统及相关的设备。
2 PCB电路板缺陷检测识别
PCB电路板在电子工业中的应用越来越广泛,如何降低电路板的故障率、提高电路板的质量直接影响到整个产业的发展。因此,对于PCB电路板缺陷的识别技术的发展至关重要。PCB电路板的缺陷很多[16],主要有短路、断路、划痕、凸起、空洞、缺焊、过焊等等,由于实验室设备限制和个人水平所限,本文主要研究的内容是PCB电路板短路与断路的检测识别
近年来出现了很多图像检测算法,这些算法大致可分为三大类:有参考算法、无参考算法以及混合型算法。有参考算法分为两大类:图像对比法和模型对比法。无参考算法是一种不需要标准图像的检测算法,它是基于一定的设计规则来进行检测的。混合型方法是将有参考算法与无参考算法混合使用,从而发挥出各自的优点。比如,模板匹配法与数学形态学方法结合使用,或者连接表方法与数学形态学方法结合使用等。本文中短路与断路的检测识别采取了图像对比法,即将经过一定处理后的图像进行相减,从而分析相应的结果;而对焊点缺陷的识别主要采用模板匹配法与数学形态学方法结合使用。
2.1 PCB电路板缺陷检测识别的主要流程图
图2为子程序流程图;图3为主程序流程图。
2.2 PCB电路板短路与断路的检测识别
2.2.1边缘检测
在对图像进行基本的处理过后可以将图像与背景分割开来。边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点。图像属性中的显著变化通常反映了属性的重要事件和变化。
这些包括:深度上的不连续;表面方向不连续;物质属性变化;场景照明变化。边缘检测是图像处理和计算机视觉中,尤其是特征提取中的一个研究领域。
图像边缘检测大幅度地减少了数据量,并且剔除了可以认为不相关的信息,保留了图像重要的结构属性。有许多方法用于边缘检测,它们的绝大部分可以划分为两类[17]:基于查找一类和基于零穿越的一类。基于查找的方法通过寻找图像一阶导数中的最大和最小值来检测边界,通常是将边界定位在梯度最大的方向。基于零穿越的方法通过寻找图像二阶导数零穿越来寻找边界,通常是Laplacian过零点或者非线性差分表示的过零点。
1)Roberts算子
边缘,是指周围像素灰度有阶跃变化或屋顶等变化的那些像素的集合。图像的边缘对应着图像灰度的不连续性。显然图像的边缘很少是从一个灰度跳到另一个灰度这样的理想状况。真实图像的边缘通常都具有有限的宽度呈现出陡峭的斜坡状。边缘的锐利程度由图像灰度的梯度决定。梯度是一个向量,?f指出灰度变化的最快的方向和数量,如式2-1所示。
?f=(决定的。
因此最简单的边缘检测算子是用图像的垂直和水平差分来逼近梯度算子,式2-4所示。?f=(f(x,y)-f(x-1,y),f(x,y)-f(x,y-1))(式2-4)
因此当我们想寻找边缘的时候,最简单的方法是对每一个像素计算出(2,4)的向量,然后求出他的绝对值,然后进行阀值操作就可以了。利用这种思想就得到了Roberts算子,由式2-5所示。
R(i,j)=
(式2-5)
它是一个两个2×2模板作用的结果。
2)Sobel算子
该算法通过2个3*3的模板,对选定的二维图像中同样大小窗口进行卷积,通常是一个模板对一个边缘响应大,另一个模板对水平边缘响应大,两个卷积值对最大值作为该点对输出。对于图像上的任意点(i,j)进行卷积,可得其X方向上的差分由式2-6、式2-7所示。Δx=f(i-1,j+1)+2f(i,j+1)+f(i+1,j+1)-[f(i-1,j-1)+2f(i,j-1)+f(i+1,j-1)](式2-6)Δy=f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1)-[f(i+1,j+1)+2f(i+1,j)+f(i+1,j+1)](式2-7)则输出图像公式如式2-8所示。
用sobel算子检测阶跃边缘得到的边缘宽度至少为两个宽度。3)Laplacian边缘检测算子
Laplacian算子定义由式2-9所示。
Δ2f(x,y)=
(式2-9)它的差分形式由式2-10所示。
Δ2f(x,y)={[f(x+1,y)-f(x,y)]-[f(x,y)-f(x-1,y)]}+{[f(x,y+1)-f(x,y)]-[f(x,y)-f(x,y-1)]}
=f(x+1,y)+f(x-1,y)+f(x,y-1)+f(x,y+1)+f(x,y+1)+4f(x+1,y)(式2-10)
Laplacian算子是一种各向同性算子,在只关心边缘的位置而不考虑其周围的灰度象素差值时时比较合适,Laplacian算子对孤立象素的响应要比对边缘或线的响应更要强烈,因此只适用于无噪声图像。
原图像与用三种边缘检测算子处理后的图像如下所示:图6 Sobel边缘检测图7 Laplacian边缘检测
从上面四幅图分析比较可得出结论:用Roberts边缘检测得出的图像较之其他方法更为清晰,噪点更少,图像更为连续,所以本文中采用Roberts算子来进行边缘检测。
2.2.2阈值分割
阈值分割法是一种基于区域的图像分割技术,其基本原理是:通过设定不同的特征阈值,把图像象素点分为若干类。常用的特征包括:直接来自原始图像的灰度或彩色特征;由原始灰度或彩色值变换得到的特征。设原始图像为f(x,y),按照一定的准则f(x,y)中找到特征值T,将图像分割为两个部分,分割后的图像为:
若取:b0=0(黑),b1=1(白),即为我们通常所说的图像二值化。
在数字化的图像数据中,无用的背景数据和对象物的数据经常放在一起,同时,图像中还含有各种噪声,因此可以根据图像的统计性质,从概率的角度来选择合适的阈值。
1)最大方差阈值法
把待处理图像的直方图在某一阈值处分割为两组,当被分割成的两组间的方差最大时,便可以决定阈值了。
设灰度图像f(x,y)的灰度级为0-L,灰度级I的像素为Ni,则图中:
总象素数N=∑j=0 i=LNi(式2-11)灰度级i出现的概率Pi= 1-ω(K)(式2-16)则两组间的数学期望为ω0μ0ω1μ1=μ(式2-17)两组间的方差为ρ2(k)
ρ2(k)是K的函数,计算k取从0,1,2…L时ρ2(k)的值,当多的值为最大时,K即为阈值。
2)双峰法
根据图像的直方图具有背景和对象物的两个峰,分割两个区域的阈值由两个峰值之间的谷所对应的灰度值决定。设灰度图像f(x,y)的灰度级为0-L,灰度i的像素为Pi,分别计算
因为实际PCB电路板有着许多的划痕、污点等,使用最大方差阈值法时,会在处理后的图像上产生许多误点,而影响实际结果的分析,而双峰法能够顺利地滤除这些干扰,这个结论在分析对比以上图像时也可得出。所以本文选用了双峰法来进行阈值分割。
2.2.3粒子分析与图像对比
经过边缘检测和阈值分割的图像中会存在许多瑕点,这些点会影响到最后的图像识别与分析,有可能会增加多余的残留图像。本文中利用NI VISION ASSISTANT中的REMOVE SMALL OBJECTS功能进行去除,如图11和图12所示。图11原图像图12粒子分析
将标准PCB图片减去缺陷缺陷PCB图片,便可以得到缺陷板的断路部分的图像,再利用NI ASSISTANT中的PARTICLE ANALYSIS可以得到断路部分的具体分析,如图13示。
将缺陷PCB图片减去标准PCB图片,便可以得到缺陷板的短路部分的图像,与上述相同的方法,便可以得到短路部分的具体分析,如图14所示。
3结束语
利用LABVIEW来进行PCB电路板缺陷的识别与检测是一项非常好的课题,它在近些年已经得到了一定的发展,并将得到更大的进步。限于本人能力和时间,本文的研究还未涉及很深的领域,可以在以下方面加以改进:
1)本文中只利用到NI公司的LABVIEW和IMAQ VISION,更好的设计可以再利用其他语言如VISUAL BASIC,C++等编程语言加以辅助设计,相信可以取得更加令人满意的结果。
2)由于实验设备等其他因素,本文中只重点研究了PCB电路板短路与断路的检测识别,PCB电路板的其他缺陷还有待于进一步的分析研究、分类和总结,并设计出更好的检测方法,以真正满足PCB电路板检测的需求。
3)照明设备的限制在很大程度上影响到了图像的检测效果,为取得PCB缺陷检测的进一步进展,在照明设备的选择上必须重视,并且设计出更好的图像采集系统。
4)在识别与检测手段上,可以引入更新更好的方法,而不要局限于在传统的方法中分析比较,例如基于BP神经网络的识别检测,图像的模糊决策等将有待于进一步研究。
总之,基于LABVIEW的机器视觉检测系统已经取得了不错的进展,高速发展的PCB制造技术和计算机技术对于PCB缺陷的检测提出了更高的要求,同时也大大地促进了PCB缺陷检测技术的发展。利用机器视觉检测在未来的较长的一段时间内将占据检测行业的半壁江山,相信在未来会取得更大的发展。
参考文献:
[1]程学庆,房晓溪.LabVIEW图形化编程与实例应用[M].北京:中国铁道出版社,2005.
[2]胡仲波.基于虚拟仪器技术的PCB视觉检测系统[D].南京:南京理工大学硕士学位论文,2006.
[3]段峰,王耀南.机器视觉技术及其应用综述[J].自动化博览,2002,19(3).
[4]周长发.精通Visual C++图像处理编程[M].北京:电子工业出版社,2004.
[5]陈锡辉,张银鸿.LabVIEW 8.20程序设计从入门到精通[M].北京:清华大学出版社,2007.
[6]郑伟.图像法检测印刷电路板缺陷[M].西安:西安理工大学,2002.
[7] National Instruments,IMAQ User Manual Concepts[Z].1999.
[8]李强.PCB板缺陷自动检测技术的分析研究[D].合肥:合肥工业大学,2002.
[9]傅茂名.基于形态边缘检测算法的一种改进[J].电子科技大学学报,2005(2).
[10]王思华.计算机视觉新技术及其在IC标记质量检验系统设计中的应用[J].电子技术应用,2000(9).
[11]岳永哲.图像处理技术在阅卷系统中的应用[D].北京:北京工业大学,2006.
[12] Bruce sehneier.Applied Cryptography protocols,Algorithms,and SourceCode[M].C Jolm Wiley & Sons,Inc,1994.
[13] William work Security Essentials:Applications and Standard[M].Prentice Hall/Pearson,2002.
[14]高育鹏,杨俊,何广军.基于图像识别的自动阅卷系统研究[J].现代电子期刊,2006(22).
[15]杨青燕,彭延军.基于灰度图像的答题卡识别技术[J].山东科技大学学报:自然科学版,2009(3).
[16]周海涛,韩晓军.基于数字图像处理的答题卡识别方法研究[J].电脑知识与技术,2008(28).
[17]周万珍,郑广,王建霞,等.数字图像处理技术在客观题阅卷中的应用[J].数学的实践与认识,2006(8).
[18]王胜春.基于SVM的信息卡识别系统[D].长沙:湖南师范大学,2008.
[19]吴志明.SMT系统中焊点位置的检测[D].哈尔滨:哈尔滨工业大学,2006.
[20]杨敏,王春青,邹增大,等.表面组装印刷电路板上焊点信息的自动获取[J].焊接学报,2005,39(6).
篇9
【摘 要】目前中学物理教学与实验一般只涉及两小球在直线上的碰撞,二维碰撞运动是新内容。笔者运用文献研究法和实验方法,分别利用数码相机的“连拍合成技术”“高速连拍技术”和“摄像技术”对两球斜碰过程进行图形获取、图像处理、数据分析,分析总结得出尽量减小验证二维动量守恒实验误差的技术方法,以便增强课程的科学性、可操作性与趣味性,进而提升学生的探究能力。
关键词 视频分析法;数码相机;二维动量守恒;拍摄技术;误差
【中图分类号】G434 【文献标识码】B
【论文编号】1671-7384(2015)01-0073-03
在人教版高中物理选修3-5《动量守恒定律》一章中,教师用滑块在气垫导轨上的直线运动演示“验证动量守恒定律”的实验,这个实验研究的是一维碰撞动量守恒,但实际生活中更多的是二维或是三维的斜碰,如台球的碰撞、保龄球的碰撞、微观粒子的碰撞和天体的碰撞等[1]。二维或三维运动是大学物理实验教学中的重要内容[2],在现有的普通物理实验教学中,一般只涉及两小球在直线上的碰撞,二维碰撞运动是新内容。
利用视频分析法探究小球“二维碰撞动量守恒”既有利于学生对动量守恒物理知识的完整理解,又有利于学生掌握利用多媒体技术及基本的数字化研究方法。本论文分别利用 “连拍合成技术”“高速连拍技术”和“摄像技术”三种技术对小球二维碰撞动量守恒进行探究实验。
实验准备
1.实验工具与软件:CASIO(EX—FH100)数码相机、计算机、三脚架、光滑的玻璃平面、水平仪、两个颜色不同大小质量相同的直径为25mm的小球、Mr.captor频闪截屏软件、几何画板等。
2.实验环境与条件:在进行实验之前要保证平面和相机水平,玻璃面尽量光滑使摩擦力减少到最小。这里我们用到水平仪分别对相机与平面进行校准,如图1和图2。
实验过程
用数码相机的“连拍合成技术”“高速连拍技术”“摄像技术”结合频闪截屏软件与几何画板软件,分别对两球斜碰过程进行图形获取、图像处理、数据分析。
1.连拍合成技术
(1)图像获取
通过相机的BS功能键进入到情景模式区,选定“连拍影像合成”,如图3。
拍摄的时候,相机会以5张/秒的连拍速度捕捉一个连贯的动作。两个颜色不同、大小质量相同的玻璃球作为研究对象,在光滑平面上,让绿色小球碰撞蓝色小球,拍摄小球的二维碰撞过程,获得连拍合成图像,如图4所示。
(2)图像处理
①将图片粘贴到“几何画板”中,利用“点工具”将图片中的绿色小球和蓝色小球分别用绿色圆点和蓝色圆点表示出来。
②点击工具栏中的自定义工具项目,选择圆工具中过三点的圆(虚线),如图5所示。选择图片中圆表面的任意三点,软件就能将小球圆心标识出来。
③选择移动箭头,鼠标移动到圆上点击鼠标右键,会出现如图6所示的对话框,选择隐藏圆。圆框消失后,将鼠标移动到圆表面的三个点,点击右键,选择隐藏点,依次将三点全部隐藏,最终圆心就能确定了。
④ 选中各点点击“度量”菜单中的“横坐标”“纵坐标”就可以显示小球所在位置的坐标值,再点击“显示”菜单中的“隐藏照片”。
图像处理结果如图7所示。
(3)数据分析
选定各点坐标再点击“数据”菜单中的“制表”,可以得到横纵坐标的表格。由于玻璃板光滑,可以认为小球近似做匀速直线运动,速度可以通过得到,其中。经过计算算得在x方向动量误差为9.7%,在y方向动量误差为4.9%,平均误差为7.3%。在误差允许的范围内,小球二维碰撞过程的动量守恒得到验证。
(4)注意事项
此相机的连拍速度是5张/秒,如果物体运动速度太快,相机合成效果不明显;物体运动速度太慢,画面重叠,所以在做实验前要了解相机的连拍速度,以便对小球运动的速度合理控制。
2.高速连拍技术
按连拍(HS)按钮,如图8所示,将连拍速度设置为40fps,最多连拍幅数设定为30,预先记录连拍设置为0.3s。半按快门钮,进行预先记录拍摄,等到理想拍摄时机时,完全按下快门钮,拍摄想要的图片。两个颜色不同、大小质量相同的玻璃球作为研究对象,在光滑平面让绿球碰撞静止的蓝球,连拍小球的二维碰撞过程,然后通过几何画板对图像进行拼接处理。
光滑平面连拍:绿球碰撞静止的蓝球,如图9所示。
图像处理与数据分析步骤与连拍合成技术相同,最后算得误差平均值为3.5%。
3.视频频闪截屏技术
在拍摄方式中,将动画方式旋钮转至(HD/STD),选择高速动画(HS),按动画按钮开始拍摄,分别在光滑平面让蓝球碰撞静止的绿球和非光滑平面让蓝球与绿球互撞,碰撞完成后,再按动画按钮结束拍摄。然后用频闪截屏软件Mr.Captor对拍摄的视频进行频闪截屏,点击“选项”菜单中“参数”命令,将弹出参数窗体,在“定时/视频”中设置频闪周期为0.1秒,设定图片保存路径。点击“ ”按钮,在屏幕上圈定单摆振动的截屏区域,再点击鼠标右键,在弹出的菜单中选取“开始定时捕捉”命令,于是所捕捉的图片被记录在相应的文件夹中并被自动编号。最后通过几何画板对图像进行拼接处理。在进行图像处理时,处理好一张图片之后,隐藏图片,拖进下一个图片,逐个处理,这样每个小球运动的轨迹就能记录在几何画板之中了。经过计算算得平均误差为26.75%。
三种技术总结与对比
通过对这三种技术进行实验,总结出每种技术的特点与差异,总结如表1。
根据以上分析,得出此实验误差与数码相机的配置有极大的关系。教师可以根据教学条件以及课程的需要选择以上方法探究二维碰撞动量守恒问题。
随着科学技术的发展,数码设备已经普及到千家万户。运用数码相机探究二维运动打破了只限于探究一维运动的常规,并且数码相机携带方便,易于学生课下探究[3]。探究性学习包括提出问题、收集数据、形成解释、评价结果、检验结果等过程,而运用数码设备则可以帮助学生更便捷地收集数据、分析数据,有助于培养学生的科学探究能力。
篇10
关键词:手写笔体;信息查找;同步扫描;字符分割
中图分类号:TP311文献标志码:A文章编号:1009-3044(2010)22-6282-02
1 图像分割技术
图像分割是图像处理和前期视觉中的基本技术,是按照图像的某些特征(灰度级、频谱、纹理等)将图像空间划分成一些区域,在这些区域的内部,其特性是相同的或者是均匀的,两个相邻区域的特性则互不相同。图像分割是有图像处理转为图像分析的关键。一方面,它是目标图像表达的基础,对特定测量有重要影响。另一方面,图像分割也是图像的目标表达、特征提取和参数测量等分割所用的主要方法。[13-14] 对于一般复杂图像,图像分割较为复杂,比如Wang等[17]通过对生长区域进行分级,识别出由同一物体组成的整体区域,从而获得物体的轮廓,但是可能导致区域空洞的出现,但由于本系统在去除背景、对字符分割的这一特定条件下,处理过程相对较为简单。
到目前为止,所有的图像分割算法均是针对某具体问题而提出的,并没有一种可适用于任何图像的通用分割算法,这也可以从一个方面说明,为什么能研究出上千种方式各异的图像分割算法,而且每年都是上百种的速度在递增。尽管存在着数量庞大的各种图像分割方法,但均可以将其分割处理的特点归纳为以下几条:
1)分割产生的所有区域之和包括了原始图像中原有的所有像素,即分割把原始图像的每个像素都分到某个区域。
2)分割后的结果互不重叠,即原有像素不能同时分割到两个区域。
3)分割后的各个区域有其独有的特性,即同区域的像素具有某种共性。
4)分割后的不同区域具有不同的特性,分割后同一区域内任两像素在该区域内相互连通,即分割后的区域是一个连通组元。
2 图像分割途径
图像分割有三种不同的途径。
1)将各像素划归到相应物体或区域的像素聚类方法即区域法;
2)通过直接确定区域间的边界来实现分割的边界方法;
3)首先检测边缘像素再将边缘像素连接起来构成边界形成分割。字符分割是为了便于对单个字符进行进一步的单独处理。因为一般字符图像均能满足相邻文字行列间至少有一行或者一列全为背景象素这一条件。系统在读进来的图像中一般会含有多个字符,识别的时候只能根据每个字符的特征来进行判断,所以还要进行字符分割的工作。这一步工作就是把图像中的字符独立的分割出来。[15]
3 手写体字符任意行分割算法设计
3.1 系统提出
本系统提出的“基于个人手写笔体的信息查找”的概念是一个全新的概念,它既要求对于手写体汉字本身结构信息的把握,又对捕获单个字与周边文字之间相对位置信息的规律性提出了要求。而以往人们在“笔迹鉴别”等领域所做的工作都是针对行、列分布较规范的整段文字或整篇文章进行的,对于如今我们面临的空间分布极具任意性的个人手写笔记而言,昔日的经典算法仅仅具备一定意义上的参考价值,谋求一种适用性更强、能够对个人手写笔记字符进行准确分割的算法成为了正确查找信息的重要前提。比如图1这种比较典型的情形,进行行、列扫描的嵌套 设定阈值 将距离小于阈值的相邻的两部分进行分割,此时这样的算法显然就无用武之地了。
对于左右结构或者左中右结构的汉字,分割阈值的设置与个人的书写习惯是一对比较难以解决的矛盾,例如《沁园春・长沙》的“沁”、汕头的“汕”,前者由于“心”字的左边一点在垂直投影上与“]”无重叠部分而恰恰同“シ”有交叠,故而将整字错误地分割为
而“汕”字则不光是左右被分开,连三点水最上面的一点也被独立划分为一块,至于为什么“清”和“澈”就会被正确地框出呢?实质上是一个道理,注意用红色圈出的部分。
由于手写体的随意性,文字大小不尽相同,这就要对文字尺寸进行归一化,因此字符分割是非常重要的一步;同时字符分割又为之后的文字拼接提供了一条简单易行的途径。因此,若我们光从传统的算法入手,将阈值设定得较小同时要求用户刻意将字间距放大,那显然这是不人性的设计、是治标不治本的下策。
3.2 分割算法
综合考虑汉字结构的分布规律及书写的随意性,本系统采用了如下的字符分割算法:
1)首先对整幅图像进行扫描,定出上、下、左、右四条边界线(如图中箭头1、2、3、4所示)
2)对图像进行第二次扫描,此次扫描目的是对分立的字符进行分割。基本思想是认为手写的汉字大致是可以被一个正方形的边框所包围的,假设以列扫描作为外层循环,如图中3号箭头所示,以其扫描到地第一个像素点的横坐标为“虎”字的左边界同时以该像素点的纵坐标rectpop.bottom作为列扫描的循环次数,当扫描到如图5号箭头所示位置时,发现再往右扫一列时像素点的纵坐标便已经远大于rectpop.bottom,故而马上进行右边界的分割,之后“虎”字的行扫描继续,当扫描到6号箭头所示位置的下一行时,又发现扫描到的像素点的横坐标远大于rectpop.bottom,所以此时可以将“虎”字的下边界定出,到此为止,第一个“虎”字的分割完成,而之后的第二个“虎”字的分割思想与之如出一辙。至于“威”字的分割,则与之前的两个字的分割方法不同,由于扫描在一维上是从单一方向进行的,即对于列地扫描始终定格为从左到右,这就造成了其在空间分布上的独立性,换句话说,对于该字的扫描就无法贯彻之前的以具体像素点左边界的纵坐标rectpop.bottom作为列扫描的循环次数,所以对于“威”字的扫描实质上是沿袭了整幅大图像的扫描方式,只不过该字的右边界已定(就是整幅图像的右边界),而其余三个边界则只能老老实实地由行列嵌套循环定出。
又如图3(i)所示,字与字之间的位置关系毫无规律性可循,系统首先依旧按照设定的算法进行整幅图像的上、下、左、右四条边界的确定,将整幅图拆成如图(ii)所示的左半部分以及剩余的右半部分,我们发现:(ii)图的情形与上一例如出一辙,但为什么与(ii)中的“水”字毗邻的“森”字却没有以它的最底端作为其本身的下边界而是以2号箭头所示位置为其下边界呢?原因是它的右边还有字符。
当行扫描进行到(ii)中的“森”(称其为森2)字最底端时,扫描线被其右边的另一个“森”(称其为森3)的像素点“挡住去路”,这一信息的反馈使得系统得知行扫描还未结束,所以确定森2的下边界就等效为确定森3的下边界,正如我们所分析的那样,扫描结果是森2与森3的下边界相同且均为整幅图像的下边界。
同样道理,因为森3的至高点在森2的最低点上方,而行扫描在划过森2的最低点后始终向下寻找森2的下边界,这就使得森3 的上边界成为了由前级附带确定的因素。所以,整幅图中,尽管单个字可以准确无误地分割开来,但个别字边界的确定却是不尽如人意的。
图3字符分割实例3
4 结束语
再严密的算法总是在逻辑框架下执行一定顺序的操作,本算法也同样如此。我们的本意自然是希望得到如图(iii)所示的理想结果,但任何一套算法都是对规律的总结,其相对适用性无法脱离一般性的约束,而手写体的随意性恰恰是以特殊性来考验一般性,所以即使当前的算法对于个体分割具备了一定程度的正确性,其与我们设想的理想状态还是有一定距离的。以上两例充分说明本算法中前级对后级有影响,后级对前级同样有牵制,前后级字符之间的相互制约构成了当前分割算法的核心体系。
参考文献:
[1] 唐伟成.手写英文字符识别系统[D].沈阳理工大学硕士论文,2009.
[2] 朱娜敏.精通Windows程序设计――基于Visual C++实现[M].北京:人民邮电出版社,2009.
[3] 郭一平. 数字图像压缩历史的分析与检测[D]. 大连理工大学硕士论文,2009
[4] 沈军.一心两用.“双显”让游戏电影两相宜[J].电脑爱好者,2010(5).
[6] 梁红飞.四线电阻式触摸屏测试系统的研究[M].中南大学硕士论文,2009.
[7] 赵志强.基于GPRS的便携式信令控制系统的设计与实现[M].同济大学硕士论文,2008.
[8] 何斌.Visual C++数字图像处理[M].北京:人民邮电出版社,2005.
[9] 孙鑫.Visual C++深入讲解[M].北京:电子工业出版社,2006.
[10] 师春礼.手写体字符预处理与识别系统研究[M].硕士学位论文.北京:北京邮电大学,1995.
[11] 王丽华.基于神经网络的图像识别系统的研究[M].中国石油大学硕士论文,2008.
[12] 蔡樱.中文手写文稿的二值化与行列切分[J].中文信息学报,2000,14(1).
[13] 章毓晋.图像理解与计算机视觉[M].北京:清华大学出版社,2000.
[14] 靳藩.神经计算与智能基础[M].重庆:西南交通大学出版社,2000.
[15] 唐伟成.手写英文字符识别系统[D].沈阳理工大学硕士论文,2009.
[17] 张宏林.Visual C++数字图像模式识别技术及工程实践[M].北京:人民邮电出版社,2003.
[18] 孙艺峰.基于多种特征的数字图像分割理论和方法研究[M]. 辽宁师范大学硕士论文,2009.