机器视觉概念范文

时间:2023-12-28 17:40:16

导语:如何才能写好一篇机器视觉概念,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

机器视觉概念

篇1

关键词:视觉性;图画性;李格尔;泽德尔迈尔;潘诺夫斯基;维也纳艺术史学派

作者简介:王艳华,女,广西民族大学外国语学院教师,从事西方艺术史及艺术理论研究。

中图分类号:I01 文献标识码:A 文章编号:1000-7504(2017)03-0127-08

1994年,W. J. T. 米歇和博姆继罗蒂“语言学转向”之后分别提出了“图像转向”(the pictorial turn or the iconic turn),后来又被“更加广泛地概括为‘视觉转向’(the visual turn)”[1](P11)。此后国内学界迅速做出回应,如今我们的视觉文化研究已有近二十年历史。然而,视觉性作为核心概念之一,对它的意义和起源的阐释仍不够透辟,反之,这也在某种程度上限制了我们对视觉文化研究的进一步开掘。正如迪克维斯特卡亚在《文化转向之后的视觉研究》中所言,对于视觉研究的范围、对象、定义及方法等完全没有达成共识。[2](P2)在国内吴琼也提出类似的观点,“对于其(视觉文化――引者注)基本的理论问题和方法论,人们的认识尚有诸多暧昧不明之处”[3]。所以,他建议根据三个谱系学源头去梳理学科的发生史及基本范畴和方法,即批判的现代性/后现代性话语、图像学与艺术史研究以及“文化研究”。在吴琼看来,以上三种学术话语以其不同的背景和原因,在演进过程中互相影响,互相渗透,最终在视觉文化研究这一思潮里形成交叉与汇流。[3]可是,事实上,三种理论话语所形成的复调式理论建构,恰使人们对视觉文化的理论与方法论认识“暧昧不明”,成为诸多概念模糊不清的主要原因。而三者对该“学科交叉地带”的进一步争夺,又使概念的溯源和界定,使学科谱系、理论、方法论的一些相关问题变得更为复杂。下面,我们就视觉性一词来举例,说明视觉文化研究概念界定不清的问题,进一步溯源其概念,并思考解决概念界定不清的路径。

一、关于概念界定的“悬而未决”

寻根溯源,在视觉文化领域,一般认为,1988年哈尔・福斯特(Hal Foster)和诺曼・布列逊(Norman Bryson)最早提出这一概念。通过对比视觉和视觉性两个概念,福斯特提出“视觉暗指所见景象为物理运作,视觉性暗指其为社会事实”[4](序言,P28)。可见,在视觉文化领域,从视觉性这一概念初被提及开始,它就天然地衍生于文化研究这一学科,“社会事实”所指向的是各种社会活动,文化研究无所不包的研究对象统统被统筹于视觉性这一范畴中来。他进一步解释到,为了实现一种观看目的,即“在所见景象机制及其历史手法之间,在视觉资料及其话语决定机制之间――我们如何看待事物,我们如何有能力、被允许、被促成去看待事物,我们为何看到此物而忽视彼物。视觉体制试图凭借各自的修辞与表征,将社会的种种视觉性打造成本质为视觉的东西,或将其在一个可见的自然等级中进行排序”[4](序言,P28)。这里,视觉性成为人们试图发掘的作为视觉观看的“本质”或“本体”的东西,它可以包括“所见景象机制”和“视觉资料”,但并不包括创造视觉对象和景观的“历史手法”和“话语”机制,以及“如何看待事物”的方式、方法,而后者,在艺术史上费德勒提出视觉性范畴之后,原本是视觉性更广泛意义的最主要部分,视觉性在艺术史上的动态特征和静态特征发展到视觉文化时从一开始就陷入僵化、固化的境地,惠特尼批判它被完全“实体化”,只留下静态特征作为考察对象。虽然它的“象征价值”经由图像学得到一步步扩展、完善,然而“形式价值”却已被遗忘,作为动态的方法论意义更是无人提及。

事实上,当福斯特试图在视觉和视觉性比较中对后者进行界定,强调“摆脱模糊失焦的叠加,打破既定视觉事实排序”[4](序言,P28)的重要性,侧重对影响“观看”的诸多历史文化因素的强调时,如果将视觉性视为“自然”进一步社会化的产物,那么,这在先前的艺术史学科中早有讨论,19世纪末至20世纪上半叶维也纳艺术史学派的社会历史方法早已经为我们提供了借鉴。所以,福斯特的定义并无新意,它只是延续了文化研究的研究方法,并没有提出具有独创意义的视觉文化的视觉性概念,而且,对于艺术史的视觉性也没有构成合理的互文性,福斯特对于视觉性的界定,仅是从文化研究的角度去进行阐释。

二十年来,试图对视觉性这一单一概念进行定义和阐释的讨论并不多见。另一个典型例证可见于2006年,米尔佐夫借鉴韦登斯堡、里德、卡莱尔、爱默生等人的理论,表达了自己对视觉文化意义上的视觉性的理解:

视觉性对于英雄碰巧是可以获得的清晰的历史图画,历史学家在回顾中可获得同样的图画。但对于仅仅观察事件而不形成视觉性的普通人来说,它是不可见的。[5](P57)

相对于福斯特所下的定义,这一阐释显然更为抽象,更为模糊不确定,然而它却暗示了视觉性一词所具有的图像学特征及源脉关系。另一位对视觉文化给予著名定义的W.J.T.米歇尔也是一位批判的图像学家。他们的论述可看出对艺术史和图像学的溯源性研究,这一进展振奋人心,它为嫁接艺术史和视觉文化二学科,弥合二者长期以来的断裂或久未实现的关联性,为克服种种视觉文化研究的学术困境做出了很大努力,显著地推进了研究进展。然而,在视觉文化内部,紧接着则有很多学者试图大刀阔斧地进行学科化革新,他们试图建构新的理论语境以及全然独立的视觉文化这一学科,他们又转向文化研究去寻求突破口,强调视觉性恰是使得事物从不可见成为可见的必要条件。在国内这一理论最强有力的代表是吴琼,他发展了米尔佐夫的视觉性指向事物的“不可见性”这一观点,提出视觉性是“从不可见转为可见的运作的总体性”[6],所以,此后,我们认为视觉性仍向“文化研究”这一理论维度发展。

进一步而言,在国内,使问题变得更为复杂的是在不同理论背景中甚至回至前科学阶段去溯源概念的过程。比如,2011年,刘晋晋在《何谓视觉性?――视觉文化核心术语的前世今生》一文中提出,视觉性最早可追溯到韦登斯堡神秘主义的视觉性概念,据此,刘晋晋试图在现代性/后现代性话语体制下,进一步扩大视觉性的适用范围。不仅如此,他还对上述诸种定义皆进行了批判。首先,针对吴琼的观点:“‘视觉性’不是指物的形象或可见性,而是海德格尔意义上的‘世界的图像化’,是使物从不可见转为可见的运作的总体性,这种总体性既包括看与被看的结构关系,也包括生产看的主体的机器、体制、话语、比喻之间复杂的相互作用,还包括构成看与被看的结构场景的视觉场。”[6]刘晋晋认为,“‘运作的总体性’太空泛从而缺乏使用效力。列举‘这种总体性’显然不是在阐释术语内涵而是在罗列外延。……在具体对象面前‘视觉性’似乎成了多余”[7]。其次,刘晋晋虽然试图对米尔佐夫论述的视觉性加以概括:(1)观看(view),(2)一连串景象、全景(panorama),(3)强调杜波伊斯的“颠倒的视觉性”,然而,他认为米尔佐夫试图抬高视觉化(“视觉的文化化”)以抵制视觉文化的真正核心――“视觉性”。而且,他还认为,米尔佐夫2006年《关于视觉性》一文中对托马斯・卡莱尔新造该词的历史溯源这一过程“考证并不确切”,“是对‘视觉性’原义的歪曲”,他认为,“米尔佐夫的概念引入是对卡莱尔视觉概念的简单偷梁换柱”。[7]

使研究变得更加复杂化的是,曾军等表示直接将视觉性剔除而以“视觉化”取而代之。曾军将对“视觉”的理解分为名词化和动词化两种,并认为,“作为一种整合的努力”,视觉性“由于其界定的暧昧”而无法承担对视觉的表征。曾军认为,理解视觉的基础是视觉生物学,或者是传统视觉艺术门类之间的区分。在他看来,如果只将视觉视为自然的赐予,则不能表征“我看事物、看世界的方式都被彻底文化化”这一事实。他的偏见在于,他认为对于直观形象性的图像表征仅是“一种技术性、艺术史的活动,是一种仅仅通过训练即可达成的技巧”。因此,“视觉性”应该被“视觉化”这一概念所取代。[8]事实上,曾军的批判恰为我们提供了进一步理解视觉性的依据,并不是宣布对它的摒弃而彻底转向“视觉化”。尽管如此,我们在视觉性概念溯源这一问题尚未解决之前,暂不讨论视觉性概念是否该被消灭的问题。

所以,导致视觉文化的视觉性概念不清的原因有以下两点。一方面,自视觉文化发端时起,受批判的现代性/后现代性话语以及“文化研究”的影响,在国内关于视觉性的阐释方面显出与艺术史概念的断裂和混淆不清,或者即使有的学者找到与艺术史的联系却未被后来学者理解或正确阐释(比如刘晋晋对米尔佐夫思想的错误性批判等),导致后来学者进一步讨论视觉文化各种相关概念性命题时经常陷入至少上述三种不同学术语境之一种,无法获得概念在这些不同学科之间的联系性,这使视觉文化研究面临对话艰难、自说自话以及泛文化的尴尬局面。另一方面,根据迪克维斯特卡亚的观念,20世纪80年代中后期开始,艺术史与文化研究理论碰撞和交互冲突之下,产生视觉文化这一新兴领域。从此,视觉以及视觉性就成了两个学科都十分关注的核心术语,人们分别从不同路径对其进行探索。一直以来,我们的研究更多地侧重于二者之间的差异性,视觉文化的视觉性是在文化转向潮流之中、在广泛的文化化论证阶段被讨论,而且主要着重于对艺术史视觉性、生理视觉性(知觉)、物理视觉性等种种否定或超越,强调其文化包容倾向,强调其历史、社会、政治的“象征价值”;换言之,视觉文化的视觉性还没有进入理性论证阶段,对于这一范畴的讨论因此尚处于探索阶段且略显混乱。因此,对于该词给予一次溯源性思考仍然是必要的,而且,值得补充的是,对于范畴的讨论本身并非陷入本质主义的桎梏。

二、“视觉性”概念溯源:从视觉理论进入视觉文化

关于视觉文化和艺术史的关系,迪克维斯特卡亚总结出三种不同的观点:

第一种认为视觉文化研究是艺术史的一种合理延伸;第二种则认为,作为独立于艺术史的一个新聚焦点,它(视觉文化)更适合于采用与数字化、虚拟化时代相关的视觉技术来进行研究;最后一种观点认为,视觉文化研究是对传统艺术史学科的威胁和自觉的挑战。[2](P3)

不论视觉文化对艺术史是“合理延伸”还是“威胁和自觉的挑战”,这里,我们都试图坚持最原始的谱系学思维,先去找到两个学科之间的渊源关系,再在后续研究中进一步论证二者是否独立、互不关涉还是“合理延伸”或彼此“斗争”。下面,我们以视觉性这一概念为例来溯源视觉文化的艺术史渊源。

视觉文化中的视觉性概念,应以艺术史上视觉理论的发端作为源头。当我们回顾视觉的历史,回溯到视觉理论得以创建、现代艺术史或艺术科学(形式学说阶段)的确立这一时期时,我们会找到可资借鉴的学科源头和范畴参照,有助于弄清视觉性概念的来龙去脉。我们认为:视觉性经历了艺术史研究对象的进一步扩展,艺术史形式研究与图像研究的方法论转换,逐渐走向社会历史文化等多元理论与方法,并在批评理论作为阐释工具的介入之下,逐渐融入文化研究潮流,成为视觉文化中的重要范畴。总体而言,视觉性经历了艺术史、图像学以及视觉文化三个时期:首先,在艺术史上,李格尔等形式主义学者提出视觉理论,确立艺术科学作为一种新兴学科,赋予了视觉性以“形式价值”和“象征价值”,并主要通过“形式价值”对它进行界定;其次,潘诺夫斯基创立图像学,重新确立“象征价值”高于“形式价值”的标准,强调视觉性的“世界图画”的文化表征功能;然而,后来的视觉文化研究虽然发展了潘氏对于“象征价值”和“世界图画”的观念,视觉性的艺术史源脉却被切断或未被发掘,视觉性概念被实体化,它的方法论功能以及“形式价值”被忽视。

回顾视觉的历史,首先,康拉德・费德勒提出纯视觉性,一般被认为开创了视觉理论之先河。[9](P114)费德勒认为艺术独立于美学与艺术哲学,反对黑格尔主义美学基于抽象沉思的唯心主义观念,他强调知觉体验,提出纯视觉性:

艺术家被驱使去培养自己的视觉观念……假如我们有能力达到遵循这种创造力的程度,我们通过运用艺术家的想象力,可以使得关于世界的视觉观念在构成形式方面日趋丰富。[10](P3)

在这场视觉理论转向中,费德勒不仅反对一切哲学形而上学论,而且全心投入到“视觉形式创造机制的分析中”,全面展开“对艺术家视觉形式创造过程的研究”,从而使“先前多少有些客体化了的形式关系与其内在精神目标在纯视觉理论中获得协调”。[11](P26)

所以,在艺术史以及相关学科(例如视觉文化)研究中,在黑格尔的“心灵”和唯心主义观念之外,视觉性开始被视为形式表征,其“形式价值”开始得以强调,其中最为典型的是李格尔、沃尔夫林、泽德尔迈尔等提出的形式理论,或者毋宁说,视觉理论。“关于(李格尔、沃尔夫林等)德语国家早期艺术史研究的文论,人们通常给予的假定是,它基于简单、狭隘的形式主义”[12](P1),李格尔、沃尔夫林以及泽德尔迈尔等维也纳二代学者也由此被称为形式主义者。“事实上,他们的主要学术贡献并非在于形式研究,而是开创了视觉理论,并使之成为艺术科学的理论基础,由此颠覆了艺术史传统。”[13](P45)

李格尔在《罗马晚期的工艺美术》里根据一个概念“艺术意志”、两个范畴“触觉的”和“视觉的”所建构的理论体系中,使“触觉的”和“视觉的”一对范畴脱离了原本的知觉含义,成为形式表征[14],突显其“形式价值”。比如,李格尔认为,古代早期“触觉式”建筑设计的艺术意图,“只要可能就会热衷于构造空间的边界,压制并掩藏起另一任务,即空间的创造”;对于罗马晚期“视觉式”风格取向的建筑而言,比如万神庙,“同一个面上不存在两个点,因此建筑的所有部分就必须有一个统一的大轮廓”[15](P17),这一“大轮廓”实际上指向的是“空间的创造”,所以,“触觉式”风格趋于对平面的追求,“视觉式”风格趋于对“空间的创造”的形式要求。而且,“在建筑领域……‘触觉式’是通过一系列艺术意图的取向(艺术形式――引者注)来获得的,比如强调平面维度、构造体块布局、依靠立柱来隔断空间、回避色彩或浓重的阴影对单一平面感的破坏等等。‘视觉式’反之,就存在于逐步建的‘统一的大轮廓’、追求深度的不断变化以‘引向纵深’、自由空间的个体化、创造多个色彩生动的平面或加强阴影以打破单一平面等等(形式――引者注)”[14]。可见,李格尔等形式主义者主张从形式表征的角度去考察视觉性这一范畴,虽然当时李格尔还没有明确提出“视觉性”这一术语,而是以“视觉的”或“视觉式”(opisch)来对其进行表征,但是,二者含义相似,事实上,李格尔对于视觉性的“形式价值”的强调是毋庸置疑的。

进一步而言,我们可以将李格尔的视觉性做如下总结。其一,视觉性是一种“艺术意志”(“自由的、创造性的艺术冲动”[16](P29));是一种创造力,亦即一种方法论,是创造或构造形式的方法。其二,是物化的客体特征,与“触觉的”/“图画的”构成统一,相互融合,又彼此斗争。其三,不具有实体性。其四,是视觉理论的核心概念,但是没有明确界定。另外,根据李格尔对不同时代具体的“艺术意志”的阐释以及沃尔夫林所强调的视觉性所指向的“时代精神”来看,视觉性在形式主义者那里包含了“视觉体验的象征形式”这一现代视觉性内涵。可见,虽然视觉性是作为形式学说术语被提出,并作为形式研究方法进入艺术史,但事实上,上述学者是最早的一批视觉理论家,他们的主要贡献是创建并完善视觉理论并以视觉理论颠覆传统形式理论,他们运用视觉性反叛或替代形式/风格甚至“图像”等范畴,深入研究形式。所以说,视觉性一经提出,就具有形式这一自然属性,成为新的形式(表征),同时,它又是一种新的方法论原则,用以重新阐释形式/风格,它自身具有相对独立性,从此种意义上来讲,它甚至成为“反形式”,对立于形式、风格以及图像,其“象征价值”逐渐凸显。不过,形式学说时期,艺术史家们对视觉性的“象征价值”的阐释不足,这一点后来在潘诺夫斯基的图像学研究中得到了补充。

此外,艺术史上形式学说之后的视觉理论家或艺术史家,仍然在不断推进对这一范畴的研究,就视觉性与形式的关系而言,众家纷说不一。比如,除下文我们主要讨论的潘诺夫斯基之外,贡布里希侧重于艺术心理学研究,他认为人类是没有纯真之眼的,视觉性作为“观看”的过程绝不是一个被动的过程,而是对大自然所提出的某一个问题的结果,是“匹配的艺术图式”[17](P29);鲁道夫・阿恩海姆认为,视觉是“选择性思维”[17](P26),这是从知觉心理学角度去研究视觉性和视觉思维。中国学者王耀中曾总结过形式的视觉化过程,比如视觉通过对跳跃性、无限性、无序性的形式进行重新定位和组织、选取,使其定格化、截取化、组织化,以实现审美视觉效果。[18]

总之,视觉性是视觉理论的核心概念,是在形式理论发展进程中出现的,它对立于形式/风格/图画性或图像,并在形式学说那里,试图在客体形式与主体精神的统一原则中实现它的文化象征意义。但是,在这一时期,视觉性与图画性之间的对立性,以及它所具备的“象征价值”尚未得以强调。然而,通过以上探讨,我们认为,作为视觉理论家而非形式理论家的“艺术史之父”们,他们针对视觉性范畴所展开的阐释对后来与“文化研究”以及现代性思潮具有承继关系的视觉文化研究理论及范式有着整体性开创和促进作用。

三、概念衍变:潘诺夫斯基及其图像学担当中介

如前所述,在形式学说时期视觉性的“象征价值”没有得到全面的阐发。潘诺夫斯基试图补足这一点。潘氏强调,视觉性是“思想的构像习惯”,是体验形成中象征行为的建构性特征,是视觉体验的象征形式。[19]具体来说,指我们看、构像和构画的体验。潘诺夫斯基通过对丢勒作品的分析研究,试图打破形式学说的形式统一,去寻找“可称为内容逐渐显示的过程”,论证作品如何实现形式、动机与叙事主题内容的不可分割的统一,并借此界定“伟大的象征形式”。[19]这一过程体现了图画性让渡于视觉性,以及图画性受制于或由视觉性决定。换言之,潘氏试图打破形式统一于图画性和视觉性这一局面,由此,恰走向了视觉文化中视觉性的关键一环:非图画性/视觉性二者之间的统一性而是斗争性或对立性使视觉性的地位得以提高,使视觉性具有更大阐释和可发掘的空间。所以,对于潘氏而言,视觉性所构造的图像是“图画之外”,是作为“被图绘的”特殊世界之外的认识,是超越于媒介的观看之外的观看,如此,我们才能进一步理解视觉性投射又预设一种作为“观看方式”的世界图画或世界认识。对于潘氏而言:其一,“象征价值”是深层文化累叠的根源,可凝聚并呈现多元文化意义,同时,文化意义又会带来“看”的行为差异,所以,看就成为了“观看”(viewing);其二,人看到的“世界图像”是图画之外(extra-pictorial)的世界认识,不是图画本身,相反,是对被图绘的特殊世界的超越或否定;其三,视觉性构成“世界图画”,传达文化总体的视觉性特征。可见,这些特征都是将视觉性从形式学说向视觉文化进一步推进的必由之路。

另外,通过对比形式学说和图像学的理论和方法论,我们能够发现,视觉性不是一个历史对象,而是历史方法的分析极。正如惠特尼所说,“视觉性既投射又预设一种作为‘观看方式’的世界图画或世界认识,其中包括观看图画的方式。这种投射―预设有一段特别的历史,正是我们要追溯的。这里,我们必须注意到一种方法论的循环。视觉性不是纯粹的观看,视觉性必须以图画构造活动为媒介,而图画构造活动并不能完全化约为构成它的视觉性。就这个意义而言,视觉性不是一个历史对象,而是历史方法的分析极,以之可以处理实际的历史对象:既投射又预设图画的人类视觉”[19]。

这里,对照而言,图像学对于形式学说的改造体现在方法论方面:形式学说试图通过对形式语言进行“文本细读”的方式来把握对世界的整体认识,即视觉性,而图像学通过对形式的超越去把握世界的“观看”。值得指出的是,二者在方法上虽然有别,但是无论图像学还是形式学说,它们的方法论是交叉进行的,也就是说,是以方法论循环往复的形式分别展开各自的研究。其中,图画性和视觉性同时可以被视为方法论的两极,无疑,这一主张是“艺术史之父”们――李格尔以及沃尔夫林等开创的。潘诺夫斯基和泽德尔迈尔等将其分别引向了不同的研究方向:潘氏在“象征价值”基础之上展开形式研究;泽氏在“形式价值”基础之上展开象征研究,这两种理论最终都将客体世界深层的社会、文化、历史意义揭示出来,交汇于关于“世界图景”的领悟和阐释一极。

至此,艺术史上这种理论文脉的纠结,在方法论循环上得到了厘清,同时,视觉性作为一种方法论的身份,也在图像学以及艺术史领域得到广泛的认同。然而,在视觉文化领域,这种身份却未被发掘。在惠特尼看来,“如今,视觉文化研究常常将一种纯粹的视觉性实体化。确实,视觉性似乎常常被当作一个历史对象,即所谓的‘视觉文化’。但是,这种做法违背了文化意义的原发性现象累叠这一前提,而原发性现象累叠据推定最终等同于视觉感知的原发性本体累叠。当视觉文化研究把视觉性当作图画构造史的真正基础,而不是图画构造史的一个时刻,它就不能以融贯的方式将图像自身的效果――图像按理应该具备的对视觉的构造性排序――与视觉中图画载体的各种原因联系起来,也就是说,它就只能将效果和原因混为一谈。实体化的纯粹视觉性只是视觉的‘世界观’或‘时代之眼’的另一个令人质疑的教条”[19]。

举例来讲,比如曾军在批判视觉性概念时,他说:“视觉文化研究已不仅仅是传统意义上的视觉艺术的研究,而是广泛渗透到了当代文化、日常生活和社会现实之中,甚至过去当仁不让作为视觉艺术典范的造型艺术(绘画、雕塑等)已在视觉文化研究对象中居于边缘,基于视觉媒介技术而兴起的电影、电视、网络等则占据了中心。另一方面,从研究方法上讲,对视觉现象形式及其意味的审美分析早已不再是视觉文化关心的论题,视觉与权力、视觉与性别、视觉与商品广告、景观社会、拟象、仿真、城市视觉文化、旅游者的凝视、风景与帝国等,已将视觉置于社会与文化的语境进行考察,所展开的已是詹克斯所说的‘视觉性社会理论’(social theory of visuality)了。”[8]这里,曾军所诠释的视觉性存在概念混淆问题。他几乎将视觉性狭隘化地指涉为“图画性”,将视觉性的形式属性或图像功能作为批判的重点,只是片面地强调了视觉性的表征功能和“象征价值”。套用曾军自己的话,“为什么会这样?”原因在于他将着眼点放在“实体化的视觉性”上面,而且,泛文化研究倾向使他陷入两难的境地,即使他意识到视觉的动态特征,他却不愿意将这种视觉性阐释开来,即使他提到科比特所强调的“‘视觉性’意味着视觉不是一个单纯的分类,而是一个正在形成中的文化和历史”[8],他却没有将视觉性在这种动态“形成”中所担负的方法论意义展开。在这种概念不清的情况下,将视觉性直接抛弃并以视觉化取而代之的做法,是不太恰当的。

另外,吴琼曾试图论述视觉文化的视觉性,在他看来,视觉性问题是“对现代世界的主体建构、文化表征的运作以及视觉实践之间的关系进行分析,揭示了人类文化行为尤其是视觉文化中看与被看的辩证法,揭示了这一辩证法与现代主体的种种身份认同之间的纠葛”[6]。以上可见,这种辩证法体现了“象征价值”,但是,他在试图建构“世界图画”过程中却将其推向了实体化的层面。当然,很多学者也注意到海德格尔所强调的“世界的图像化”,可是,当我们将其视为从“不可见转为可见的运作的总体性”时,我们试图将视觉性泛文化的倾向就十分明显,很多学者尽可能大而驳杂地赋予视觉性无限宽广的内涵及外延,比如“这种总体性包括看与被看的结构关系,也包括生产看的主体的机器、体制、话语、比喻之间复杂的相互作用,还包括构成看与被看的结构场景的视觉场,总之,一切使看/被看得以可能的条件都应包含在这一总体性之内”[6]。这种泛文化倾向忽视了以方法论的方式去实践这每一环节,以至于“文化化”的视觉性陷入了扼杀视觉性自身的陷阱。

简而言之,视觉性一经艺术科学时期的艺术史家们提出,就先天地具有了“象征价值”,与图画性所表征的“形式价值”相互转化,也相互分离。视觉性是一种方法论,与图画性或“形式”互为补充,构成冲突,形成方法论的循环,使艺术史研究富于生机。“这种根本的分离造成分裂状况,由此激发视觉想象和图画构造,形成从形式到象征,从图像到‘话语’,从感知到理智,或者反向循环的真正机制。”[19](P31)图像学对视觉性“象征价值”及其文化表征的发掘嫁接了视觉理论与视觉文化两个领域。视觉文化的视觉性对于艺术史的视觉性是一个合法的继承。如果对这种继承关系发掘得不够深入,带来的混乱将危及整个视觉文化研究进程和学科体制的进一步建制。事实上,艺术史可为视觉文化提供方法论循h功能方面的借鉴;正如肖伟胜所言,艺术史“凭借其理论资源和方法论上的多元和开放性,奠定了一门新的学科,对视觉研究产生了极其重要的影响”[20]。对视觉性等基础概念的艺术史溯源,或可形成应对当下的视觉象征危机的一个重要方面。

参 考 文 献

[1] 周宪:《视觉文化读本》,南京:南京大学出版社,2013.

[2] Margaret Dikovistkaya. The Study of the Visual after the Cultural Turn. New York: MIT Press,2005.

[3] 吴琼:《视觉文化研究:谱系、对象与议题》,载《文艺理论研究》2015年第4期.

[4] Hal Foster. Vision and Visuality. Seattle:Bay Press,1988.

[5] Nicholas Mirzoeff.“On Visuality”,in Journal of Visual Culture,2006(5).

[6] 吴琼:《视觉性与视觉文化――视觉文化研究的谱系》,载《文艺研究》2006年第1期.

[7] 刘晋晋:《何谓视觉性?――视觉文化核心术语的前世今生》,载《美术观察》2011年第11期.

[8] 曾军:《从“视觉”到“视觉化”:重新理解视觉文化》,载《社会科学》2009年第8期.

[9] Michael Podro. The Manifold in Perception: Theories of Art from Kant to Hildbrand. Oxford: the Clarendon Press,1972.

[10] Conrad Fielder. On Judging Works of Visual Art. translated by Schafer-Simmern, Henry and Mood Fulmer. California:University of California Press, 1957.

[11] 张坚:《视觉形式的生命》,杭州:中国美术学院出版社,2004.

[12] Mitchell Benjamin Frank, Daniel Allan Adler. German Art History and Scientific Thought: Beyond Formalism.Great Britain: MPG Books Group,2012.

[13] 王艳华:《泽德尔迈尔研究》,南京大学博士论文,2015.

[14] 王艳华:《“触觉的”和“视觉的”二元风格范畴――李格尔艺术史论管窥》,载《东南大学学报》(哲学社会科学版)2014年第4期.

[15] 李格尔:《罗马晚期的工艺美术》,陈平译,北京:北京大学出版社,2010.

[16] Alois Riegl. Problems of style. Princeton:Princeton University,1992.

[17] E. H. Gombrich. Art and Illusion: A Study in the Psychology of Pictorial Representation. New York: Pantheon, 1960.

[18] 王耀中:《形式化视觉:美术实践与思维的取向》,载《中国艺术》2010年第4期.

[19] Davis Whitney. “Visuality and Pictoriality”, in Journal of Anthropology and Aethetics,2004(fall).

[20] 肖伟胜:《视觉文化的衍生c艺术史转向》,载《文艺研究》2011年第5期.

篇2

【关键词】机器视觉;饮料行业;生产效率

一、引言

如今产品质量问题越来越受到重视,对产品质量的检测是关系人们身体健康的前提,所以要从根本出发坚决杜绝不合格产品流入市场。机器视觉系统是解决这一问题的一个有效可行的措施,其利用高尖端的科技技术对产品进行检测,满足企业对产品的检测要求。本文针对实际可乐及啤酒企业生产线上存在的问题及要求,运用机器视觉系统加以分析解决,达到了良好的效果。

二、系统组成

机器视觉就是用机器代替人眼来做测量和判断。其特点是提高生产的产品质量和生产线自动化程度。尤其是在一些不适合于人工作业的危险工作环境或人眼难以满足要求的场合,常用机器视觉来替代人工视觉;同时在大批量工业生产过程中,用人工视觉检查产品质量效率低且精度不高,用机器视觉检测方法可以大大提高生产效率和生产的自动化程度。而且机器视觉易于实现信息集成,是实现计算机集成制造的基础技术。

机器视觉系统是指通过机器视觉产品(即图像摄取装置,分CMOS和CCD两种)将要检测的目标转换成数字量信号,这些数字量信号再传送给专用的图像处理系统(分嵌入式和视频卡方式),图像处理系统根据要检测的任务要求来设置检测任务。然后根据判别的结果来控制现场的设备动作。机器视觉系统在线质量检测是其最主要的应用之一,因为它是非接触测量,测量速度快且精度高,因而可以实时在线检测[2]。目前在饮料灌装生产线上,视觉产品获得了一定的应用,如娃哈哈、康师傅等。现今视觉产品分两大类:

1.嵌入式系统

嵌入式系统将全部的视觉系统所需要的硬件:CCD、内存、处理器以及通讯口压缩在一个“黑箱”式的模块里。优点是性价比高,使用方便,对环境的适应性强。嵌入式系统的发展速度最快,是机器视觉的发展趋势。

2.基于PC的系统

基于PC的系统是传统的机器视觉系统,硬件包括:CCD相机、视觉采集卡、PC等。目前居于市场的主导地位,但价格昂贵,对工业环境的适应性弱。

机器视觉检测系统结构图如图1所示。

三、检测系统设计

(一)企业存在的问题及相关设计要求

如今饮料行业在生产线上还处在用人眼来识别产品的质量问题,一般一个生产线上要安排3~4个人轮流检测,这样不但操作人员工作强度高而且质量也存在着严重的隐患,随着自动化水平的提高,生产线上的要求越来越苛刻,工艺越来越复杂,这种以人工来检测的方法势必不符合生产的需求,这样就要求出现一种更快更准的检测系统,即机器视觉检测系统。

1.饮料生产线检测要求

(1)检测瓶盖的高低状况;

(2)检测瓶内液位的高低;

(3)检测瓶子的标识状况;

(4)将不合格产品剔除;

(5)在触摸屏上显示信息;

(6)检测速度为800瓶/分。

2.饮料瓶在线检测要求

(1)啤酒瓶缺陷检测(包括瓶身裂纹、瓶口破损);

(2)啤酒瓶有无异物;

(3)啤酒瓶是否混入其它类型瓶;

(4)检测速度应达到500瓶/分。

3.灌装生产线检测要求

(1)灌装液位检测;

(2)异物检测。

(二)系统设计分析

根据要求对系统进行分析,在线检测系统构成由三台视觉相机分布成120度,这样可以检测到瓶体整体;还有一台装置位于瓶上部用于检测瓶盖缺陷及字体质量。应用4台相机保证完成对瓶体各个方向上的检测。这样便可以将检测到的不合格产品剔除出去。具体过程为,待检测产品通过光电传感器通过系统总线把信号传给视觉系统,通过视觉系统的软件设定可以实时的对产品进行检测,如发现不合格产品,传输给PLC控制信号,PLC动作,驱动剔除装置把不合格产品剔除到另一跳输送带上。

(三)算法

当然,对于不同的设备有不同的软件,也就有不同的算法。在这里介绍一种使用的算法-susan算法。它是一种直接利用图像灰度有效地进行边缘、角点检测和滤波等的低层次图像处理算法,它不仅方法简单,能在较强噪声中提取出目标的特征(边缘、角点),而且定位准确,并对局部噪声不敏感。

系统考虑到以后可能会出现的扩展与生产线的增加使输入输出点增加,这里用到的控制装置为西门子S7-200系列CPU224的PLC以便备用。具体设计图如图2所示。

其中,I0.1,I0.2分别为启动按钮与计数输入,I0.3,I0.4,I0.5分别指示输入,(这里没有考虑瓶子上方的相机,如果有要求增加一个I0.6输入点即可)Q0.0为系统输出,即剔除装置,Q0.1为系统指示灯。剔除装置的参数,输出力:100公斤,伸出速度:190mm/s,回程速度:250mm/s,尺寸:600×600×600(mm)。

四、结语

本文所提供的设计方案涉及的问题及所提到的工艺要求,通过机器视觉是完全可以实现的。机器视觉的未来是非常乐观的,相信在不断提高自己的前提下,随着国内自动化程度的提高,整个社会对产品质量要求的提升,不仅仅在食品饮料行业中,还有如电子与电气制造,机械工程,汽车,制造业等行业中对生产效率要求的提升,机器视觉这个新产品,新概念也会深入人心。

参考文献

[1]赵颖全,杨军.西门子机器视觉系统在PET饮料瓶缺陷检测中的应用[J].可编程控制器与工厂自动化, 2006(04).

[2]范祥,卢道华.机器视觉在工业领域中的研究应用[J].现代制造工程,2007(06):129-132.

[3]叶青松.基于机器视觉的工业检测研究——实时药九检测系统[D].江南大学,2008(03).

篇3

基于力学特性的检测方法

力学方法是利用食品与农产品的力学特性而进行检测的方法.利用声波和振动可以测出食品的品质指标以及检测待测物内部的组织状态。如利用声波透射法测定牛乳中脂肪的含量及大豆的水分:用超声波在物体中密度有差异处的反射波测定法,检查家禽的肉质,脂肪层厚度,里脊肉断面等。国外研究者研讨了多种基于动力学原理的农产品硬度检测方法,如机械冲击产生的声频信号检测,机械冲击相应的频率分析和水果冲击力检测。

基于电磁学特性的检测方法

电磁法分为主动特性法和被动特性法两种。主动特性法是利用待测物自身所具有的某种电磁学的测量方法;而被动特性法是将待测物置于电磁场内,利用其受电磁影响后反过来对外部环境施加影响的特性测量方法,例如核磁共振和电子自旋共振等。电磁@-TY法所需的设备相对比较简单,数据的获取和处理也比较容易,因此应用前景比较广阔。

基于光学特性的检测方法

紫外光谱法,可见光谱法,近红外光谱法是食品内部品质无损检测有效的方法。它是通过食品对光的吸收,散射,反射,透射等特性来确定食品内部品质的一种方法。该项技术可广泛用于谷物,果树等多种产品的化学成分分析,物理学品质分析,色度学品质分析。

基于放射线特性的检测方法

x射线,B射线和可见光都具有透射,反射和漫射等性质.x射线技术主要是利用穿透能力较弱的x射线作为光源进行透视探查的技术.因食品密度与金属等物质相比要小得多,因此所需x射线强度较小,通常称其为软x射线,其主要用于测定物体的密度差,判别内部缺陷和异物检出.如X射线图像用于检测鸡肉内部较深部位的骨头,但对表面骨头检测比较困难,而可见光图像则正相反.另外,软x射线还可以用来检测如柑橘中的皱皮等缺损现象,检测水果损伤缺陷,如苹果的水芯及损伤等。

机器视觉检测技术

机器视觉技术是用各种成像系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。机器视觉的最终目标就是使计算机能像人一样通过视觉观察并理解世界,具有自主适应环境等能力。在实现最终目标前,人们努力的中期目标是建立一种视觉系统,这个系统能够通过视觉敏感和反馈的某种程度从而智能的完成一项任务。随着图像处理技术的发展和计算机软硬件的开发,食品品质自动检测和分级领域应用机器视觉系统也变得越来越具有吸引力。应以斌等人以表面色泽与固酸比为柑橘成熟度指标,建立了用于柑橘成熟度检测的机器视觉系统,并建立了利用协方差矩阵和样本属于桔黄色和绿色的概率来判断柑橘成熟度的判别分析法,并以实测的固酸比值作为对照,对72枚柑橘样本进行了试验,柑橘成熟度的判别准确率达到91.67%。

生物传感器技术

21世纪是生命科学的世纪,而生物传感器横跨生物,化学,物理,信息等领域,结合了生物技术,材料技术,纳米技术,微电子技术等,是一门交叉学科的研究与应用技术,也是当今世界科学发展的前沿,引起各国的极大关注。生物传感器是由产生信号的敏感元件和处理信号的辅助仪器两部分组成的,敏感元件由生物活性单元(如酶,抗体,微生物,DNA等)和换能器组成,换能器可用来捕捉生物活性单元与目标物反应过程中的信号。生物活性单元引起的变化不同,信号处理的方法也不同。根据检测信号的不同.可将生物传感器分为电化学传感器,阻抗生物传感器,压电生物传感器和光生物传感器。与各种传统的化学传感器,物理传感器相比,具有选择性好,xA-析速度快,灵敏度高,不需进行样品预处理,可进行连续在线检测,成本低等特点。生物传感器在食品检测中的应用非常广泛,几乎渗透到各个方面,包括食品基本成分的检测,食品中添加剂的检测,有毒有害成分的检测等等。

展望

篇4

关键词:自动报靶系统;机器视觉;图像识别;图像配准;图像增强

中图分类号:TP212.12文献标识码:A文章编号:1009-3044(2008)33-1500-02

Summary on Automatic Target-scoring System

HUANG Ming, Wang Hao-hua, LIANG Xu

(School of Software Technology, Dalian Jiaotong University, Dalian 116028, China)

Abstract: An automatic target-scoring system is proposed, which based on machine vision. CCD camera was used to observe targets’ surface continuously. According to the feature and change of the images of targets’ surface observed by CCD, the technology of computer pattern recognition was used to detect the position of real shell in the target surface. Then the position was described in digital by coding target surface.In the process of observation, the technology on enhancement and matching of gray-scale, image matching technology in geometry, and wavelet transform algorithms were used to solve the effect on the accuracy of the identification due to changes in light, wind, and other factors. In practice, the system can achieve ideal accuracy, reduce the misstatements and omissions greatly. It was also high-precision, low-cost,and reliable system, can be used in military drill and shooting competitions. It will be meaningful and have good prospect.

Key words: automatic target-scoring system; machine vision; imagine recognition; imagine matching; imagine enhancement

1 引言

在专业与非专业军事训练中,实弹射击是最基本的训练项目。传统的实弹射击采用人工报靶。传统人工报靶主要有四个方面的不足:1)依赖于报靶者的判靶经验,效率比较低。2)当靶板上弹着点多时,报靶员很难识别新旧弹孔,报靶误差极大,直接影响射击训练质量。3)射击未完全结束时,补靶员现身靶壕外或在补靶员察看靶板报靶和补靶时,射击位管理者若稍有疏忽,就易出现枪支走火,造成人员伤亡,安全隐患极大。4)容易出现弄虚作假的现象。为了克服传统人工报靶有不足和满足军事训练现代化需求,提高部队射击水平,自动报靶的研究和应用对推进军队现代化将具有普遍意义。本文介绍基于机器视觉的自动报靶系统的基本原理和关键技术,该系统使用图像识别,图像配准和图像增强等技术,在实际的训练和考核中能够发挥较好的作用,有良好的应用前景。

2 图像与图像处理的概念

图像(Image)就是采用各种观测系统获得的,能够为人类视觉系统所感觉的实体。图像的范围非常广泛,包括:各类图片(Picture),如照片、X光片;各类光学图像,如电影、电视画面;人们的有形想像以及外部描述,绘画、绘图;等等。图像处理技术可分为两大类,即模拟图像处理和数字图像处理。

图1 通用的数字图像处理系统框图

数字图像处理是指,使用数字计算机对图像进行加工与处理。传统的数字图像处理技术主要集中在图像的获取、变换、增加、恢复(还原)、压缩编码、分割与边缘提取等方面;随着计算机与信息技术的发展,图像特征分析、图像配准、图像融合、图像分类、图像识别、基于内容的图像检索与图像数字水印等领域取得进展,这些图像处理技术具有智能化功能,因而称之为智能图像处理技术。

数字图像处理方法大致可分为两大类,即空域法和变换域法。1)空域法是把图像看作是平面中各个像素组成的集合,然后直接对这个二维函数进行相应的处理。2)变换域法是首先对图像进行正交变换,得到变换域系数矩阵,然后再进行各种处理,处理后再将其反变换到空间域,得到处理结果。

3 基于机器视觉的自动报靶系统

此类产品是以计算机为图像识别和处理理论为基础,它没有在靶体上安装任何光电传感设备。在实弹射击过程中,它使用摄像头对常规的标准靶画面进行采集,根据采集来的靶图像的特点和变化,利用计算机图像识别(Image Recognition)和处理技术找出靶图像中的真实弹点,使用这种自动报靶系统就好像是使用了一个“电子眼”,它会代替报靶人员的眼睛,在整个实弹射击过程中不间断的对靶画面进行观测。对不同靶位上的每一次射击都采用相同的算法、规则和精度来判定,不存在受主观因素影响的问题。比手工报靶更客观,更公正,有较高的可用性。

实现此系统的软件核心技术主要是数字图像处理技术中的计算机图像识别、图像配准以及图像增加等技术。在观测过程中,采用图像灰度配准与增强技术以及图像的几何配准技术来解决由于光照变化、大风等干扰因素对识别精度的影响。在此过程中,还要由其他优秀算法来配合,提高性能与精度,例如小波变换等。

3.1 基于机器视觉的自动报靶系统的实现原理

机器视觉的概念是利用CCD摄像机等设备代替人眼,结合计算机视觉、数字图像处理、和计算机控制技术实现对摄像机所摄取的图像的分析过程。

其核心原理是:在整个实弹射击的过程中,利用CCD摄像机不间断地对靶面进行观测,根据采集的靶面图像的特点和变化,利用计算机图像识别技术检测靶面图像中的真实弹点,然后通过弹点在靶面图中的位置来对着弹点区域进行编码。在观测过程中,采用图像灰度配准与增强技术以及图像的几何配准技术来解决由于光照变化、大风等干扰因素对识别精度的影响。在此过程中,还要由其他优秀算法来配合,提高性能与精度,例如小波变换等。

通过以上论述可见,本系统由图像采集设备、图形采集卡、图形处理软件、计算机及显示部分组成。具体的配置如下:购买一个CCD摄像头、一块图形采集卡、一台普通计算机及编写相应的软件,其中图形采集卡可选择大恒公司或杭州海康威视数字技术有限公司生产的。为完成本系统的功能与性能指标,主要工作集中在软件的编程与实现上。

3.2 基于机器视觉的自动报靶系统的核心技术

实现本系统的软件核心技术主要是数字图像处理技术中的计算机图像识别、图像配准以及图像增加等技术。

3.2.1 图像识别技术

图像识别是对图像进行预处理后,再经分割和描述,提取有效的特征,进而加以判决分类的图像处理技术。

一个图像识别系统可分为三个主要部分,第一部分是图像信息的获取,对图像识别来说就是把图片、底片、文字图形等用采集设备变换为电信号。第二部分是信息的特征提取,它的作用在于把调查了解到的数据材料进行加工、整理、分析、归纳以去伪存真,抽出能反映事物本质的特征。第三部分是判决,做出结论的过程,与判决的方式密切相关。

图2 图像识别系统框图

在图像识别的发展过程中,出现了四类有代表性的理论和方法。即统计图像识别方法、句法(或结构)图像识别方法、模糊图像识别方法和神经网络图像识别方法。

3.2.2 图像配准技术

图像配准是指同一目标的两幅(或两幅以上)图像在空间位置上的对准。图像配准的技术过程称为图像匹配(Image matching)或图像相关(Image correlation)。图像配准可分为半自动配准和全自动配准。

全自动配准是直接利用计算机完成图像配准工作,大致可分为基于灰度与基于特征两类。基于灰度的方法有:空间相关法、不变矩阵、频域相关法。此方法具有精度高的优点,但计算复杂度高。基于特征的方法有两个重要环节:特征提取和特征匹配。本方法与小波变换等结合,进一步提高了图像配准的精度与运算速度。

3.2.3 图像增加技术

图像增加的目的有两个:一是改善图像的视觉效果,提高图像成分的清晰度;二是使图像变的更有利于计算机处理。

图像增加的方法一般分为空间域和变换域两大类。空间域方法直接对图像像素的灰度进行处理。变换域方法在图像的某个变换域中对变换系统进行处理,然后通过逆变换获得增加图像。常用的图像增加方法有:空间域单点增加、图像平滑、图像锐化、图像滤波与图像增加。

4 总结与展望

运用数字图像处理技术的自动报靶系统,在国内、外都有相应的研究,但实际系统的功能需要与性能指标各有差异,所应用的原理和方法手段不近相同,所以可从另外方面进行开发,拓展数字图像处理的领域,满足不同系统的不同需要。

在本系统中,力求将其它优秀的算法,嫁接到图像处理中,以提高图像处理的性能与精度,在我军某坦克基地的实际应用中,达到了预期的目标。由于本系统是一室外项目,光照变化、大风等干扰因素会对识别精度造成一定影响,还需通过一些方法或算法来弥补这些不足。本系统所要研究报靶系统所采用的方法不仅有着精度高的优点,而且完全满足部队实弹射击需求,稍作改动之后还可用于运动类报靶,具有广阔的应用前景和研究价值。

参考文献:

[1] 张军,颜树华,徐琰.自动报靶系统的研究进展[J].激光与红外,2006,36(12):1152- 1154.

[2] 杨子宁.光电自动报靶系统的设计与实现[J].科学技术与工程, 2007,7(1):102-104.

[3] 陈海峰.基于图像处理技术的自动报靶系统研究[D].南京航空航天大学,2005.

篇5

关键词: 人工智能 发展过程 研究热点 应用领域 未来发展

一、人工智能概述

人工智能(Artificial Intelligence,简称AI),也称机器智能,它是计算机科学、控制论、信息论、神经生理学、心理学、语言学等多种学科互相渗透而发展起来的一门综合性学科。从计算机应用系统角度来看,人工智能是研究如何制造出智能机器或智能系统,实现模拟人类智能活动的能力,以延伸人们智能的科学。人工智能是一门交叉学科,是一门涉及心理学、认知科学、思维科学、信息科学、系统科学和生物科学等多学科的综合性技术学科,目前已在知识处理、模式识别、自然语言处理、博弈、自动定理证明、自动程序设计、专家系统、知识库、智能机器人等多个领域取得举世瞩目的成果,并形成了多元化的发展方向。

二、人工智能的发展过程

人工智能经历了三次飞跃阶段:第一次是实现问题求解,代替人完成部分逻辑推理工作,如机器定理证明和专家系统;第二次是智能系统能够和环境交互,从运行的环境中获取信息,代替人完成包括不确定性在内的部分思维工作,通过自身的动作,对环境施加影响,并适应环境的变化,如智能机器人;第三次是智能系统,具有类人的认知和思维能力,能够发现新的知识,去完成面临的任务,如基于数据挖掘的系统。

三、人工智能的研究热点

AI研究出现了新的,这一方面是因为在人工智能理论方面有了新的进展,另一方面是因为计算机硬件突飞猛进地发展。随着计算机速度的不断提高、存储容量的不断扩大、价格的不断降低,以及网络技术的不断发展,许多原来无法完成的工作现在已经能够实现。目前人工智能研究的三个热点是:智能接口、数据挖掘、主体及多主体系统。

1.智能接口技术是研究如何使人们能够方便自然地与计算机交流。为了实现这一目标,要求计算机能够看懂文字、听懂语言、说话表达,甚至能够进行不同语言之间的翻译,而这些功能的实现又依赖于知识表示方法的研究。因此,智能接口技术的研究既有巨大的应用价值,又有基础的理论意义。目前,智能接口技术已经取得了显著成果,文字识别、语音识别、语音合成、图像识别、机器翻译及自然语言理解等技术已经开始实用化。

2.数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的、人们事先不知道的、但是又潜在有用的信息和知识的过程。数据挖掘和知识发现的研究目前已经形成了三根强大的技术支柱:数据库、人工智能和数理统计。主要研究内容包括基础理论、发现算法、数据仓库、可视化技术、定性定量互换模型、知识表示方法、发现知识的维护和再利用、半结构化和非结构化数据中的知识发现及网上数据挖掘等。

3.主体系统是具有信念、愿望、意图、能力、选择、承诺等心智状态的实体,比对象的粒度更大,智能性更高,而且具有一定的自主性。主体试图自治、独立地完成任务,而且可以和环境交互,与其他主体通信,通过规划达到目标。多主体系统主要研究在逻辑上或物理上分离的多个主体之间进行协调智能行为,最终实现问题求解。多主体系统试图用主体来模拟人的理,主要应用在对现实世界和社会的模拟、机器人及智能机械等领域。目前对主体和多主体系统的研究主要集中在主体和多主体理论、主体的体系结构和组织、主体语言、主体之间的协作和协调、通信和交互技术、多主体学习及多主体系统应用等方面。

四、人工智能的应用领域

1.专家系统

专家系统是一个具有大量专门知识与经验的程序系统,专家系统存储着某个专门领域中经过事先总结、分析并按某种模式表示的专家知识,以及拥有类似于领域专家解决实际问题的推理机制。专家系统的开发和研究是人工智能中最活跃的一个应用研究领域,涉及社会各个方面。

2.知识库系统

知识库系统也叫数据库系统,是储存某学科大量事实的计算机软件系统,它可以回答用户提出的有关该学科的各种问题。知识库系统的设计是计算机科学的一个活跃的分支。为了有效地表示、储存和检索大量事实,已经发展出了许多技术。但是在设计智能信息检索系统时还是遇到很多问题,包括对自然语言的理解,根据储存的事实演绎答案的问题、理解询问和演绎答案所需要的知识都可能超出该学科领域数据库所表示的知识。

3.物景分析

计算机视觉已从模式识别的一个研究领域发展为一门独立的学科。视觉是感知问题之一。整个感知问题的要点是形成一个精练的表示,以表示难以处理的、极其庞大的未经加工的输入数据。最终表示的性质和质量取决于感知系统的目标。机器视觉的前沿研究领域包括实时并行处理、主动式定性视觉、动态和时变视觉、三维景物的建模与识别、实时图像压缩传送和复原、多光谱和彩色图像的处理与解释等。机器视觉已在机器人装配、卫星图像处理、工业过程监控、飞行器跟踪和制导及电视实况转播等领域获得极为广泛的应用。

4.模式识别

模式识别就是识别出给定物体所模仿的标本或标识。计算机模式识别系统能够弥补计算机对外部世界感知能力低下的缺陷,使计算机能够通过感官接受外界信息,识别和理解周围环境。模式识别在二维的文字、图形和图像的识别方面已取得许多成果,在三维景物、活动目标的识别和分析方面是目前研究的热点,同时它还是智能计算机和智能机器人研究的十分重要的基础。此外,人工智能还在机器视觉、组合调度问题、自然语言理解、机器学习、博弈、定理证明等研究应用领域发挥着重要作用。可以说人工智能已深入各行各业,对人类社会作出了巨大的贡献。

5.机器人

机器人学所研究的问题,从机器人手臂的最佳移动到实现机器人目标的动作序列的规划方法,无所不包。尽管已经建立了一些比较复杂的机器人系统,但是现在工业上运行的机器人都是一些按预先编好的程序执行某些重复作业的简单装置,大多数工业机器人是“盲人”。机器人和机器人学的研究促进了许多人工智能思想的发展。智能机器人的研究和应用体现出广泛的学科交叉,涉及众多课题。机器人已在工业、农业、商业、旅游业、空中和海洋及国防等多个领域获得越来越普遍的应用。

五、人工智能的未来发展

目前绝大多数人工智能系统都是建立在物理符号系统假设之上的。在尚未出现能与物理符号系统假设相抗衡的新的人工智能理论之前,无论从设计原理还是从已取得的实验结果来看,Soar在探讨智能行为的一般特征和人类认知的具体特征的艰难征途上都取得了有特色的进展或成就,处在人工智能研究的前沿。上世纪80年代,以NewellA为代表的研究学者总结了专家系统的成功经验,吸收了认知科学研究的最新成果,提出了作为通用智能基础的体系结构Soar。目前的Soar已经显示出强大的问题求解能力。在Soar中已实现了30多种搜索方法,实现了若干知识密集型任务(专家系统),如RI等。对于人工智能未来的发展方向,专家们通过一些前瞻性研究可以看出未来人工智能可能会向以下几个方面发展:模糊处理、并行化、神经网络及其情感。

目前,人工智能的推理功能已获突破,学习及联想功能正在研究之中,下一步就是模仿人类右脑的模糊处理功能和整个大脑的并行化处理功能。人工神经网络是未来人工智能应用的新领域。未来智能计算机的构成,可能就是作为主机的冯・诺依曼型机与作为智能的人工神经网络的结合。研究表明:情感是智能的一部分,而不是与智能相分离的,因此人工智能领域的下一个突破可能在于赋予计算机情感能力。情感能力对于计算机与人的自然交往至关重要。

根据这些前瞻性研究我们也可以通过想象模拟勾画出人工智能未来发展的三个阶段。

1.融合时期(2010―2020年)

(1)用语言操纵和控制的智能化设备十分普及,像远程医疗这样的服务也更为完善。

(2)以计算机和互联网为基础的远程教育十分普及,在家就可以上大学。

(3)在身体里植入许多不同功能的芯片已不新奇。

(4)量子计算机和DNA计算机会有更大发展,新材料不断问世。

(5)抗病毒程序可以防止各种非自然因素引发灾难。

2.自信时期(2020―2030年)

(1)智能化计算机和互联网既能自我修复,也能自行进行研究、生产产品。

(2)一些新型材料的出现,促使智能化向更高层次发展。

(3)有了高水准智能化技术的协助,人们“定居火星梦”可能性大增。

3.非神秘时期(2030―2040年)

(1)新的全息模式世界将取代原有几何模式的世界。

(2)人们对一些目前无法解释的自然现象会有更完善的解释。

(3)人工智能可以模仿人类的智能,因此会出现有关法律来规范这些行为。

篇6

关键词:立体匹配;初始视差;能量函数;置信传播;快速收敛

中图分类号: TP391.413

文献标志码:A

Abstract: Concerning the high computation complexity and low efficiency in traditional stereo matching method based on Belief Propagation (BP), a fast convergent stereo matching algorithm based on Sum of Absolute Difference (SAD) algorithm and BP algorithm was proposed. Firstly, the SAD matching method was used as a similarity decision criterion to determine the initial disparity map. When the energy function was constructed, the initial parallax map was used as a limit of function to get the optimization of disparity distribution by BP. And when calculating the confidence level of each pixel in the optimization process, the algorithm only utilized the information translated from the neighboring pixels in an adaptive support window, while ignoring the impact of the pixels beyond the window, then the nodes of BP were reduced and the convergence speed was improved. The experimental results show that the proposed algorithm can reduce matching computation time by 50%-60% and improve efficiency while maintaining the matching accuracy, and the proposed algorithm lays the foundation for the realtime applications.

Key words: stereo matching; initial disparity; energy function; Belief Propagation (BP); fast convergence

0引言

立体匹配的目的是寻找相同场景不同视角图像中像素点的对应关系,消除立体匹配的歧义性和模糊性是机器视觉比较困难的技术之一。随着机器视觉的发展,立体匹配旨在获取高质量的视差图,这已经成为了重要的研究内容,并且取得了很大的进展,出现了许多经典的算法,根据优化方式不同可分为基于区域的算法(localbased algorithm)和基于全局的算法(globalbased algorithm)两种方法[1-2]。

区域立体匹配算法主要是采用局部优化方法进行视差值估计,它主要包括像素灰度绝对误差和(Sum of Absolute Difference, SAD)、像素灰度平方差别之和(Sum of Squared Differences, SSD)以及归一化互相关(Normalized Cross Correlation, NCC)等算法。区域立体匹配算法具有匹配效率高、速度比较快、能满足实时性要求、占内存少等优点,但是其获取的视差精确性较低、抗噪性弱,对弱纹理区域、重复纹理区域、视差不连续区域和遮挡区域匹配效果不理想。

全局算法主要是采用了全局的优化理论方法估计视差,建立全局能量函数,通过最小化全局能量函数得到最优视差值。主要的算法有置信传播(Belief Propagation, BP)、图割(Graph Cut, GC)、动态规划(Dynamic Programming, DP)等算法。相对局部匹配算法,全局算法具有匹配精度高的特点,但是匹配的速度较慢。

其中具有代表性的BP算法[3-9],将待匹配空间看作是马尔可夫随机场,使用贝叶斯方法来建立模型,然后利用消息传递、迭代优化原理寻找整幅图像的全局能量最优值,从而估计视差值。传统的BP算法需要遍历图像中各节点的取值范围,不断迭代更新消息,运算复杂且巨大,计算时间较长。因此本文提出一种基于SAD和BP的快速收敛的立体匹配算法,有效地减少消息迭代更新的节点数并使得更新的消息趋于收敛,降低运算的复杂度,从而提高算法运行的效率。

1置信传播算法

置信传播算法是将待匹配空间看作是马尔可夫随机场,把图像中的像素点与马尔可夫随机场中的节点一一对应起来,并采用贝叶斯最大后验概率估计方法对马尔可夫网络中节点间的消息进行迭代和更新,求出迭代后节点的最大后验概率及置信度信息,再根据节点的置信度得到视差图。节点间的消息传递示意图如图1所示。

从图3中对比不同算法在Tsukuba上的实验结果可以得到,本文算法结果误差相比传统BP算法的误差更小,在弱纹理和重复纹理区域具有更好的效果;与改进的SAD算法结果误差相当,保持了较高精度的匹配效果。但是相对于传统BP算法,本文算法在运算时间上有优势,图5为本文算法实验过程中Tsukuba测试图未收敛点数的情况,从图5中可得出随着迭代次数的增加,图像的大部分像素点已经收敛,说明需要更新迭代的像素点数是急剧减少,使得运算时间大大降低。而传统算法每一次迭代都要遍历所有的像素点,使得运算时间随迭代次数成倍增加,效率比较低。为更直接地表现传统BP算法和本文算在运行时间上的对比,本文采用归一化时间对数图表进行了图示,如图6所示。图6中“系列1”和“系列2”分别为本文算法和传统BP算法的归一化时间序列,由图6可知:在保持相似匹配精度的基础上,本文算法的运行时间在高迭代次数(30次以上)时降低了50%~60%,大大地提高了匹配效率,为实时匹配应用打下了基础。

4结语

本文通过将局部算法SAD和传统的置信传播(BP)算法相结合,提出了一种新的快速收敛的立体匹配算法,它在保持良好的算法结果的同时,也很好地改善了传统算法存在的运算次数较多、效率低下的问题。通过实验表明,在置信传播建立全局能量函数时,加入局部算法SAD的结果,可以减少视差搜索的范围;在置信传播优化过程中,

引入了置信度和优化视差值收敛的概念,简化了传统算法视差值的优化过程

引入将置信度和优化视差值的收敛的概念,降低了传统算法视差值的优化过程此处语句不通顺,是降低了优化过程吗?还是增强了?请作相应调整。,从而在两方面实现了快速的立体匹配,为三维重建、路径规划以及机器导航等提供了较为精确的视差图。

参考文献:

[1]ZHAI Z. The research of stereo matching algorithm [D]. Beijing: Beijing Institute of Technology, 2010.(翟振刚.立体匹配算法研究[D].北京:北京理工大学,2010.)

[2]LIU Z. Matching algorithm research for stereo vision [D]. Beijing: Graduate University of Chinese Academy of Sciences, 2011.(刘志花.面向立体视觉的匹配算法研究[D].北京:中国科学院研究生院,2011.)

[3]SUN J, ZHENG N N, SHUM H Y. Stereo matching using belief propagation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2003, 25(7): 787-800.

[4]IHLRE A T, FISCHER J W III, WILLSKY A S. Loopy belief propagation: convergence and effects of message errors [J]. The Journal of Machine Learning Research, 2005, 6: 905-936.

[5]WEISS Y, FREEMAN W T. On the optimality of solutions of the maxproduct beliefpropagation algorithm in arbitrary graphs [J]. IEEE Transactions on Information Theory, 2001, 47(2): 736-744.

[6]YANG Q, WANG L, YANG R. Stereo matching with colorweighted correlation, hierarchical belief propagation, and occlusion handling [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(3): 492-504.

[7]KLAUS A, SORMANN M. Segmentbased stereo matching using belief propagation and a selfadapting dissimilarity measure [C]// Proceedings of the 2006 IEEE International Conference on Pattern Recognition. Washington, DC: IEEE Computer Society, 2006: 15-18.

[8]FELZENSZWALB P, HUTTENLOCHER D P. Efficient belief propagation for early vision [J]. International Journal of Computer Vision, 2006, 70(1): 41-54.

[9]TAPPEN M F, FREEMAN W T. Comparison of graph cuts with belief propagation for stereo, using identical MRF parameters [C]// Proceedings of the 2003 IEEE International Conference on Computer Vision. Washington, DC: IEEE Computer Society, 2003: 900-906.

[10]LI C M, XU C Y, GUI C F.Level set evolution without reinitialization: a new variational formulation [C]// Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2005: 430-436.

[11]ZHANG H, LIU Y, YANG Y. Stereo matching algorithm based on fastconverging belief propagation [J]. Journal of Computer Applications, 2013, 33(2): 484-486.(张红颖,刘奕萱,杨宇.快速收敛的置信度传播立体匹配算法[J].计算机应用,2013,33(2):484-486.)

[12]AMBROSCH K, KUBINGER W. Accurate hardwarebased stereo vision [J]. Computer Vision and Image Understanding, 2010, 114(11): 1303-1316.

[13]ZHANG Y, LOU B. An algorithm fusion of adaptive supportweight approach and belief propagation for stereo matching [J]. Journal of Hangzhou Dianzi University, 2012, 32(2): 10-13.(张永平,楼斌.融合自适应权重和置信传播的立体匹配算法[J].杭州电子科技大学学报,2012,32(2):10-13.)

[14]CAO Y, DA F. A stereo matching algorithm based on selective belief propagation [J]. Journal of Southeast University: Natural Science Edition, 2011, 41(5): 1013-1018.(曹云云,达飞鹏.一种具有选择性的置信度传播立体匹配算法[J].东南大学学报:自然科学版,2011,41(5):1013-1018.)

篇7

基于组件的客户反应行为管理研究

基于GSM短消息的解码方法及其程序实现

凌阳单片机在指纹识别系统中的应用

信息技术与课程整合教学的研究与实践

基于并行算法的生命游戏分解策略的性能分析

科技论文二次退修的成因及避免对策

案例教学法在《PHOTOSHOP平面设计》课程中的运用

重点学科管理系统的网上实现

浅谈信息素养与信息技术教育

濒危植物长柄双花木生态遗传分化的同工酶分析

江西省环境污染物超标原因分析

求包含多边形的最小正三角形的遗传算法

论新技术支持下的数学概念教学

偏导数与方向导数的关系

异步电动机直接转矩控制系统设计

碘酸钾存在下吡啶的极谱平行催化氢波研究

有机化学实验“绿色化”教改浅谈

“协作——探究式”实验教学模式的应用——关于分析化学设计性实验教学改革的探讨

江西高师体育教育专业课程设置的比较研究

四种水生植物对富营养化水体中磷去除效果的研究

不同播栽期对清香型烤烟新品系C_2生长发育及产量质量的影响

多自由度系统微振动数态的仿真实现研究

一类二阶非线性奇摄动方程的激波解

基于模糊综合评判的生物医学工程实验教学质量评估

光电耦合器典型应用电路剖析

稀土永磁同步电动机在油田抽油机上的应用与分析

多发射处理器的指令调度算法研究

铁路货运营销综合信息平台研究

基于BNF的OBO规范化和OWLDL转换研究

提高计算机等级考试C++通过率的几点尝试

医学信息中心博客在基层医学科研中的作用

浅析我国古代村落的规划思想——以廉江市坡头村为例

用于生物柴油生产的非均相催化剂研究进展

江西省少数民族地区中学体育课和体育活动开展影响因素分析

新课程标准理念下掷标枪的教学策略研究

对体育锻炼和认知干预提高贫困大学生心理健康的探究

安福县城全民健身活动条件资源整合与开发对策的调查研究

阿尔采末病发病机制研究进展新视点

克林霉素不良反应进展

电晕极化偶氮化合物薄膜倍频弛豫特性研究

硅胶负载硅钨酸催化合成丁酮乙二醇缩酮

链烷烃偏心因子的定量构效关系研究

三唑磷降解菌的筛选、鉴定及其系统发育分析

被动吸烟对小鼠运动能力的影响

渭干河-库车河三角洲日照时数变化特征

印刷线路板厂有机显影废水处理方法研究

基于DHT11的无线温湿度传感器网络节点的设计

基于Wup的语义相似度计算的全局本体语义分析方法

基于MATLAB的BP神经网络模型在地震预报中的应用

变精度粗糙集模型及其一个性质的推广

篇8

关键词:决策支持系统 人工智能 专家系统

一、智能决策技术概述

1.决策支持系统的形成

随着计算机技术和应用的发展,如科学计算、数据处理、管理信息系统的发展以及运筹学和管理科学的应用,为决策支持系统的形成打下了基础。决策支持系统(Decision Support System—DDS)是80年代迅速发展起的新型计算机学科。70年代初由美国M.S.Scott Morton在《管理决策系统》一文中首先提出决策支持系统的概念。

DSS实质上是在管理信息系统和运筹学的基础上发展起来的。管理信息系统重点在对大量数据的处理。运筹学在运用模型辅助决策体现在单模型辅助决策上。随着新技术的发展,所需要不得不解决的问题会愈来愈复杂,所涉及的模型会愈来愈多,模型类型也由数学模型扩充数据处理模型。模型数量也愈来愈多。这样,对多模型辅助决策问题,在决策支持系统出现之前是靠人来实现模型间的联合和协调。决策支持系统的出现就是要解决由计算机自动组织和协调多模型运行,对大量数据库中数据的存取和处理,达到更高层次的辅助决策能力。决策支持系统的新特点就是增加了模型库和模型库管理系统,它把众多的模型(数学模型和数据处理模型以及更广泛的模型)有效地组织和存储起来,并且建立了模型库和数据库的有机结合。这种有机结合适应人机交互功能,自然促使新型系统的出现,即DDS的出现。它不同于MIS数据处理,也不同于模型的数值计算,而是它们的有机集成。它既有数据处理功能又具有数值计算功能。

决策支持系统概念及结构。决策支持系统是综合利用大量数据,有机组合众多模型(数学模型与数据处理模型等),通过人机交互,辅助各级决策者实现科学决策的系统。

DSS使人机交互系统、模型库系统、数据库系统三者有机结合起来。它大大扩充了数据库功能和模型库功能,即DSS的发展使管理信息系统上升到决策支持系统的新台阶上。DSS使那些原来不能用计算机解决的问题逐步变成能用计算机解决。

2.人工智能概念和研究范围

(1)人工智能定义。由计算机来表示和执行人类的智能活动(如判断、识别、理解、学习、规划和问题求解等)就是人工智能。人工智能的研究在逐步扩大机器智能,使计算机逐步向人的智能靠近。

(2)人工智能的研究范围。人工智能研究的基本范围有:问题求解、逻辑推理和定理证明、自然语言处理、自动程序设计、学习、专家系统、机器人学、机器视觉、智能检索系统、组合高度问题、系统与表达语言等;其主要研究领域有:自然语言处理、机器人学、知识工程。

自然语言处理:语音的识别与合成,自然语言的理解和生成,机器翻译等。

机器人学:从操纵型、自动型转向智能型。在重、难、险、害等工作领域中推广使用机器人。

知识工程:研究和开发专家系统。目前人工智能的研究中,最接近实用的成果是专家系统。专家系统在符号推理、医疗诊断、矿床勘探、化学分析、工程设计、军事决策、案情分析等方面都取得明显的效果。

3.决策支持新技术

(1)数据仓库的兴起和概念。数据仓库(Data Warehouse—DW)的概念是Prism Solutions公司副总裁W.H.Inmon在1992年出版的书《建立数据仓库》(Building the Data Warehouse)中提出的。数据仓库的提出是以关系数据库,并行处理和分布式技术的飞速发展为基础,它是解决信息技术在发展中一方面拥有大量数据,另一方面有用信息却很贫乏(Data rich—Information poor)这种不正常现象的综合解决方案。

W.H.Inmon在《建立数据仓库》一书中,对数据仓库定义为:数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理中决策制定过程。

传统数据库用于事务处理,也叫操作型处理,是指对数据库联机进行日常操作,即对一或一组记录的查询和修改,主要为企业特定的应用服务的。用户关心的是响应时间,数据的安全性和完整性。数据仓库用于决策支持,也称分析型处理,用于决策分析,它是建成立决策支持系统的基础。

(2)数据仓库的特点。数据仓库是面向主题的:主题是数据归类的标准,每一个主题基本对应一个宏观的分析领域。

数据仓库是集成的:数据进入数据仓库之前,必须经过加工与集成。对不同的数据来源进行统一数据结构和编码。统一原始数据中的所有矛盾之处,如字段的同名异义,异名同义,单位不统一,字长不一致等。总之将原始数据结构作一个从面向应用到面向主题的大转变。

数据仓库是稳定的:数据仓库中包括了大量的历史数据。数据经集成进入数据仓库后是极少或根本不更新的。

数据仓库是随时间变化的:数据仓库内的数据时限在5-10年,故数据的键码包含时间项,标明数据的历史时期,这适合DSS进行时间趋势分析。

数据仓库中数据很大:通常的数据仓库的数据量为10GB级,大型的是一个TB级数据量。数据中索引和综合数据占2/3,原始数据占1/3。

数据仓库软、硬件要求:需要一个巨大的硬件平台和一个并行的数据库系统。

(3)数据开采的概念及方法。1995年在加拿大召开了第一届知识发现(Knowledge Discovery in Database—KDD)和数据开采(Data Mining—DM)国际学术会议以后,“数据开采”开始流行,它是“知识发现”概念的深化,知识发现与数据开采是人工智能、机器学习与数据库技术相结合的产物。KDD一词是在1989年8月于美国底特律市召开的第一届KDD国际学术会议上正式形成的。

知识发现被认为是从数据中发现有用知识的整个过程。数据开采被认为是KDD过程中的一个特定步骤,它用专门算法从数据中抽取模式。

数据开采的主要方法和技术有:信息论方法、集合论方法、仿生物技术、公式发现、统计分析方法及其它方法。

二、智能决策技术原理

篇9

ACM委员会于2011年3月10日公布,2010年度图灵奖授予莱斯利•瓦里安特教授,表彰他在机器学习理论以及计算机科学诸多方面的奠基性贡献。

2011年6月5日,在加州圣荷塞会议中心ACM召开的计算研究联合大会FCRC 2011开幕日上,为莱斯利•瓦里安特举办了颁奖晚宴,奖金为25万美元,仍由Intel和Google赞助。

1 学术生平

莱斯利•瓦里安特(Leslie Gabriel Valiant) 1949年3月28日生于英国。1970年在剑桥大学国王学院获数学学士学位,1973年在伦敦帝国学院获计算机科学毕业文凭,1974年获华威克大学(University of Warwick)计算机科学博士学位。

1973年至1974年,莱斯利在卡内基-梅隆大学作

访问学者。1974年至1976年在里兹大学、1977年至1982年在爱丁堡大学、1982年至今在哈佛大学任教。从2001年起,担任哈佛工程与应用科学学院计算机科学与应用数学的杰弗逊(T. Jefferson Coolidge)讲席教授。他是英国皇家学会会员、美国科学院院士。

2 三大贡献

莱斯利的第一个贡献是在机器学习领域。1984年他在《ACM通讯》上发表了论文“习能力理论”(A Theory of the Learnable),在论文中提出了PAC模型,即“概率近似正确”(Probably Approximately Correct)的学习模型。PAC模型使20世纪50年代诞生的机器学习领域第一次有了坚实的数学基础,从而清除了学科发展的障碍,对于机器学习、人工智能和其他计算领域(如自然语言处理、手写识别、机器视觉等)都产生了重要影响。该模型可解决信息分类问题,为此学习算法会根据过去的经验而设计一个概率假设,并将此假设作为判断依据。PAC模型可最大限度地降低泛化(Over-generalization)带来的错误,这就是为什么它被称为“概率近似正确”的原因。

莱斯利的第二个贡献是在计算复杂性领域。1986年莱斯利和瓦兹拉尼在《理论计算机科学》上,题目是“NP同检测唯一解一样容易”(NP is as easy as detecting unique solutions),提出了瓦里安特-瓦兹拉尼定理(ValiantCVazirani theorem),合作者瓦兹拉尼(Vijay Virkumar Vazirani)是印度裔美国计算机科学家,佐治亚技术学院教授。

该定理可叙述为:UNIQUE-SAT  P  NP = RP。其中,SAT表示布尔可满足性问题(Boolean Satisfiability Problem),指是否存在一组变量赋值,用来解决给定的布尔方程式。NP是“非确定性的多项式复杂程度”(Non-deterministic Polynomial)问题。

该定理的含义:如果UNIQUE-SAT 存在一个多项式时间算法P(polynomial time algorithm),那么NP=RP。这里的RP是随机的多项式时间(randomized polynomial time),给出问题的复杂性类。该定理属于决定性问题,是第一个被证明的NP完备问题。这个特性是概率图灵机(Probabilistic Turing machine)特有的性质,它表明即使可满足赋值数很小,SAT这个NP完备问题仍然是很难的问题。

莱斯利的第三个贡献是在计算神经学领域。1994年他在牛津大学出版社出版了《思维的电路》(Circuits of the Mind)一书,他为大脑设计了一个数学模型,并将它与复杂的认知功能建立了关联。他在书中描述了一个称为Neuroids的模型,支持广泛的、多种多样的、与记忆、学习、推理、搜索等相关的计算任务,不必使用更多资源就可以直接按神经系统的方法完成这些任务。

此外,1979年他提出的上下文无关分析算法,至今仍是最快的算法之一。在并行与分布式计算领域,1990年他提出著名的BSP并行模型,至今仍是这一学科的基本文献。

3 颁奖评语

ACM的颁奖词高度评价了莱斯利•瓦里安特教授30年来对理论计算科学的基础性工作。鉴于他“对众多计算理论,包括PAC学习、枚举复杂性、代数计算和并行与分布式计算所做的变革性的贡献”而获得2010年计算机科学最高荣誉图灵奖。

他的工作开辟了新领域,给出了独创的新概念,并提供了许多兼具原创性、深度和优美的结果。他的工作一次又一次地确立或改变了计算科学的面貌。很少有人能像莱斯利那样同时在广度和深度上作出如此卓越的工作。他是理论计算机科学领域的真正英雄,他在解决某些悬而未决的科学问题上的勇气和创造力是人们学习的楷模。图1为颁奖晚会上的合影,左起为ACM CEO 约翰•怀特(John White)、Intel院士Shekar Borkar、谷歌副总裁Alfred Spector、图灵奖得主莱斯利•瓦里安特、ACM总裁Alain Chesnais。

Intel院士、微处理器技术实验室主任Shekar Borkar说:“瓦里安特教授在计算理论方面的研究使机器学习和人工智能发生了革命性的变化,使机器几乎可以思维”,“他的研究方式堪与图灵本人的媲美,从深邃洞察的基础出发,建立新颖的公式表述。Intel非常高兴支持这个奖项”。

谷歌研究与创新副总裁Alfred Spector说:“瓦里安特教授的独特概念和亮丽研究具有不可思议的广度,他在机器学习领域完成了创新的发明,这是一个快速成长的、有许多重要应用的领域。我们为成为ACM图灵奖的赞助者感到荣幸,这将激励并辨别计算领域的巨大进步,给世界带来美好的憧憬。”

4 光辉案例

众所周知,1997年IBM的超级计算机“深蓝”击败国际象棋大师卡斯帕罗夫,但是要让计算机理解人类语言、像人类一样思考就比下棋难多了。莱斯利的学习理论影响了IBM Watson的研制。IBM Watson系统是2006年开始设计的,它是由90台IBM 750服务器组成的群集系统,每台服务器采用8核芯片的Power 7处理器,每核有4个线程,因此相当于有2880个核在运行。内存16TB。采用的软件有SUSE Linux Enterprise Server 11操作系统、IBM DeepQA软件、Apache UIMA (非结构化信息管理体系结构)框架等。该系统使用了上百种以上的技术来分析自然语言、识别资源、寻找并产生假设、寻找证据并评分、对假设进行聚集和分级,因此它是专门设计的具有学习能力的机器。

这个以IBM创始人托马斯•J•沃森的名字命名的系统,能储存大量信息,相当于“100万本书籍和2亿页资料”,还可以从经验中学习如何提高性能,并且使用自然语言回答问题。世界各地的研究人员历时四年共同完成,其中我国科学家也为该项目做出了贡献。该系统应用前景广泛,它可以高速分析大量数据,用来帮助政府部门解答公众疑问,帮助医生评估药物疗效等。图2为2011年Jeopardy!竞赛。

2011年2月14-16日,IBM Watson参加了美国智力竞赛电视节目Jeopardy!(危险边缘),该竞赛1964年创立,问题涉及地理、政治、历史、体育、娱乐等。通过难度相当大的考试后才能获得参赛资格。在两个回合比赛中,IBM Watson与该节目史上最出色的选手肯•詹宁斯和布拉德•鲁特尔战成一平一胜。

5 研究兴趣

关于莱斯利•瓦里安特最近的研究兴趣,他谈道:计算机科学包括对人工现象和自然现象的研究。前者关注人造设备比如计算机;后者涉及大自然中多步骤或者计算的过程,比如脑或者生物进化过程。在大多数领域,对这些人工或者自然过程的终极局限还没有很好的理解。计算设备的潜力目前还远远没有认识清楚,而神经科学与演化中基础性的定量问题也没有得到解答。他的研究主要将关注这些基本问题。

篇10

(邯郸派瑞节能控制技术有限公司 河北 邯郸 056000)

【摘 要】本文详细地综述了近年来微装配技术的国内外发展现状以及其发展过程中面临的一些关键技术,并对微装配的发展进行了展望。

关键词 微机电系统;微装配;微夹持器;显微视觉

1. 引言?

(1)自从20世纪80年代以来,微机电系统(MEMS)以飞快的速度发展成为一个集微型机械、微传感器、微能源、微致动器、微控制器、微执行器、信号处理、智能控制于一体的新兴研究领域,如微型药泵、微传感器、微驱动器、微加速度计以及其他光电子医学器件等。微机电系统(MEMS)如果按照外形尺寸大小可分为:1~10 mm的微小机械,1μm~1 mm的微机械以及1nm~1μm的纳米机械。由于具有在狭小空间内进行作业而有不扰乱工作环境和对象的特点,微机电系统的意义和应用将涉及航空航天、军事、生物医学工程、太空探险、深海探查等诸多领域。如果一旦技术上成熟并形成产业化,必将对国民经济建设、国防建设乃至社会发展产生深远地影响,因此被誉为20世纪十大关键技术之首,21世纪最具代表性的技术。?

(2)微机电系统具有体积小、精度高、质量轻、性能稳定、可靠性高、能耗低、灵敏性和工作效率高、多功能和智能化、适合大批量生产、制造成本低廉等特点。其基本技术主要有微机械系统设计技术、复杂可动结构微细加工(高深宽比多层微结构加工)、微机械材料、微装配和封装、微操作、微测量、微系统的集成与控制、微宏接口等技术。微传感器、微致动器、微控制器,是微系统的基础单元。?

(3)随着微机电系统技术的深入发展,微机械技术的研究已经从基础研究阶段逐步发展到研制开发与实用阶段,许多微传感器、微执行器和微光学部件已经在许多行业获得应用。国外也正在从微型机械电子系统向微型光机电系统方向发展和扩展,在尺寸上会向更微型化电子机械系统逼近。而且,这些微机电系统日趋复杂,其中许多包含了不同的材料或者需要经过多种工序来实现。因此,针对微机电系统的微装配和微操作的研究日益引起国内外研究人员的高度重视。

2. 微装配的国内外发展概况?

(1)微装配主要指对亚毫米尺寸(通常在几μm~几百μm之间)的零部件进行的装配作业。目前针对微米级的操作和装配问题,主要有2种解决方法:一是用带有超精密控制系统的一般操作手和系统,另一是将操作手微型化。利用集成电路工艺制造微装配系统是未来发展的方向,但目前还有许多问题要解决。在传统的宏观技术上实现微装配是目前许多学者研究的内容,其系统类型大致分为远端操作方式和自动操作方式。近年来,越来越多的微装配领域的学者把注意力放在了自动微装配系统的研究上。?

(2)鉴于微装配系统技术的优势和广阔的发展前景,各先进的工业化国家为了维持自身的竞争优势都对微机电系统技术表现出了足够的重视,纷纷投入巨资开展研究。日本、德国和美国在微装配系统的研究方面比较突出,已具有一定的成果。它们研制成功的微装配系统大致可分为2类:一种是基于SEM的装配系统,另一种是基于传统光学显微镜的装配系统。前者具有放大倍数高、焦深大、分辨率高等特点,相比之下是一种理想的装配方法,但其不足之处是操作复杂且设备昂贵。而后者则有操作简单,成本低廉等优点。美国在微装配系统的开发研究方面取得了显著的进展,他们利用AFM(原子力显微镜)和高精度反馈技术,成功地感知了超光滑表面原子级尺寸的凹凸不平,同时还实现了原子迁移,展示了惊人的成就。?

(3)日本东京大学研制的纳米机器人是由右腕、左腕和基座三部分组成,是在电子显微镜下工作的系统。右腕由压电元件驱动3轴,左腕由粗动和压电元件驱动3轴,基座有2轴机构。其使用金刚石刀或用电解的钨针作为工具,该纳米机器人已做过LSI表面的铝配线切断实验。?

(4)日本岛津制作所研制的生物细胞微操作器,具有2套三轴粗动、微动的作业腕。粗动作业腕由步进电机驱动,微动作业腕由音圈电机驱动。?

(5)名古屋大学研制在血管中操作的有源导管,利用3个SMA(形状记忆合金)细丝来控制前端的导向。瑞典Uppsala大学研制的微机器人也是在电子显微镜下工作的,该机器人有两个作业腕,分别有4个和3个自由度。其工具为针状的镊子.利用该机器人已进行了切割200μm硅片、硅片熔接、制作硅单晶微型针等工作。?

(6)我国的微装配系统的研究工作起步于九十年代初,10多年来,国家自然科学基金委员会、国家科技部、中国科学院、国家教育部、总装备部和地方立了10余项与MEMs相关的重点和重大课题以及若干面上课题,总投资约1亿元人民币,其中也包括微装配系统的研究。目前,清华大学、大连理工大学和中国科学院长春光学精密机械研究所、北京大学、上海交通大学、重庆大学、中国科技大学、中国科学院电子所、中国科学院半导体所、南开大学、东南大学、复旦大学、西安交通大学、哈尔滨工业大学、南京航空航天大学、北京航空航天大学、浙江大学、华中理工大学、中国科学院高能物理研究所、中国科学院力学所、中国科学院物理所、华东师范大学等,在微系统方面开展了微装配装置、生物细胞转基因微操作系统、微型光谱仪、微电泳芯片及细小管道微机器人等研究工作。其中,上海交通大学在成功研制2 mm微动电机的基础上,自建了一套微型装配实验系统,主要是用来提供精密定位装置的操作平台;北京航空航天大学机器人研究所利用微机器人对微观领域的操作技术开展了实验研究;清华大学精密仪器与机械学系仪器科学与技术研究所自1996年以来从事微装配技术与系统方面的实验研究,并取得了一定的成果。这些工作都为真正的微装配系统的构建奠定了基础。

3. 微装配系统的关键技术?

随着微加工技术、显微技术和集成电路技术的发展,微装配的概念发生了根本性的变化、产品的范围和应用领域被拓宽,出现了许多新的技术。因此,微装配技术的发展是与微机电系统(MEMS)、纳米技术等相关技术密切相关。?

3.1 微装配技术的发展阶段。?

3.1.1 手工装配。

经过特殊培训的操作技术人员可以手工装配一些精密的光学和电磁器件。一些小型光纤、用于小型SCM的Electron Columns也在Illinois大学的微工艺应用实验室手工装配实现。但随着零件的更加微形化,公差变得越来越小,手工装配将受到很大局限。?

3.1.2 自动化的装配。

为了减小操作者的劳动强度,降低微系统的制造成本,自动化的装配是一个合适的选择。例如:使用一个视觉和力混合的机械手在操作杆控制下实现多自由度运动,进行装配工作。使用自动化装配不仅使得装配效率提高,而且可以进行批量装配,降低装配成本。微器件就是因为它体积小成本低才有广阔的发展前途,因此自动化装配应该是微装配的发展目标。?

3.1.3 微机械手的装配。

机械手因具有柔性好、操作灵活、能适应各种作业的特点,被广泛应用于现代工业中。微装配要求较高的定位精度,就必须使得微机械手有高的制造精度,零件的公差必须被限制在纳米范围内。目前,使用微机械手以及微机器人进行微装配是研究的主要方向。?

3.2 微装配中的视觉技术。?

(1)微装配的部件尺寸大多在几μm~几百μm之间,对于装配精度的要求就需要提高,通常为亚微米级。由于这个精度要求已经超出了一般工业应用的开环精密装配系统的标定精度,那么在微装配中使用精确的闭环定位系统是必要的。因此,对于微装配系统,视觉系统作为其柔性反馈系统,所具备的功能应该能够满足装配的要求。?

(2)目前显微视觉研究主要集中在大学和科研单位。美国加利福尼亚大学研制了使用AFM的显微视觉系统进行微装配中高精度定位研究;美国麻省理工大学利用光聚焦显微镜、机器视觉技术和图象处理开发了可靠和廉价的MEMS测试系统;德国斯图加特大学,利用SLM双目立体成像的特点研究了SLM条纹投影系统;韩国科技学院研发出三目立体视觉的微机器人,主要应用于微夹持、微装配和微操作等领域。在国内,南京航空航天大学、北京航空航天大学、哈尔滨工业大学机器人研究所和清华大学都开展了与显微视觉相关的研究。?

(3)通过目前国内外的研究情况来看,显微视觉的研究方向主要集中在视觉信息获取和视觉引导、位置和运动的自动控制以及力的传感和控制。前者是微操作系统的基础,因此是目前研究的热点。其研究重点是基于平面显微图象的视觉引导和基于立体显微图象的视觉引导。?

3.3 微夹持器。?

(1)微装配过程中微夹持器的合理设计和制造是一个关键环节。由于微夹持器不仅需要满足微操作条件下复杂的力不确定性,而且必须具有一定的自由度以满足各种不同操作。在微夹持器设计上,灵活抓取目标必需的运动学要求、稳定和安全抓取的力要求、传感和驱动方式以及可控性等特点是必须考虑的。?

(2)微夹持器是一种典型的微执行机构,它在微机械零件加工、微机械装配和生物工程等方面部有较好的应用前景,近来发展十分迅速。目前,按驱动力类型不同,见表1,已经研制出静电力驱动、电磁力驱动、功能材料驱动的种类众多的微小尺度操作和微小尺寸的夹钳,其中一些已研究成功,体现出现时和潜在的应用价值。?

(3)微夹持器的制作技术主要有:一是基于传统工艺技术,如:Shimada等人采用了一种应用传统工艺制成的单自由度微夹持器;另一是LIGA(Lithographic Galvan forming Ab-formung)技术,如Carrozza等制作了一种以镍为基,表面覆盖金的微夹持器厚度只有200μm。该工艺首先使用同步加速器产生的软X射线,通过掩摸照射在光敏聚合物上留下部件的立体模型,再提高电场将金属迁移形成金属结构。在此基础上又出现了不需要昂贵的同步辐射X光源的准LIGA技术,并且与集成电路工艺有更好的兼容性。?

3.4 微驱动技术。

驱动技术也是微操作和微装配领域的关键技术之一。它不仅要求有非常好的响应特性,而且还有工作空间和部件尺寸的限制。国内外研究人员把许多基础效应和新型材料应用到微驱动和精确定位上,做了大量的工作。如压电材料、静电材料、电磁材料以及形状记忆材料等。目前应用的最广泛的还是压电效应技术,如Carrozza等的微夹持器由压电材料驱动。

4. 微装配技术发展展望?

4.1 微装配技术的研究从90年代初始到现在,已有10余年的时间,并且在这10年里取得了长足的进步,但随着微细加工技术等半导体集成电路工艺的发展,微装配和微操作技术中一些不足之处也将日益显示。主要在微装配系统中各个关键技术的研究还不够,如视觉反馈手段、微夹持手的设计、控制以及驱动方式等方面都还有许多问题没有得到完全解决。微装配技术研究的最终目标是实现微器件的全自动装配操作,但到目前为止,这一目标还仍未能实现,其主要原因有以下三方面:

(1)微器件操作的许多关键技术还未被完全掌握;(2)微观领域中出现的特殊现象及其物理机制仍需不断深入研究探讨,如微机械粘附等;(3)简便、廉价的微器件加工设备没有得到开发,这也是由于微装配技术、策略等多方面因素所致。?

4.2 未来的发展方向应当是融合微电子、材料、机械、计算机等多学科技术来解决微观领域的问题。

参考文献

[1] 温诗铸;李娜微型机械与纳米机械学研究[J].中国机械工程,1996(02).

[2] SHIMADA E;YAN J;WOOD R Prototyping millirobots dextrous micro-assembly and folding 2000.

[3] CARROZZA M C;DARIO P;MENCIASSI A Manipulating biological and mechanical micro-obiects ising LIGAmicrofabricated end-effectors[J] 1998.

[4] 席文明;吴洪涛;朱剑英装配技术的发展现状[J].机械科学与技术 2002(06).