计算机视觉报告范文

时间:2023-12-18 18:00:10

导语:如何才能写好一篇计算机视觉报告,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

计算机视觉报告

篇1

以下为报告详细内容:

计算机视觉行业规模将进一步扩大

iiMedia Research(艾媒咨询)数据显示,2016年中国人工智能产业规模已突破100亿元,以43.3%的增长率高速增长,预计2017年产业规模将以51.2%的增长率达到152.1亿元,并于2019年增长至344.3亿元。

艾媒咨询分析师认为,中国人工智能产业起步相对较晚,随着科技、制造等业界巨头公司的布局深入,人工智能产业的规模将进一步扩大。计算机视觉作为人工智能的子领域,其发展和应用也很大程度受到人工智能核心技术的影响。未来,作为人工智能子领域的计算机视觉产业规模也会相应扩大。

计算机视觉用户市场有待挖掘

iiMedia Research(艾媒咨询)数据显示,2017上半年网民对于计算机视觉行业整体了解程度还不深,智能识别贴图应用以63.8%的了解比例名列各领域之首,其余领域网民了解比例均未超过五成。艾媒咨询分析师认为,计算机视觉行业作为新兴行业,其概念还未深入大众群体,大众对于其作用了解程度不深,未来计算机视觉行业用户市场开发潜力较大。

计算机视觉整体渗透率低

iiMedia Research(艾媒咨询)数据显示,2017上半年网民中,有四成用户使用过图搜索功能。还有六成用户仍未使用过图搜索功能。图搜在技术计算机视觉领域中已经发展比较成熟,然而在网民种的渗透率仍不高。艾媒咨询分析师认为,计算机视觉作为新兴技术,其投入实际应用时间较短,且技术依托的平台种类和数量都较少,用户市场培养还需时间。

图搜功能获用户认可

iiMedia Research(艾媒咨询)数据显示,在对2017上半年使用过“图搜”功能的网民准确率感知调研中,将近七成的用户对“图搜”功能的准确率给予肯定。“图搜”技术已经较为成熟,正在逐渐将便利带到用户生活中,未来随着“图搜”功能进一步在各应用中扩张,其区别于传统搜索的优势将会更明显被用户感知。

2017上半年网民图搜索场景分布

iiMedia Research(艾媒咨询)数据显示,2017上半年图搜网民中,69.6%的用户在搜索引擎中使用图搜功能,网购场景下使用图搜功能的用户占比53.5%。艾媒咨询分析师认为,搜索引擎直接应用了图搜功能,发展较早,故用户基础较扎实,其余领域中,网购图搜变现能力最强,是厂商优先合作的重点领域。

边看边买用户市场潜力较大

iiMedia Research(艾媒咨询)数据显示,2017上半年边看边买网民渗透率仅有11.9%,而在未尝试过人群中,有意愿进行尝试的人群超过六成。艾媒咨询分析师认为,明星经济拉动下,同款销售具有宣传效应加成。边看边买技术一方面可以加强视频门户的变现能力,一方面作为流量入口能够为电商平台导入流量,且对于消费者来说,智能匹配同款可以减少其搜索筛选的时间成本,未来市场有较大发展潜力。

实名制机器认证部分取代人工 未来规模看涨

iiMedia Research(艾媒咨询)数据显示,2017上半年机器实名制认证网民渗透率为43.6%,有超一半用户未使用过机器实名制认证功能。随着计算机视觉技术发展,在广州、上海等城市已经开始使用机器实名制认证部分或全部代替人工认证,以减少人工成本,释放劳动密集产业用工压力。艾媒咨询分析师认为,随着时间检验和技术进一步成熟,机器实名制会进一步向中小城市渗透,未来网点铺设规模有望进一步扩大。

机器认证效率获用户认可

iiMedia Research(艾媒咨询)数据显示,2017上半年使用过机器实名制认证的网民中,82.6%的用户表示机器实名制认证加快了验证流程。艾媒咨询分析师认为,计算机视觉精准快速无主观性的特点和实名制认证流程要求相匹配,在技术比较成熟的情况下,能够提高验证效率,缓解铁路站点因人工验证慢导致的拥挤、乘客等候过久等现象。此技术在中国各铁路站点会慢慢渗透,应用规模有望扩大。

个人信息泄露成为用户刷脸支付最大顾虑

iiMedia Research(艾媒咨询)数据显示,2017上半年了解刷脸支付的网民中,59.0%认为个人信息泄露是刷脸支付最大隐患。识别不准确和使用渠道不畅通分别以57.6%和41.9%位列第二和第三名。

艾媒咨询分析师认为,作为个人信息比较敏感的金融支付领域,用户对于信息安全重视度相较其他领域更高,而2017年初315晚会对刷脸支付泄露个人信息隐患的点名,无疑为刷脸支付规模扩张设置障碍,加强用户信息保障能力,获取用户对于技术安全的信任是刷脸支付未来重点发力方向。另外,由于计算机视觉概念未在大众群体中普及,其规模化需依托场景搭建,故使用渠道畅通也可以助力加快行业规模化进程。

精确性+场景化:C端市场打开方式

iiMedia Research(艾媒咨询)数据显示,2017上半年中国网民对于计算机视觉行业的愿景分布中,准确率更高以64.3%的关注度成为用户最期待改进方向,使用更加方便和保障信息安全也是用户重点关注问题。艾媒咨询分析师认为,行业发展初期,用户对概念理解程度不高,易产生“不易”使用的印象而不愿进行尝试,未来商家可尝试提供装备完全的硬件设备和解决方案,并尝试丰富使用场景,让计算机视觉更易被广泛网民接受。

计算机视觉在生活化场景中的使用最被C端用户期待

篇2

关键词:计算机视觉;教学应用;教学改革

计算机视觉是人工智能学科中的一门重要课程。随着相关应用在多个领域中的出现,越来越多的学生开始对这门课产生了浓厚的兴趣。如何让学生能够在整个课程中保持盎然的兴趣,并为有志于深入研究计算机视觉的学生指明方向,成为我们教师首先应注重的问题。

在实际的教学工作中,通过不断摸索总结,我们认为,以实际应用引导学生的学习兴趣,既满足了学生想了解计算机视觉实际应用的需求,又加深了学生对于算法的理解,把算法放在一个实际应用中,学生可以理解怎么用,为什么这么用。在这样的目标导引下,我们从选择教材开始,准备教学内容(包括合理的应用实例的选择)、制作PPT、探索教学方法,形成了目前以实际应用为主导的创新教学体系,非常受学生欢迎。在此,我们对这期间遇到的问题,解决方法、心得体会做一个总结和思考,希望能对同行有些许参考作用。

1选择教材

在我们这个专业,每年的上研率基本都保持在50%左右。在本专业的研究生阶段,也开设了双语教学的计算机视觉课程。另外,毕业后选择参加工作的同学也基本都进入和本专业非常相关的一些单位,所从事的工作,都是和在学校学习的知识密切相关。

因此,如何让这门课程的教学既兼顾本科毕业就参加工作的那部分同学,又兼顾继续深造的学生的需求,也是在这门课程讲授的过程中,需要特别注意的一个问题。对于本科毕业就要参加工作的同学而言,需要“广度”,需要了解计算机视觉这门课在各个领域中的应用,在实际中接触到相关的项目或工作时,能够知道去哪里可以找到自己需要的参考资料;而对于要进一步深造的同学而言,则需要一定的“深度”,为研究生阶段的研究打下基础。

全盘考虑到这些学生毕业之后的去向,我们选择了两本教材。一本是贾云得教授编著,科学出版社于 2000年出版的《机器学习》[2],这是一部顺应了时代与教学发展要求的教材,对计算机视觉中的基本概念、基本算法、基本算法的应用、经典应用进行了由浅入深的介绍。内容涵盖了所有经典的数字图像处理与机器视觉方法,也对一些已经得到非常好实际应用的方法,如光流法等作了简要介绍。另外还选择了一本英文原版的计算机视觉的经典著作,Ramesh Jain 教授等所著的《Machine Vision》[3],机械工业出版社于2003年出版。这是国内外非常推崇的一本计算机视觉著作,该教材条理清晰,深入浅出,对计算机视觉的基本原理、算法、应用的介绍非常详尽。

在教学中,我们采用了英文的PPT,但主要用的教材是贾云得教授的《机器视觉》,这样中英文对照讲解,一方面加深学生对教学内容的理解,另一方面也为学生今后阅读专业的英文论了相应准备。

2教学内容和工程实例的选取

2.1选取教学内容

本课程之前,大学二年级的本科生已开设数字图像处理课程,但所讲的基本原理和算法都非常浅显,所以在教学内容的安排上,分为两大部分:数字图像处理部分和视觉部分。数字信号处理部分主要讲解在视觉部分会用到的一些基本算法,为后面进入计算机视觉部分打基础。这部分约占总课时的1/3。视觉部分的课时也分为两部分:算法讲解与实例讲解。在算法讲解部分,对计算机视觉的基本算法、经典算法都做了深入浅出的讲解。实例部分则选择了经典的工业应用,让学生能够对所学算法进一步加以理解。

2.2选取适当的工程实例

就计算机视觉的教学内容而言,各个孤立的算法和方法对本科生来讲,有些抽象不好理解。如果在教学上仅仅通过老师在课堂上的讲解,很难让学生深入地理解相关的教学内容,而选择一个触手可及且简单好理解的工程实例往往就会达到意想不到的教学结果,学生可以把课堂上所学的枯燥理论与现实中活生生的事物联系起来,从而加深对教学内容的理解。

通过反复比对、反复论证,我们选择了在讲解基本原理和算法之后,在课程结束前,专门留出课时讲解手机制造这个例子。手机现在是人手一部,是这些年青学子再熟悉不过的事物了,通过对手机主板、手机键盘的制造过程的讲解,把所学的算法都融合进来,学生在觉得有趣的同时,不知不觉就加深了对所学算法的理解。

另外,在教学的过程中,我们还不断穿插其他学生耳熟能详的实例,如数码相机原理中的一些算法的讲解,我们和学生一起探讨应该怎么选择数码相机。再有,滤波器算法、在课堂上对Photoshop功能的演示,与所学算法关联起来,学生都很容易理解接受。

3教学点滴

3.1点睛之笔

在第一节课的讲述中,我们的重点不在于Marr理论,而是告诉学生:

人工智能就是要让计算机像人一样,能够会听、会看……

我们这门课程就是要让计算机“会看”,要像人一样会看。进而展示给学生一些我们精心挑选的图片,让学生自己判断,是不是自己的眼睛“骗了”自己,人眼和计算机看到的到底有什么不一样。

每次讲到这里,学生都会进行热烈的讨论,每个人都有不同的看法,每个人都有自己的坚持,不知不觉中,对这门课就产生了浓厚的兴趣,有了继续深入学习下去的愿望。在课堂讨论的最后,比较人眼对图片的判断以及计算机的判断后,让学生自己总结归纳,我们这门课到底要研究些什么,都有可能应用在哪些方面,然后对争议比较大的提议一一探讨。每到这个时候,大家的积极性就都被激发出来,在不断的争论与思想碰撞中找出正确的结论。

3.2拿身边的事物说“事”

计算机视觉课程的前半部分,多涉及到图像处理的一些常见算法。在讲授各种各样的滤波器和算子时,并没有针对各个滤波器和算子摆出一堆示例图片,让学生比较滤波前后的差异,从而很生硬地理解滤波器与算子的功能。取而代之的,我们首先以现在人手一台的数码相机为例提出问题,你为什么要选择你手里的这台数码相机?当初选这个品牌和型号时,你的考虑是什么?历年学生的回答几乎都是看网上测评,或者在网上看别人怎么说。这时列出我们收集到的各个品牌相机的测评报告,列出它们的优缺点,然后引导学生去思考,例如这个品牌的相机的缺点是照片发灰,不是很鲜亮,而另一个品牌的相机则绿的特别绿,红的特别红,为什么?那么有可能是哪部分的算法不够完善,为什么?

通过如此简单的对比,学生的积极性被完全激发。原来,数码相机这个几乎人人都有,大家都熟悉的“玩具”竟然和自己在课堂上学到的知识这么密切相关。

再有,就是利用学生们都熟悉的PS(Photoshop),演示现在所谓的“完美证件照”是怎么来的。为什么可以把疙疙瘩瘩的脸部皮肤变得光滑?在PS中,你就是点了一下鼠标,其实在后台,是加入了一个滤波器进行了滤波。各种这样的演示,学生都非常喜闻乐见。因为他们突然发现,原来那些事物,和我自己接触到这些看似枯燥的理论之间,还有这么深刻的联系。

还有一个很受学生欢迎的例子就是对于“鼓形失真”的讲解。我们的老师每次讲到这里,都不会简单告诉学生“鼓形失真”发生的原因是什么,应该怎么解决?老师都会问学生,明星为什么都一窝蜂去减肥?现在的女明星为什么都要去弄个“锥子脸”?课堂上就会出现一个小,男同学和女同学的看法各异,彼此之间开始争论不休。此时再趁热打铁地问学生,如果拿着相机,离自己的鼻子一公分,会拍出什么样的效果?有学生开始拿出手机对着自己和别人开拍,有的学生开始头头是道地分析。每到这种学生都开始热烈讨论的时候,就可以适时引导学生往正确的方向去,让他们自己找到正确的分析解决方法,往往这个时候,学生都会颇有成就感,对于问题的理解也会特别的深刻。

3.3选择合适的实际应用

在所有理论讲解结束后,我们会留出2~4次课讲述计算机视觉在工业上的应用。这些年来,对于手机制造这样一个工业应用,非常受学生欢迎。正如“数码相机”这个例子一样,现在学生都是人手一部手机,是大家再熟悉不过的东西。这个例子涉及到了在前面理论讲述中的大部分算法,如二值图像的处理、模板匹配、高斯滤波器等。学生通过对这个工业应用的理解,更进一步加深了对算法的理解。

以讲解手机键盘的制造过程为例,向学生提出和前面所讲内容相关的问题,引导学生自发思考,如为什么选择模板匹配法,而不是采用其他更复杂更精确的方法等等。每到这个时候,课堂气氛总是分外热烈,学生各抒己见,在不断争论中,更进一步加深对课本上枯燥理论的认识。

在这里需要注意的问题是一定要一步一步提出问题,循循善诱,引导学生一层一层地深入思考。如果问题的答案过于“深藏不露”,则有可能触发学生的抵触情绪,无法继续深入地思考。

4结语

通过多年的教学摸索,我们认为,在计算机视觉课程的讲述中,以实际应用引导学生这样的教学方法非常可取,而且也收到了很好的效果。另外,除了制定好的教学大纲,并选择合适的教材外,根据学校现在的时间情况,我们选择了多媒体手段辅助教学,充分利用Matlab和大屏幕投影等方方面面的优势,结合多种方法进行教学,对讲好计算机视觉这门课,非常有益。

参考文献:

[1] 林尧瑞,马少萍. 人工智能导论[M]. 北京:清华大学出版社,1989.

[2] 贾云得. 机器视觉[M]. 北京:科学出版社,2000.

[3] Ramesh Jain. Machine Vision[M]. 北京:机械工业出版社,2003.

[4] 蔡自兴. 智能控制原理与应用[M]. 北京:清华大学出版社,2007.

Innovation in the Course of Computer Vision

HAN Hong, JIAO Li-cheng

(School of Electronic Engineering, Xidian University, Xi’an 710071, China)

篇3

摘要:介绍了数据融合技术的基本概念和内容,分析了该技术在森林防火、森林蓄积特征的估计和更新、森林资源调查等方面的应用,提出该技术可应用于木材无损检测及精确林业。融合机器视觉、X射线等单一传感器技术检测木材及木制品,可以更准确地实时检测出木材的各种缺陷;集成GPS、GIS、RS及各种实时传感器信息,利用智能决策支持系统以及可变量技术,能够实现基于自然界生物及其赖以生存的环境资源的时空变异性的客观现实,建立基于信息流融合的精确林业系统。

多传感器融合系统由于具有较高的可靠性和鲁棒性,较宽的时间和空间的观测范围,较强的数据可信度和分辨能力,已广泛应用于军事、工业、农业、航天、交通管制、机器人、海洋监视和管理、目标跟踪和惯性导航等领域。笔者在分析数据融合技术概念和内容的基础上,对该技术在林业工程中的应用及前景进行了综述。

一、数据融合

1.1概念的提出

1973年,数据融合技术在美国国防部资助开发的声纳信号理解系统中得到了最早的体现。70年代末,在公开的技术文献中开始出现基于多系统的信息整合意义的融合技术。1984年美国国防部数据融合小组(DFS)定义数据融合为:“对多源的数据和信息进行多方的关联、相关和综合处理,以更好地进行定位与估计,并完全能对态势及带来的威胁进行实时评估”。

1998年1月,Buchroithner和Wald重新定义了数据融合:“数据融合是一种规范框架,这个框架里人们阐明如何使用特定的手段和工具来整合来自不同渠道的数据,以获得实际需要的信息”。

Wald定义的数据融合的概念原理中,强调以质量作为数据融合的明确目标,这正是很多关于数据融合的文献中忽略但又是非常重要的方面。这里的“质量”指经过数据融合后获得的信息对用户而言较融合前具有更高的满意度,如可改善分类精度,获得更有效、更相关的信息,甚至可更好地用于开发项目的资金、人力资源等。

1.2基本内容

信息融合是生物系统所具备的一个基本功能,人类本能地将各感官获得的信息与先验知识进行综合,对周围环境和发生的事件做出估计和判断。当运用各种现代信息处理方法,通过计算机实现这一功能时,就形成了数据融合技术。

数据融合就是充分利用多传感器资源,通过对这些多传感器及观测信息的合理支配和使用,把多传感器在空间或时间上的冗余或互补信息依据某些准则进行组合,以获得被测对象的一致性解释或描述。数据融合的内容主要包括:

(1)数据关联。确定来自多传感器的数据反映的是否是同源目标。

(2)多传感器ID/轨迹估计。假设多传感器的报告反映的是同源目标,对这些数据进行综合,改进对该目标的估计,或对整个当前或未来情况的估计。

(3)采集管理。给定传感器环境的一种认识状态,通过分配多个信息捕获和处理源,最大限度地发挥其性能,从而使其操作成本降到最低。传感器的数据融合功能主要包括多传感器的目标探测、数据关联、跟踪与识别、情况评估和预测。

根据融合系统所处理的信息层次,目前常将信息融合系统划分为3个层次:

(l)数据层融合。直接将各传感器的原始数据进行关联后,送入融合中心,完成对被测对象的综合评价。其优点是保持了尽可能多的原始信号信息,但是该种融合处理的信息量大、速度慢、实时性差,通常只用于数据之间配准精度较高的图像处理。

(2)特征层融合。从原始数据中提取特征,进行数据关联和归一化等处理后,送入融合中心进行分析与综合,完成对被测对象的综合评价。这种融合既保留了足够数量的原始信息,又实现了一定的数据压缩,有利于实时处理,而且由于在特征提取方面有许多成果可以借鉴,所以特征层融合是目前应用较多的一种技术。但是该技术在复杂环境中的稳健性和系统的容错性与可靠性有待进一步改善。

(3)决策层融合。首先每一传感器分别独立地完成特征提取和决策等任务,然后进行关联,再送入融合中心处理。这种方法的实质是根据一定的准则和每个决策的可信度做出最优的决策。其优点是数据通讯量小、实时性好,可以处理非同步信息,能有效地融合不同类型的信息。而且在一个或几个传感器失效时,系统仍能继续工作,具有良好的容错性,系统可靠性高,因此是目前信息融合研究的一个热点。但是这种技术也有不足,如原始信息的损失、被测对象的时变特征、先验知识的获取困难,以及知识库的巨量特性等。

1.3处理模型

美国数据融合工作小组提出的数据融合处理模型,当时仅应用于军事方面,但该模型对人们理解数据融合的基本概念有重要意义。模型每个模块的基本功能如下:

数据源。包括传感器及其相关数据(数据库和人的先验知识等)。

源数据预处理。进行数据的预筛选和数据分配,以减轻融合中心的计算负担,有时需要为融合中心提供最重要的数据。目标评估。融合目标的位置、速度、身份等参数,以达到对这些参数的精确表达。主要包括数据配准、跟踪和数据关联、辨识。

态势评估。根据当前的环境推断出检测目标与事件之间的关系,以判断检测目标的意图。威胁评估。结合当前的态势判断对方的威胁程度和敌我双方的攻击能力等,这一过程应同时考虑当前的政治环境和对敌策略等因素,所以较为困难。

处理过程评估。监视系统的性能,辨识改善性能所需的数据,进行传感器资源的合理配置。人机接口。提供人与计算机间的交互功能,如人工操作员的指导和评价、多媒体功能等。

二、多传感器在林业中的应用

2.1在森林防火中的应用

在用MODIS(ModerateResolutionImagingSpectroradiometer)数据测定森林火点时的20、22、23波段的传感器辐射值已达饱和状态,用一般图像增强处理方法探测燃烧区火点的结果不理想。余启刚运用数据融合技术,在空间分辨率为1000m的热辐射通道的数据外加入空间分辨率为250m的可见光通道的数据,较好地进行了不同空间分辨率信息的数据融合,大大提高了对火点位置的判断准确度。为进一步提高卫星光谱图像数据分析的准确性与可靠性,利用原有森林防火用的林区红外探测器网,将其与卫星光谱图像数据融合,可以使计算机获得GPS接收机输出的有关信息通过与RS实现高效互补性融合,从而弥补卫星图谱不理想的缺失区数据信息,大大提高燃烧区火点信息准确度和敏感性。

2.2森林蓄积特征的估计

HampusHolmstrom等在瑞典南部的试验区将SPOT-4×S卫星数据和CARABAS-IIVHFSAR传感器的雷达数据进行了融合,采用KNN(knearestneighbor)方法对森林的蓄积特征(林分蓄积、树种组成与年龄)进行了估计。

KNN方法就是采用目标样地邻近k个(k=10)最近样地的加权来估计目标样地的森林特征。研究者应用卫星光谱数据、雷达数据融合技术对试验区的不同林分的蓄积特征进行估计,并对三种不同的数据方法进行误差分析。试验表明,融合后的数据作出的估计比单一的卫星数据或雷达数据的精度高且稳定性好。

2.3用非垂直航空摄像数据融合GIS信息更新调查数据

森林资源调查是掌握森林资源现状与变化的调查方法,一般以地面调查的方法为主,我国5年复查一次。由于森林资源调查的工作量巨大,且要花费大量的人力、物力和资金。国内外许多学者都在探索航空、航天的遥感调查与估计方法。

TrevorJDavis等2002年提出采用非垂直的航空摄影数据融合对应的GIS数据信息实现森林调查数据的快速更新,认为对森林资源整体而言,仅某些特殊地区的资源数据需要更新。在直升飞机侧面装上可视的数字摄像装置,利用GPS对测点进行定位,对特殊地区的摄像进行拍摄,同时与对应的GIS数据进行融合,做出资源变化的估计或影像的修正。

试验表明,融合后的数据可以同高分辨率矫正图像相比,该方法花费少,精度高,能充分利用影像的可视性,应用于偏远、地形复杂、不易操作、成本高的区域,同时可避免遥感图像受云层遮盖。

三、数据融合在林业中的应用展望

3.1在木材检测中的应用

3.1.1木材缺陷及其影响

木材是天然生长的有机体,生长过程中不可避免地有尖削度、弯曲度、节子等生长缺陷,这些缺陷极大地影响了木材及其制品的优良特性,以及木材的使用率、强度、外观质量,并限制了其应用领域。在传统木制品生产过程中,主要依靠人的肉眼来识别木材缺陷,而木材板材表面缺陷在大小、形状和色泽上都有较大的差异,且受木材纹理的影响,识别起来非常困难,劳动强度大,效率低,同时由于熟练程度、标准掌握等人为因素,可能造成较大的误差。另外在集成材加工中,板材缺陷的非双面识别严重影响了生产线的生产节拍。因此必须开发一种能够对板材双面缺陷进行在线识别和自动剔除技术,以解决集成材加工中节子人工识别误差大、难以实现双面识别、剔除机械调整时间长等问题。

3.1.2单一传感器在木材检测中的应用

对木材及人造板进行无损检测的方法很多,如超声波、微波、射线、机械应力、震动、冲击应力波、快速傅立叶变换分析等检测方法。超声技术在木材工业中的应用研究主要集中在研究声波与木材种类、木材结构和性能之间的关系、木材结构及缺陷分析、胶的固化过程分析等。

随着计算机视觉技术的发展,人们也将视觉传感器应用于木材检测中。新西兰科学家用视频传感器研究和测量了纸浆中的纤维横切面的宽度、厚度、壁面积、壁厚度、腔比率、壁比率等,同时准确地测量单个纤维和全部纤维的几何尺寸及其变化趋势,能够区分不同纸浆类型,测定木材纤维材料加固结合力,并动态地观察木材纤维在材料中的结合机理。

新西兰的基于视觉传感器的板材缺陷识别的软件已经产业化,该软件利用数码相机或激光扫描仪采集板材的图像,自动识别板材节子和缺陷的位置,控制板材的加工。该软件还具有进行原木三维模型真实再现的计算机视觉识别功能,利用激光扫描仪自动采集原木的三维几何数据。

美国林产品实验室利用计算机视觉技术对木材刨花的尺寸大小进行分级,确定各种刨花在板中的比例和刨花的排列方向;日本京都大学基于视觉传感器进行了定向刨花板内刨花定向程度的检测,从而可以通过调整定向铺装设备优化刨花的排列方向来提高定向刨花板的强度。在制材加工过程中,利用计算机视觉技术在线实时检测原木的形状及尺寸,选择最佳下锯方法,提高原木的出材率。同时可对锯材的质量进行分级,实现木材的优化使用;在胶合板的生产过程中,利用计算机视觉技术在线实时检测单板上的各种缺陷,实现单板的智能和自动剪切,并可测量在剪切过程中的单板破损率,对单板进行分等分级,实现自动化生产过程。Wengert等在综合了大量的板材分类经验的基础上,建立了板材分级分类的计算机视觉专家系统。在国内这方面的研究较少,王金满等用计算机视觉技术对刨花板施胶效果进行了定量分析。

X射线对木材及木质复合材料的性能检测已得到了广泛的应用,目前该技术主要应用于对木材密度、含水率、纤维素相对结晶度和结晶区大小、纤维的化学结构和性质等进行检测,并对木材内部的各种缺陷进行检测。

3.1.3数据融合在木材检测中的应用展望

单一传感器在木材工业中已得到了一定程度的应用,但各种单项技术在应用上存在一定的局限性。如视觉传感器不能检测到有些与木材具有相同颜色的节子,有时会把木板上的脏物或油脂当成节子,造成误判,有时也会受到木材的种类或粗糙度和湿度的影响,此外,这种技术只能检测部分表面缺陷,而无法检测到内部缺陷;超声、微波、核磁共振和X射线技术均能测量密度及内部特征,但是它们不能测定木材的颜色和瑕疵,因为这些缺陷的密度往往同木板相同。因此,一个理想的检测系统应该集成各种传感技术,才能准确、可靠地检测到木材的缺陷。

基于多传感器(机器视觉及X射线等)数据融合技术的木材及木制品表面缺陷检测,可以集成多个传统单项技术,更可靠、准确地实时检测出木材表面的各种缺陷,为实现木材分级自动化、智能化奠定基础,同时为集裁除锯、自动调整、自动裁除节子等为一身的新型视频识别集成材双面节子数控自动剔除成套设备提供技术支持。

3.2在精确林业中的应用

美国华盛顿大学研究人员开展了树形自动分析、林业作业规划等研究工作;Auburn大学的生物系统工程系和USDA南方林业实验站与有关公司合作开展用GPS和其他传感器研究林业机器系统的性能和生产效率。

目前单项的GPS、RS、GIS正从“自动化孤岛”形式应用于林业生产向集成技术转变。林业生产系统作为一个多组分的复杂系统,是由能量流动、物质循环、信息流动所推动的具有一定的结构和功能的复合体,各组分间的关系和结合方式影响系统整体的结构和功能。因此应该在计算机集成系统框架下,有效地融合GPS、GIS、RS等数据,解决这些信息在空间和时间上的质的差异及空间数据类型的多样性,如地理统计数据、栅格数据、点数据等。利用智能DSS(决策支持系统)以及VRT(可变量技术)等,使林业生产成为一个高效、柔性和开放的体系,从而实现林业生产的标准化、规范化、开放性,建立基于信息流融合的精确林业系统。

南京林业大学提出了“精确林业工程系统”。研究包括精确林业工程系统的领域体系结构、随时空变化的数据采集处理与融合技术、精确控制林业生产的智能决策支持系统、可变量控制技术等,实现基于自然界生物及其所赖以生存的环境资源的时空变异性的客观现实,以最小资源投入、最小环境危害和最大产出效益为目标,建立关于林业管理系统战略思想的精确林业微观管理系统。

[参考文献]

[1]高翔,王勇.数据融合技术综述[J].计算机控制与测量,2002,10(11):706-709.

[2]龚元明,萧德云,王俊杰.多传感器数据融合技术(上)[J].冶金自动化,2002(4):4-7.

[3]钱永兰,杨邦杰,雷廷武.数据融合及其在农情遥感监测中的应用与展望[J].农业工程学报,2004,20(4):286-290.

[4]高德平,黄雪梅.多传感器和数据融合(一)[J].红外与激光工程,1999,28(1):1-4.

篇4

(1.湖南文理学院物理与电子科学学院,湖南 常德 415000;2.常德市广积米业有限公司,湖南 常德 415000)

摘要:为了提高稻米质量检测精度,提升企业运营效率,构建了基于图像处理技术的大米质量在线检测信息系统。根据国家粮食生产标准,采用数字图像处理技术对稻米的外观特征进行识别与分析,获取整精米率等关键参数,设计信息系统软件记录和分析相关参数,并在线提供给其他部门使用。经现场测试运行,该系统能较好地满足企业的检测要求,较传统人工分析参数检测准确率提高了7.8%,为企业的现代化管理提供了有力的支撑。

关键词 :稻米质量;图像处理;参数检测;信息系统

中图分类号:TP274 文献标识码:A 文章编号:0439-8114(2015)04-0963-04

DOI:10.14088/j.cnki.issn0439-8114.2015.04.050

收稿日期:2014-05-15

基金项目:湖南省科技计划项目(2012SK3131);湖南省常德市科技计划项目(2012ZX31)

作者简介:曹斌芳(1979-),女,陕西澄城人,讲师,硕士,主要从事复杂工业过程控制与优化、计算机测量与控制等方面的研究,(电话)15274929524(电子信箱)cao_bf@163.com。

稻米是世界上最主要的粮食作物之一,中国是世界上最大的稻米生产国,产量占到世界总产量1/3,居世界首位[1]。中国的水稻研究在世界上处于领先地位,但是大米的质量和口感等方面还存在诸多不足[2],同时消费群体对于优质稻米的要求不断提升。在粮食流通和生产过程中,对进行大米品质检测与分析具有十分重要的意义,粮食安全是当前人们关注的热点问题。目前,中国粮食企业中大米品质外观指标的检测,主要是质检员通过肉眼观测,再填写纸质质检单。人工检测存在效率低、精度低、可重复性差等问题,可能导致指标不达标的大米流向市场,损害了消费者的健康和权益,同时人工检测难以满足企业生产经营中的快速批量检测的要求,而且纸质质检信息在企业中流转不畅、极易出错,降低了企业的运营效率。

从20世纪70年代末,研究人员开始在植物种类的鉴别、农产品品质检测和分级等领域进行图像处理技术应用的探索。随着信息技术的快速发展,图像处理技术在农业各个领域中均取得了诸多的重要进展[2-4]。在粮食企业生产中,稻米外观是用来判别大米类型、品种、级别等的直观指标,也是企业质量控制中的一项关键质量指标。在大米品质检测方面,国内外学者进行了许多研究,提出了许多的图像处理技术方法,并研发了多种不同类型的检测设备[4-7]。研究者利用不同方法研究了基于机器视觉对稻米的垩白度及垩白粒率、黄粒米等检测参数[5-7],取得了一定的效果,但是仍然存在着精度较低,检测参数速度偏慢等问题。同时已有研究讨论如何在企业信息管理中进行信息的利用与整合。为此,本研究基于大米的形态和外观参数,采用了基于熵的阈值法和改进的分水岭分割检测算法,分别检测整精米率和垩白粒率,然后基于色度学分离出黄粒米,并进行相关参数的统计,再进行光度和亮度的评估,最后将检测参数送入设计的企业质量检测信息系统,供地磅、财务和仓储等其他部门使用。

1 大米外观质量标准

根据中华人民共和国国家标准GB1354-2009《大米》[8],大米被分为4个品种:籼米、粳米、籼糯米、粳糯米。按照质量等级,籼米与粳米分为一级、二级、三级、四级;籼糯米与粳糯米分为一级、二级、三级。大米的外观品质主要包括大米色泽、垩白粒和米粒形状等指标,均是质量检测的基本项目,其中黄粒米、矿物质、色泽和气味为强制性指标,表征了大米重要的商品性状。大米在采购原粮、生产完成以及商品退货等企业业务活动中都要进行相关的检验,其具体过程大致如下:

1)扦样。根据标准扦样法进行逐批扦样,取得原始样品2 000 g左右,且标示样品。

2)分样。对每批原始样品分样,混合后分取两份,每份约50 g用于检验,其余样品标示保管好作为留样或备份。

3)检验样品。对两份样品分别检验,结果取算术平均值。①水分检测:称取一定量的样品,磨碎,烘箱法测定水分含量;②整精米率检测。按照国家标准,不足该批米平均长度的3/4视为非整米,称量算出百分比;③不完善粒检测。按照标准选出待测样品的不完善粒,称重算出百分比;④黄粒米检测。按照标准选出待测样品的黄色米粒,称重算出百分比;⑤垩白粒检测。按照标准选出待测样品胚或部分胚是乳白色,称重算出百分比;⑥光度检测。感官与标样对照光洁度或反光度。

4)出具检验报告。根据中国现行的标准,优质大米的基本指标[8]如表1所示,是粮食加工企业必须检验项目。

2 基于OpenCV技术的图像采集系统

基于图像技术进行大米质量检测是一种快速便捷的方法,系统主要包括光源、镜头、摄像机、板卡和分析处理软件。该系统针对稻米静态图像进行采集,经过适当的处理和分析,获得相关的关键参数。大米外观质量图像采集系统由计算机、采集台、摄像头、托盘组成,采集台上方横柱装有摄像头,托盘放置在下层,采集箱为封闭状态,以排除外界光线的干扰,托盘中间的黑色区域,大小为200 mm×280 mm,用于放置待检测米粒。摄像头的分辨率为2 592×1 944,像数为800万像素,实际拍摄视野为150 mm×180 mm,可分辨的稻米精度为0.1 mm。以粳米为例,长度为5.0~5.5 mm,粒型为1.5~2.0 mm。考虑光源尺寸及散热,摄像机到稻米的距离为120 mm。本研究所使用的OpenCV(Open source computer vision library )是由一系列函数和少量类构成的开源计算机视觉库,主要实现图像处理和计算机视觉方面的通用算法,用于对图像进行一些高级处理。目前,大部分的大米品质检测指标根据国家标准采用人工进行检测,容易产生许多问题。OpenCV包括了实时光线追踪和三维显示墙等。在Intel的性能库团队的帮助下,OpenCV完成了核心代码机器算法,并且在俄罗斯团队的努力下得到了优化。本研究利用计算机视觉技术对大米粒形的检测方法进行研究,并根据大米的粒形特征研究了大米中破碎米或整精米的检测方法。利用计算机视觉技术对大米样品图像进行处理,其框图如图1所示。大米的检测参数存入数据库中,供后续信息系统使用。

大米图像特征包含大小特征、形状特征、颜色特征和纹理特征,本研究结合这4种特征,计算了整精米率、垩白粒率、黄粒米率等关键参数。大小特征参数用于表征稻米米粒的大小尺寸,其中包括周长、面积、长度、宽度等。在采集静态图像时,大米常会出现粘连现象,而且由于环境等多种原因图像会受到噪声干扰。本研究首先采用OpenCV函数库中void cvSmooth函数对图像利用高斯滤波进行降噪处理;再使用形态学对图像进一步处理,形态学重构算子有保持图像集合特征的性质,形态学开运算能消除图像中尖峰和孤岛,与闭运算可填补图像中的小孔和间隙相结合,将三者结合可以构成形态学开闭运算滤波器。这使得既可滤除图像中的噪声点,又使对象区域具有连续性,且不会导致图像的失真和产生新的特征。该系统中使用形态学滤波函数void cvMorphologyEx完成这个操作,然后使用二维最小局部交叉熵阈值法进行二值化操作[9],统计获得大米粒形态特征,按照国家标准计算出整精米率。基于垩白粒图像区域中垩白部分白色不透明这一物理先验特征,使用多阈值分割方法获得垩白粒区域[10],将垩白粒区域分成3个标记区域[11],通过形态学分水岭方法分割垩白粒图像,提取得到区域间的垩白区域。再将背景置为黑色[7],米粒颜色不变,然后将其从RGB颜色空间转化为L*a*b*颜色空间,结合色度和面积阈值来判定每颗米粒是否为黄粒米,从而获得黄粒米率并在图中标记。将人工检测结果与计算机检测结果比较,准确率提升了7.8%,检测员劳动强度有较明显下降,检测速度大幅度提升。

3 粮食质检信息管理系统设计

粮食质量检测是粮食企业日常经营生产活动中的重要环节,不仅影响到企业的运营效率,而且与用户的利益和社会的需求密切相关,受到政府监管部门的高度关注。目前,稻米的外观质量检测主要采用人工肉眼识别进行,误差偏大,效率较低等问题,特别是收购季节时无法满足需要,同时企业信息化管理中也亟需及时获取稻米品质参数。结合企业实际需要,设计了包括5大功能模块的信息管理系统,如图2所示。系统设计符合SOA(Service oriented architecture)设计理念,实现质检信息公司内流通。稻谷的外观参数通过图像采集系统处理获得,水分含量通过烘箱烘烤后按标准操作获得,食味值通过日本佐竹公司米粒食味计(型号:RCTA11A)测试获得。系统操作风格一致,保证操作的简易性,良好的可理解性,按部门和职位设计了操作权限控制系统。系统还提供了多种系统管理工具,如自动程序更新、定时数据备份功能和用户异常访问检测等。

3.1 系统功能模块

1)进货检验模块。原粮进货检验是企业产品质量控制的入口,涉及质量本身和采购价格的确定。该功能主要针对原粮进货检验并提供数据操作界面,包括稻谷检验、面粉检验、面粉补填质检、大米检验等,并可以对数据进行新增、删除、查询、更新等可视化操作。包装检验主要检测采购部采购的各种包装的参数是否符合相关的技术要求,如尺寸、重量、色泽等,并通过图像采集系统采集图片存档。退回产品检验包括退回产品质检通知单和退回产品检验历史记录。退回产品可能有质量问题或者其他问题,首先由营销部回收从客户退回的产品,然后将退回产品送至质检部质检,检测客户提出的退回原因是否属实。

2)日常检验模块。普查检验包括4类检验:稻谷普查检验、米类普查检验、面条普查检验和面粉普查检验。①普查检验主要是针对仓库里的稻谷、米类、面条、面粉进行全面的阶段性的检验,检验产品的生虫、色泽、水分、黄粒米、气味等实际情况,便于及时了解仓库产品质量,以便更好管理;②生产检验是生产过程中对半成品或者成品进行检验,并记录检测值。生产部转换生产品种或者原料变动后,先生产出少量产品,送质检部质检,质检合格,再批量生产,否则改善不足之处重新生产。当生产过程中抽检发现异常时,发生产异常通知单通知生产部,并进行记录;③抽样检验包括3个子模块:抽样记录、抽样质检、抽样质检历史记录。抽样检验主要是配合上级领导来公司进行产品抽样质检。操作流程为首先登记来抽样的单位、抽样时间、抽样品种、经手人等信息,再进行检测,并做好记录保留备查;④普米检验,检测方法按照国家标准进行。

3)出货检验模块。出货检验的功能与生产检验的成品检验一致,主要保证出货产品的质量。

4)检验模块。质检报表汇总包括普米报表和原粮报表,以原粮报表为例说明。原粮报表包括:面粉收购报表、稻谷收购报表、普米收购报表。选择好起始时间与结束时间,即可获得相应报表,并可导出汇总信息。

5)认证记录模块。送外质检包括两个子功能模块,即送外质检和送外检验历史记录。送外质检主要就是定期的选择一些产品送到相关单位去检验,保证粮食产品符合规定要求。配方管理包括生产配方和生产配方历史记录,主要提供上传及下载功能。企业的配方资料属于保密资料,因此在设计配方管理这个模块时,应充分考虑到了其安全性,防止资料被窃取。在客户端上传数据时,采用将文件转换成二进制流后,进行3层DES加密后,再保存到数据库中,读取时进行相反操作。体系文件和质量标准都是公司分类保存各类资料电子档,供授权需要使用的部门查看浏览。

3.2 系统设计与运行效果

信息系统面向.NET框架设计采用MVC的设计方式,开发语言采用C#+ASP.NET,使用SQL Server 2008作为后台数据库。系统采用的是B/S(服务器/浏览器)架构,B/S架构是目前主流管理系统广泛采用的架构,实现了客户端零安装、零维护,使用浏览器直接实现远程访问。从层次结构来看,.NET框架包括3个主要组成部分:公共语言运行时(Common language runtime)、服务框架(Services framework)和上层的两类应用模板——传统的Windows应用程序模板(Win forms)和基于ASP.NET的面向Web的网络应用程序模板(Web forms和Web services)。SQL Server 2008允许在使用Microsoft .NET和Visual studio开发的自定义应用程序中使用数据,在面向服务的架构(SOA)和通过Microsoft Biz Talk Server进行的业务流程中使用数据,提供一个可信、高效率的智能数据平台。

以精米质检操作功能页面为例,在时间文本框中可以选择需要查询的时间段,点击搜索按钮,即可获得相应时间段精米的质检信息。点击详情栏目中的查看连接按钮,可查看质检的详细信息,主操作页面如图3所示,详细信息页面如图4所示。

4 小结

粮食企业生产经营中,稻米的视觉特征与稻米品质属性密切相关,目前的人工检测方法不能满足需要。图像分割是进行大米形态参数测量的关键环节,为提高测量的准确性和算法的鲁棒性,提出了一种结合先验知识的改进图像处理方法。针对现场大米质量对比试验,表明基于图像处理技术的方法比传统人工检测速度更快,有更准确的测量效果,检测出来的参数直接进入质量检测信息系统,供企业其他部门使用。该系统目前在某粮食企业中得到了较好的应用,有效地提高了企业的运行效率,增加了企业效益。

参考文献:

[1] 万 鹏,龙长江,任奕林.机器视觉技术在大米品质检测中的应用进展[J].湖北农业科学,2012,51(5):873-876,886.

[2] 黄星奕,李 剑,姜 松.基于计算机视觉的稻谷品种识别技术的研究[J].江苏大学学报(自然科学版),2004,25(2):102-104.

[3] 凌 云,王一鸣,孙明基,等.基于机器视觉的大米外观品质检测装置[J].农业机械学报,2005,36(9):89-92.

[4] 王静娜,贺园园,陈雄飞,等.机器视觉在农产品品质检测和采收包装中的应用[J].农机化研究,2011(7):186-189.

[5] 常若葵,张伟玉,崔 晶.基于机器视觉的大米外特性评价[J].农机化研究,2009(12):149-151.

[6] 高希端,孟超英,籍保平.机器视觉在稻米整精米率快速计算中的应用[J].食品科学,2007,28(5):268-272.

[7] 祝晓芳,侯彩云,芮 闯.基于计算机图像处理技术的黄粒米检测系统研究[J].粮油食品科技,2008,16(4):6-8.

[8] GB1350-2009,中华人民共和国国家标准稻谷[S].

[9] NIE F Y, GAO C, GUO Y C ,et al. Two-dimensional minimum local cross-entropy thresholding based on co-occurrence matrix[J]. Computers and Electrical Engineering, 2011,37(5):757-767.

[10] 周显青,白国伟,张玉荣,等.基于数字图像处理技术整米和碎米含量检测[J].粮食与饲料工业,2011(9):1-5.

篇5

学号

123

姓名

专业

软件工程

班级

软件工程

论文题目

基于JAVA的宠物平台管理系统

校内指导老师

(职称/学历)

风中弦/助教

校外指导老师

(职称/学历)

风/工程师

开题报告时间

20___年___月___日

星期___

开题报告地点

线上

旁听人数

10

记录员

风中弦

论文开题报告会会议内容:(参考下列几个方面,由记录员负责记录)

1.

选题的意义和实用价值

宠物平台管理系统的设计符合当前社会发展需要,符合现在时代的需要,随着现在社会的网络技术的发达以及领养宠物的越来越普及,快速且高效率的快递服务能有效的提高客户的体验,方便线上管理宠物信。

2.

方案的科学性、可行性及创新性的评价

方案很具有创新性,是针对当下宠物平台管理系统中的一项可行性较高的研究。且研究方案思路清晰,可行性很高。

3.拟采用的技术路线、解决的关键性问题及计划进度等是否切实可行

拟采用的技术路线有效可行,思路清晰,解决关键性问题有清晰有效的思路,且计划进度完全在可执行范围之内。

4.具体建议和意见以及结论(通过或不通过)

该课题设计方案合理,具有一定的实际价值和意义,同意开题。

评议小组对论文开题报告的主要意见及建议:(由记录员负责记录)

1.

将核心作用实现,系统开发是关键。

2.

要落实开题报告的具体步骤及内容。

开题报告评议小组意见

评议结论:(开题报告是否通过)

毕业设计题目符合毕业设计要求,同意通过。

评议小组组长签名:

评议小组成员

姓名

职称

研究方向

签名

小李

讲师

计算机视觉

小琳

教授

机器学习

小梅

讲师

数据挖掘

学院审核意见

院负责人签章:

篇6

以下就是麦肯锡列举的颠覆性技术及其潜在的经济影响程度(含消费者盈余在内,即消费者并未支付的因创新而获得的价值),当然,这种影响评估只是粗略的,不会像GDP数字那么具体(见图1)。

上图数字更具体一点:

如图2所示,麦肯锡认为,未来10多年最具经济影响性的技术应该是那些已经取得良好进展的技术一如已经在发达国家普及并在新兴国家蓬勃发展的移动互联网;知识工作的自动化,比方说用计算机语音来处理大部分的客户电话;物联网,比方说将传感器嵌入物理实体中用来监控产品在工厂的流动;以及云计算。按照麦肯锡的估算,到2025年,这些技术每一个对全球经济的价值贡献均超过1万亿美元(即便是预测的下限)。

不过麦肯锡的报告中令人感兴趣的预测是,一些比较性感的新潮技术,如无人驾驶汽车、3D打印、可再生能源等的经济影响相对较低。

这种炒作热度(关于技术炒作可参见Garnter的技术炒作周期)与潜在经济影响力的失联可以从图3(纵向坐标为炒作指数,以过去1年发表的效果技术文章数衡量;横向坐标为潜在经济影响)看出。经济影响力最大的技术并非炒作最厉害的。在图中,只有右上角的技术一移动互联网是名符其实的,即炒作与经济影响力相当。而相对而言,知识工作自动化、物联网、云计算以及先进机器人技术就要低调许多。

以下就是这12项技术的关键摘要:

1、移动互联网

价格不断下降能力不断增强的移动计算设备和互联网连接

到2025年的影响力:

经济:3.7-10.8万亿美元

生活:远程健康监视可令治疗成本下降20%

主要技术包括:

无线技术

小型、低成本计算及存储设备

先进显示技术

自然人机接口

先进、廉价的电池

关键应用包括:

服务交付

员工生产力提升

移动互联网设备使用带来的额外消费者盈余

2、知识工作自动化

可执行知识工作任务的智能软件系统

到2025年的影响力:

经济:5.2-6.7万亿美元

生活:相当于增加1.1-1.4亿全职劳动力

主要技术包括:

人工智能、机器学习

自然人机接口大数据

关键应用包括:

教育行业的智能学习

医疗保健的诊断与药物发现

法律领域的合同/专利查找发现

金融领域的投资与会计

3、物联网

用于数据采集、监控、决策制定及流程优化的廉价传感器网络

到2025年的影响力:

经济:2.7-6.2万亿美元,对制造、医保、采矿运营成本的节省最高可达36万亿美元

主要技术包括:

先进、低价的传感器

无线及近场通讯设备(如RFID)

先进显示技术

自然人机接口

先进、廉价的电池

关键应用包括:

流程优化(尤其在制造业与物流业)

自然资源的有效利用(智能水表、智能电表)

远程医疗服务、传感器增强型商业模式

4、云

利用计算机软硬件资源通过互联网或网络提供服务

到2025年的影响力:

经济:1.7-6.2万亿美元,可令生产力提高15-20%

主要技术包括:

云管理软件(如虚拟化、计量装置)

数据中心硬件

高速网络

软件/平台即服务(SaaS、PaaS)

关键应用包括:

基于云的互联网应用及服务交付

企业IT生产力

5、先进机器人

具备增强传感器、机敏性与智能的机器人;用于自动执行任务

到2025年的影响力:

经济:1.7-4.5万亿美元

生活:可改善5000万截肢及行动不便者的生活

主要技术包括:

无线技术

人工智能/计算机视觉

先进机器人机敏性、传感器

分布式机器人

机器人式外骨骼

关键应用包括:

产业/制造机器人

服务性机器人一食物准备、清洁、维护

机器人调查

人类机能增进(如钢铁侠)

个人及家庭机器人一清洁、草坪护理

6、自动汽车

在许多情况下可自动或半自动导航及行驶的汽车

到2025年的影响力:

经济:0.2-1.9万亿美元

生活:每年可挽回3―15万个生命

主要技术包括:

人工智能、计算机视觉

先进传感器,如雷达、激光雷达、GPS

机器对机器的通信

关键应用包括:

自动汽车及货车

7、下一代基因组

快速低成本的基因组排序,先进的分析,合成生物学(如“写”DNA)

到2025年的影响力:

经济:0.7-1.6万亿美元

生活:通过快速疾病诊断、新药物等延长及改善75%的生命

主要技术包括:

先进DNA序列技术

DNA综合技术

大数据及先进分析

关键应用包括:

疾病治疗

农业

高价值物质的生产

8、储能技术

存储能量供今后使用的设备或物理系统

到2025年的影响力:

经济:0.1-0.6万亿美元,到2025年40%-100%的新汽车是电动或混合动力的

主要技术包括:

电池技术―锂电、燃料电池

机械技术―液压泵、燃气增压

先进材料、纳米材料

关键应用包括:

电动车、混合动力车

分布式能源

公用规模级蓄电

9、3D打印

利用数字化模型将材料一层层打印出来创建物体的累积制造技术

到2025年的影响力:

经济:0.2-0.6万亿美元

生活:打印的产品可节省成本35-60%,同时可实现高度的定制化

主要技术包括:

选择性激光烧结

熔融沉积造型

立体平版印刷

直接金属激光烧结

关键应用包括:

消费者使用的3D打印机

直接产品制造

工具及模具制造

组织器官的生物打印

10、先进材料

具备强度高、导电好等出众特性或记忆、自愈等增强功能的材料

到2025年的影响力:

经济:0.2-0.5万亿美元

生活:纳米医学可为2025年新增的2000万癌症病例提供靶向药物

主要技术包括:

石墨烯

碳纳米管

纳米颗粒一如纳米级的金或银

其他先进或智能材料一如压电材料、记忆金属、自愈材料

关键应用包括:

纳米电子、显示器

纳米医学、传感器、催化剂、先进复合物

储能、太阳能电池

增强化学物和催化剂

11、先进油气勘探开采

勘探与开采技术的进展可实现经济性

到2025年的影响力:

经济:0.1-0.5万亿美元,2025年每年可额外增加32―62亿桶原油

主要技术包括:

水平钻探

水力压裂法

微观监测

关键应用包括:

燃料提取能源,包括页岩气、不透光油、燃煤甲烷

煤层气、甲烷水汽包合物(可燃冰)

12、可再生能源―太阳能与风能

用清洁环保可再生的能源发电

到2025年的影响力:

经济:0.2-0.3万亿美元,到2025年每年可减少碳排放10-12亿吨

主要技术包括:

光伏电池

风力涡轮机

聚光太阳能发电

水力发电、海浪能

关键应用包括:

发电

篇7

关键词:数字图像处理;教学改革;试验教学

0 引言

《数字图像处理》是一门汇聚光电探测、电子学、数学和计算机等众多领域技术的综合叉学科,通过对原始图像的加工,可以使图像具备更好的视觉效果,同时满足某些应用的特定需要。《数字图像处理》是一门偏重于应用的工程学科,经过半个多世纪的发展,目前已广泛应用于工业检测、医疗保健、航空航天、军事等各个领域,其巨大成就表现在航空航天遥感和医学图像的处理方面。在航天领域,为太空探测成功处理了数万张照片在生物医学领域,为开辟了无损诊断的先河,体现出其远大的发展前景。数字图像处理是模式识别、计算机视觉、图像通信、多媒体技术等学科的基础,已经成为高等院校电子信息工程、通信工程、信号与信息处理、计算机应用与软件等学科的一门重要专业课程。

对于工科类应用型高校,主要是培养具有创新意识和竞争力、符合市场需求的实用型人才,强调学生的应用动手能力。在《数字图像处理》课程的教学过程中,我们主要从授课内容、授课方式、试验课设计以及考核方式进行了改革,培养学生学习兴趣,掌握图像处理最基本的流程和基础知识,通过主动查阅文献资料与团队协作培养学生分析問题与解决問题的能力。近几年,我们对课程教学内容体系、教学方法与手段以及教师队伍等方面的进一步建设,不断进行科技创新,将工程与项目的开发与设计理念引入课堂与试验,取得了较明显的效果,最为显著的是学生在大四毕业设计中,具备扎实的图像处理相关基础知识,能很好地完成与图像处理相关的毕业设计课题。

1 授课内容改革

随着科学技术的发展以及信息时代的到来,图像处理的新理论和新方法层出不穷,并逐步应用于实践。《数字图像处理》课程教学的侧重点和教学内容也必须发生相应变化以适应时代对应用型人才培养的需求。

1.1优化整合教学内容

在众多的《数字图像处理》类教材中,选择了西安电子科技大学许录平编写的《数字图像处理》教材为主。主要考虑到该教材内容全面、知识新颖,在内容阐述上重点突出,实践性强,有较多的实例来帮助学生理解图像处理的理论和算法。同时以清华大学章毓晋编写的《图像工程(上册)图像处理和分析》与冈萨雷斯的《数字图像处理》作为我们的辅助教材。

该教材共分八章三大部分,第一部分是数字图像处理基础,包括绪论、图像处理基础和图象变换共三章。第二部分介绍图像处理基本方法和技术,包括图象增强、图像恢复和重建、图像压缩编码共三章。第三部分讲述数字图像分析的基本原理和技术,包括图象分割和图像描述共二章。对于应用型本科教学,我们对教材内容进行适当增删、重组。并划分成如下内容模块:图像基础知识(图像采集、量化与人眼视觉系统)、图像变换、图像增强、图像恢复、压缩编码、图像分割、图像描述与图像分类识别。课程教学的主要任务是系统地讲授各个模块的基本概念、基本原理与典型方法。目的是让学生掌握图像处理的基本理论和技术,建立一个比较完整的图像处理和分析的理论体系,并了解和掌握常用的图像处理和分析技术。

根据几年的教学实践经验,图像描述与图像分类识别应该属于图像理解的范畴,作为图像工程的高一级别的内容,可以在本科阶段略讲:而图像基本概念、各种图像变换、灰度图像增强、图像平滑、图像锐化和彩色图像处理的应用性比较强,且在生活中经常会遇到此类的应用需求,应尽量详讲;频域增强、图像复原、图像编码和图像分割的地位比较特殊,这些部分的数学知识比较多,现实中具有很大应用价值,应该予以讲授。

1.2补充学课前沿知识

在每个模块的内容讲授安排上,在注重基础知识与经典算法讲授的前提下,按照由浅入深、由易到难的顺序逐渐展开,并适当补充本领域中的一些新技术、新方法、新成果。例如:在讲授图像变换模块时,其中的Fourier变换与离散余弦变换(DCT),学生在其他前期课程中有所接触,相对来说学生容易接受与理解。在这个模块我们要补充的前沿知识就是“小波变换”。小波分析是当前应用数学与工程学科中一个迅速发展的新领域,经过近十年的探索研究,重要的数学形式化体系已经建立。理论基础更加扎实。与Fourier变换、DCT变换相比,小波变换是时间(空间)频率的局部细化分析,它通过伸缩平移运算对信号(函数)逐步进行多尺度细化,最终达到高频处时间细化,低频处频率细化,能自动适应时频信号分析的要求,从而可聚焦到信号的任意细节,解决了Fourier变通的困难問题,成为继Fouri-er变换以来在科学方法上的重大突破,有人把小波变换称为“数学显微镜”。小波变换联系了应用数学、物理学、计算机科学、信号与信息处理、图像处理、地震勘探等多个学科。它在信号分析、语音合成、图像识别、计算机视觉、数据压缩等方面的研究都取得了许多具有重大科学意义和应用价值的成果。再例如:在讲授图像平滑去噪模块时,除了讲解教材的均值滤波、中值滤波算法之外,还补充基于偏微分方程(PDE)的图像去噪方法。在图像处理与计算机视觉中采用PDE方法,是近些年以来图像处理领域中的一个重要分支,因为它在图像处理中具有更强的局部适应性(Local Adaptability)与高度的灵活性(Flexibility),并且日益成为相关领域研究者关注的一个热点,在图像去噪、边缘检测与图像分割方面积累了丰富成果。

通过在课堂上适当地补充学科前沿知识,不但可以开阔学生的视野,丰富学生的知识面,让学生明白更多、更新的方法在教材之外,要学会查阅相关文献,而不要局限于书本,从而激发学生的创新意识。同时,在各个模块内容的设计中要注重知识点之间、模块之间以及本课程与其他课程之间的内在联系,既体现知识的内涵,又关注知识产生的过程。既引导学生对当前所学内容举一反三,又能将新旧知识融会贯通。

2 教学过程的改革

2.1教学方式的选择

《数字图像处理》课程是一门既具有较强理论性又具有较强实践性的学科,其中不但有基本概念与理论。还有许多具体的算法与应用举例。所以,在教学过程中采用以“多媒体”为主,“粉笔+黑板”为辅的教学方式。多媒体教学手段的采用能使教学内容由平面到立体,由抽象到具体,由文字到声音图像,这一教学手段的运用极大地增强了课堂教学的直观性、互动性,调动了学生学习的主动性。而“粉笔+黑板”的板书可以用来进行公式的推导与演算,加强学生对公式的理解与记忆。

2.2项目式教学

为了有效地培养学生的应用能力,把基于项目式的教学策略引人课堂之中,以促进学生高级认知技能和問题解决策略的形成,将理论联系实际,培养学生分析問题与解决問题的能力。这一策略的主要方法就是:在讲授教材的知识点或具体算法时,先引入一个具体工程项目,通过对此项目的需求进行分析,让学生知道我们将要学习的知识在项目的哪个环节可以得到应用。这样既可以激发学生的求知欲,又能增强学生的学习兴趣,调动学习的主动性。例如:在讲授“图像增强”这个模块时,我们就以“视频监控”项目为背景,因为受光照条件、天气变化(雨雪、大雾)等因素影响,采集的视频图像往往不清晰,视觉效果很差,但是,通过我们将要学习的图像增强方法,可以大幅度地改善图像的视觉效果,提高图像的质量,如图1所示。

由于这一真实项目引领整个“图像增强”模块的学习过程,能够有效提高学生的学习积极性,也有利于学生掌握该知识点的具体应用价值,提高学生对理论知识的综合运用能力,从而提高学生分析与解决实际問题的能力。

3 试验教学的改革

在以住《数字图像处理》的试验课中,通常都是在MatLab环境中,对课本中的一些算法进行重复性验证,试验内容简单枯燥,无法引起学生学习的兴趣,更加不能使学生将所学的知识与实际生活中的应用需求相联系。

针对上述問题,我们进行了如下改革:

(1)设置具有应用性的“学期项目”让学生开发,激发他们的学习兴趣。俗话说“兴趣是最好的老师”,只要能够激发学生的学习兴趣,就能调动学生学习的主动性与积极性。为了调动学生的学习兴趣,我们选择兼具应用性与兴趣性的试验题目——例如“基于肤色特征的人脸分割”、“基于视觉相似性的图像快速检索”、“监控图像的增强与锐化”与“运动模糊图像的恢复”等,学生根据这些“学期项目”,分成多个小组,每个成员在组内具有明确的分工与任务,各负其责,共同完成“学期项目”软件开发。

(2)在“学期项目”软件开发时,鼓励学生多采用教材之外的新理论与新方法,培养开拓创新能力。要求学生在了解试验目的前提下,自己进行方案设计,选择适当的算法。近些年以来,各种类型的图像处理新理论与新方法层出不穷,在不同的应用场合,各自的优点与缺点互不相同。鼓励学生通过互联网与学校的图书馆,查阅最新文献,形成自己的特点,培养学生的科技创新能力。在试验成功后,不但要进行试验结果与算法性能分析,还要书写软件设计方案等文档。

(3)组建图像处理兴趣小组。因为受课程学时限制,仅仅只利用课内时间,则非常有限。我们就组建了图像处理兴趣小组,让他们参加到教师的科研与项目中来,使学生在真实的项目研发中锻炼自己的综合能力。

最后,在期末之前安排两周的时间对学生的“学期项目”进行集中检查,检查的内容主要包括:①系统演示;②功能方面是否正确完整;③算法的适应能力是否鲁棒;④算法的效率是否高效;⑤程序代码是否规范;⑥试验分析报告与PPT汇报。然后,根据这些方面的检查情况,对学生的学习情况与动手能力进行评分。这是基于项目试验教学改革的重要环节,不但可以督促“学期项目”完成的质量,还能提高学生分析問题与解决問题的能力。

4 评价机制的改革

对于公选课的《数字图像处理》课程,我们采用了“笔试+课堂表现+试验考核”的一种综合考核方式。其中笔试环节重点考察学生教材上的基本概念、基本算法等知识点记忆与掌握程度:课堂表现主要考察学生的学习态度,主要包括出勤率与读书心得等内容:试验考核主要是考察学生综合应用能力,其中包括所选“学期项目”的完成质量与试验分析报告与软件设计文档。

《数字图像处理》作为一门实践性、应用性都很强的课程,在考核时,要加大平时考查在最终成绩认定中的比重,要重点突出“学期项目”完成质量在学习中的重要性,从而激发学生实践学习的主动性,提高学生的实践能力、创新能力,最终达不到理想的教学效果。

此外,由于选修本门课程学生基础各异,专业背景相差较大,采取“分层评价”也是一种应该提倡的方法。“分层评价”也是教学过程中的一个重要环节,它是根据学生的知识水平和学习能力的差异,对不同专业的学生采取不同的评价标准以及对他们的期望值。

5 结语

篇8

关键词:人才培养;数字媒体技术;课程体系;游戏开发

1 背 景

江苏省政府和南京市把计算机软件产业作为优先鼓励发展的支柱产业,作为新兴战略性产业的重点发展。南京市政府特别重视计算机与信息产业的发展,提出提升规模、企业发展与创新的主要目标[1-2]。早在2011年,南京市委和市政府就提出《关于以打造一谷两园软件产业集聚区为重点高标准建设中国软件名城的意见》,提出将南京建设为中国软件名城的目标,计算机软件产业业务收入预期达到4 000亿元以上,并在2020年初步建成世界软件名城。从软件技术与专业人才培养角度来说,数字媒体技术作为计算机软件产业中的一个重要发展方向,虚拟现实技术与人工智能近年来日臻活跃,越来越显现出发展的活力与潜在的前景。数字媒体技术专业学生从总体上讲应具有较扎实的计算机和数字媒体基础知识,掌握数字媒体基础、图形图像处理、音频视频处理、流媒体、虚拟现实、游戏编程等专业基础知识;具备包括虚拟现实、多媒体编程、网络游戏、数字图像处理和计算机视觉等专业技术的能力,具有图形、图像、音频、视频处理及数字媒体应用系统开发的能力。

2 数字媒体技术专业预期形成的专业与人才特色

依据数字媒体产业中游戏行业对人才的迫切需求,以学生系统能力培养为主线,以新型应用型工程技术人才为培养目标,将当前游戏开发中的最新编程平台与先进技术引入专业课程体系,按照网络游戏与手机游戏开发工程师的知识和实践能力组织课程的设置,通过计算机图形学、三维建模、移动游戏开发编程、网络游戏开发编程、Unity3D开发引擎的游戏开发技术等专业课程的设置,突出以游戏开发工程师为培养目标的学生实践能力锻炼。数字媒体技术专业依托行业内企业多年的数字媒体产品开发经验与培训能力,进行产教融合与校企合作办学,突出以游戏开发为主的数字媒体技术方向的专业特色,更好地满足人才培养目标定位需求,并为后期工程教育认证打下基础。

3 数字媒体技术专业建设的主要内容

3.1 以游戏开发为主要特色的课程体系建设

突出以游戏开发为主要特色的数字媒体技术培养方向,主要专业基础与专业课程由以下组成:数字媒体技术基础、计算机网络、算法与数据结构、计算机图形学、三维建模、操作系统、面向对象程序设计、网络游戏开发编程、移动游戏开发编程、游戏UI设计、游戏算法、游戏开发技术、图形处理技术等。课程的总体分布与关系见表1。

我们多选用新出版的优秀教材,将教材的适用性作为教学过程控制的主要监测点。对于知识更新较快的课程,组织有经验的教师自编教材并及时修订,跟踪反映数字媒体技术产业的新技术、新成果。

3.2 实践实训基地建设

产学研结合的实践教学模式是计算机类专业办学的一大特色[3],学院始终把创建校外产学研实习基地工作放在重要位置,使得学生获得实际的研究、开发、设计的实践教学机会,全方位、系统地培养学生的技术应用能力和创新能力[4]。目前,数字媒体技术专业依托的计算机工程学院,同东软集团股份有限公司、中软国际集团有限公司、南京麦瑞克科技有限公司、江苏万和等多家大中型企业签订了《共建教育实习基地协议书》。通过校外实习基地,学生能够参与数字媒体产品开发过程,在实践中加强学生的实际工作能力[5],从而达到培养综合素质高、创新能力强、富有团队精神的应用型高级数字媒体技术专业人才的目标。学生从第6学期的专业实习、第7学期的工程项目实践与毕业实习参与到学院合作方――南京麦瑞克科技有限公司的研发项目中,专业实习与工程项目实践是数字媒体技术方向的重要教学环节。通过专业实习与工程项目实践,学生能够系统地掌握游戏开发的知识体系和整个流程,以及具体案例的开发过程,锻炼自身的实践动手能力。学生在实训中掌握了企业项目实际管理流程,提高了适应能力。学生以实践开发小组为单位完成相关系统功能与模块设计,撰写相应的策划文档以及开发规范文档,根据设计选择相应的技术进行资源优化和打包,对于系统进行集成开发与部署。开发报告应包含组员角色及分工、系统的分析和设计报告、项目开发流程管理的要点、实践总结等内容,并附有软件系统的完整开发用例源代码。指导教师根据实践的情况,包括实践小组的讲解和演示,总结实践开发的收获、创新与成果。

专业实习是综合性实践环节,通过专业实习可以让学生理解游戏系统的完整开发过程。专业实习涉及游戏UI设计、三维建模、图形处理技术等核心专业基础及专业课程。通过专业实习,学生可以在游戏开发的方法和技术、系统分析与设计、计算机软硬件的配置与管理、虚拟现实开发等方面得到锻炼。通过建模,学生可以完整地理解游戏场景系统开发的整个过程。例如在游戏场景房屋模型制作项目,通过三维建模与一些基本的操作命令,学生可以搭建常见游戏场景中的房屋模型,完成房屋模型制作的工作,为以后制作大型场景打下技术基础。

工程项目实践涉及面向对象程序设计、C#程序设计、移动游戏开发编程、游戏开发技术等核心专业课程。工程项目实践的内容包括联机火线战争、虚拟旅游、跑酷类游戏等综合性游戏开发项目,让学生对游戏的开发流程有详细的了解,熟练使用Unity游戏引擎工具,在游戏的策划―游戏的界面交互设计―游戏的开发逻辑―游戏优化―游戏―游戏上传等整个游戏开发全生命周期内进行综合性工程项目实践,同时工程项目实践有利于培养学生的书面表达能力、全面策划思考能力、自主学习能力、需求研发能力和探索创新能力。

3.3 合作办学

2016年起,金陵科技学院计算机工程学院与澳大利亚昆士兰理工学院(QUT)合作,采用“2+2”联合培养模式,共同培养数字媒体技术专业的本科人才。QUT课程体系采用CDIO工程教育思想,着重锻炼学生的综合素质和能力。自2016年开始学院在数字媒体技术专业人才培养方案中嵌入NIIT(National Institute of Information Technology,印度国家信息技术学院)课程模块,培养具备国际视野的数字媒体技术专业人才。2016年数字媒体技术专业的计划招生人数为40人,班级为正常教学班,不单独针对国外学习而组班。在新生入学教育时,鼓励学生通过雅思考试,在大学三年级申请去昆士兰理工学院深造。数字媒体技术的人才培养借鉴了澳洲高等教育教学的先进模式和成功经验,包括外方优秀的教学形式、考核方式及评估标准。合作教育将由引进外方优秀教师与中方资深教师共同完成。在大学一年级下学期做雅思考试动员,相应的英语课程引导学生进行雅思综合英语、雅思口语、雅思读写、雅思听说、英语语言和文化、学术英语课程的学习,为雅思考试做好准备。通过雅思考试的学生可以申请出国学习,国外第二阶段的专业课学习将采用全英文学习。通过国外的系统学习,学生将全面地掌握网络游戏、手机游戏、虚拟现实等数字媒体相关的基本理论与方法,能综合运用所学知识与技能去分析和解决数字媒体领域的实际问题,同时拥有专业和外语双重素质,成为富有责任心和创新能力的国际化应用型优质人才。出国的学生完成昆士兰理工学院后两年的专业课程学习,毕业时将获得双学位证书。未出国的学生按照教学计划继续完成国内的学业,毕业时将具有较强的计算机技术应用能力,能熟练使用常见游戏开发及虚拟现实软件,掌握信息检索、文献检索、资料查询的基本方法,具有独立获取知识、较强的综合分析与管理的能力及一定的科学研究能力。

昆士兰理工学院数字媒体技术专业的8门专业基础课为:Programming for Visual Design、Real-time 3D Computer Graphics、Data Structures and Algorithms、Databases、Computer Games Studies、Virtual Environments、Software Development、AI for Games。我院数字媒体技术专业大一、大二的教学计划中与之对接的课程是:视觉设计编程、实时3D计算机图形学、算法与数据结构、数据库系统原理、计算机游戏基础、三维建模、面向对象程序设计、游戏开发中的人工智能8门课。由于这8门课程基本为专业基础课,因而数字媒体技术专业大一、大二的教学计划对于国内和准备去国外学习的学生而言都通用,可以做到跟后续专业课程的无缝对接。在教学计划中,我院上述8门课程使用昆士兰理工学院的教材、课件等教学资料,按昆士兰理工学院的要求完成教学任务。视觉设计编程(Programming for Visual Design)课程以C#课程为切入点讲授数字娱乐产业涉及的编程技术;三维建模(Virtual Environments)主要讲解三维建模内容;游戏开发中的人工智能(AI for Games)以讲解游戏算法为主。将国外实时3D计算机图形学、游戏开发中的人工智能、视觉设计编程、三维建模与实时渲染技术等最新的课程逐步地引入我院数字媒体技术专业的教学体系,不断促进专业水平的提高。

4 结 语

实践证明,我校数字媒体技术的人才培养计划的实施,进一步完善了应用型工程型本科人才培养体系,国内IT企业能深度地参与本专业的人才培养,校企融合共同培养适应“长三角”地区数字媒体技术的人才;同时,通过国际合作开阔了学生的视野,为南京以及长三角的游戏产业高层次的软件开发人才培养打下基础。我校数字媒体技术专业将强调对游戏开发能力培养,注重从游戏算法的角度解决游戏开发中遇到的实际问题。今后我们将进一步精选企业课题,将课题与学生工程项目实践、毕业设计高度结合,实现学生实习到就业的无缝对接。

参考文献:

[1] 张燕, 史金芬, 沈奇. 改革教学模式培养高素质软件人才[J].金陵职业大学学报, 2003, 18(4): 18-20.

[2] 刘钰, 张燕, 沈奇, 等. 卓越工程师计划下的嵌入式软件人才培养[J]. 计算机教育, 2014(9): 48-51.

[3] 沈奇, 张燕, 罗扬. 应用型本科实践教学体系的构建及改革[J]. 实验技术与管理, 2010(12): 39-41.

篇9

认知计算互联网保险应用

一、认知计算的涵义及特点

认知源于心理学里的概念,《辞海》将其解释为人类认识客观事物,获得知识的活动,包括知觉、记忆、学习、言语、思维和问题解决等过程,是对外界信息积极进行加工的过程。通常使用的认知技术包括机器学习、计算机视觉、语音识别、自然语言处理和机器人学等。

认知计算技术,基于算法、数据、软件、硬件实现,关键特点是理解、推理和学习。理解是通过感知和互动,快速理解数据,实现用户交互,从而理解、回答用户的问题。推理是凭借假设生成技术,透过数据揭示洞察力、模式和关系,以多种方式进行认知,产出多种结果。学习是能够从所有文档中快速提取关键信息。通过追踪用户反馈和专家训练,不断进步,提升解答能力。

二、认知计算的商业化应用

2011年,IBM沃森带来认知计算的概念,当时人们对这项吸引眼球的新奇技术能做些什么还非常懵懂。沃森通过解读自然语言来分析数据,有的成了医生,有的担任教师助手,有的成为一流的厨师,还有一个赢得了电视智力竞赛《危险边缘》的冠军,成为人工智能打败人类的经典案例。五年后的今天,随着物联网、云计算和大数据技术的发展与应用,认知计算的商业化应用越来越值得期待。

认知计算的商业化应用或将带来不可思议的变化。在医疗领域为疑难杂症快速提供诊疗方案,帮助企业从大量数据中发掘、洞察增强预测和决策能力;在旅游、美食等领域帮助人们获得更好的生活体验;甚至帮助红毯上的模特设计出“会表达情绪的时装”。认知计算使得机器人更加接近于人类的需求,这些应用将造福于人类,值得更多期待。

根据德勤研究报告,认知计算技术或将在以下三个企业级软件市场中发挥作用。一是企业级应用软件市场专注于利用计算机的力量来达成特定目标。比如解决如何向大量匿名用户进行线上营销的问题,采用机器学习去发掘某一网站的新用户与之前具有相似行动的用户之间行为上的关联,目标就是为了使该网站的用户体验更好,并将其转化成销量。二是企业级基础软件市场为公司建立、运行,以及管理IT资源的表现提供工具。比如利用机器学习能力提升应用系统的日志工具,可以将具有类似服务器问题的事件归为一类,以方便IT经理辨认这是一个正在发生的问题、还是实时信息导致的不寻常的计算趋势。三是特定垂直软件关注一个狭窄的领域,常体现为一个独立的软件应用。比如一套独立的肿瘤学应用,通过移动和桌面设备,深度机器学习可以分析大量的病患记录并基于现有记录提供潜在的治疗手段。

在销售方面,机器人可能比人类做得更好。日本大阪大学智能机器人实验室科研人员曾开发出一个生动的女机器人,将其放入一家百货商店内,销售一款100美元的羊绒衫。在试验期间,机器人接待的消费者数量是商场销售员接待数量的2倍。通过与IBM沃森云计算平台合作,软银旗下第一款可感知人类情绪的机器人Pepper的“智力”进一步得到强化,Pepper或将以“销售员”的身份入驻日本最大的电器销售商山田电机(Yamada Denki)。之前,Pepper曾帮助销售过智能手机和咖啡机等商品,但工程人员希望强化Pepper提供相关信息的能力,与消费者进行更丰富的互动。Pepper与人类进行彻底的无障碍交流仍存在困难,需要进行更多神经式网络的培训。据悉,软银接受其他企业对Pepper的租赁订单,每月租金为55000日元,仅为日本平均最低工资的一半。

三、认知计算技术在互联网保险的应用前景

近两年互联网保险保费规模实现爆发增长,互联网保险渗透速度加快。越来越多的保险公司意识到互联网保险不仅是销售渠道的变迁,还是依照互联网的规则和习惯,对现有保险产品、运营和服务模式的深刻变革。互联网保险,一方面把传统的保险产品搬到互联网上销售,并提供配套的产品服务;另一方面利用互联网经济的新型消费场景,提供创新型保险产品。互联网保险打破时间和空间的限制,随着物联网、大数据、人工智能以及移动设备等新技术的兴起,或将迎来保险行业的一场深刻变革。

认知计算技术可以帮助保险企业更好地认知客户、也更深刻地认知自己。认知客户,知道客户所想所需,改进保险销售和服务,解决痛点问题;认知企业,找到运营管理盲区,提升内部运作效率。

在《2016年中国互联网保险行业研究报告》中指出,人工智能最先改造保险的销售渠道。美国的一家保险科创公司使用智能机器人销售车险保单,只要拍下车牌号并发送给机器人,它就能搜索到用户的个人信息和驾驶记录,从而推荐合适的险别。同时,通过减少人数来提高效率的成本策略,例如,呼叫中心通过将第一层顾客支持自动化来减少需要聘用的员工。

不管是服务型还是销售型的呼叫中心,通常采用传统的IVR技术提供服务菜单,受限于数字键盘的数量和语音逐条播报耗时较长,寻求服务的用户最希望的还是用最快的速度找到人工客服,解决问题;寻求产品的用户希望用最快的速度触达产品,减少等待。而呼叫中心面临的挑战是基于接线率灵活快速配置人力资源,而不单纯地通过增加人数来提升接线率。大数据时代,认知计算与呼叫中心技术有着天然的默契,在一定程度上帮助合理配置人力。在与用户通话的另一端安装上智慧的“大脑”。

针对服务型呼叫中心,可以利用认知技术,将标准服务话术的知识库安装到认知智能应答机器人的大脑,降低企业培训和人力成本。针对销售型呼叫中心,具有认知计算大脑的机器人可以承担简单地销售业务场景,例如解决呼入溢出场景的预约投保,解决销售过程质量的自动回访,帮助老客户续签新一年保单,为新客户提供粗略产品报价、解释营销活动和赠品规则等。也可以结合社交媒体、用户网购、驾驶行为等多维度数据,分析客户类型,帮助人工坐席更好地理解客户。

认知时代,机器或将变成下一代计算机,因为计算的能力,对于机器学习算法的理解,对于大脑的研究都在往前走。计算可以带来更多的突破。我们拭目以待。

参考文献:

[1]董超,毕晓君.认知计算的发展综述[J].电子世界,2014(15):200-200.

篇10

“机器学习对我而言,是为了让人类能够不用像机器那样去做事。”11月10日,在Google公布开源第二代机器学习系统的第二天,Google母公司Alphabet董事长施密特(EricSchmidt)通过视频向包括《第一财经日报》在内的媒体表示。

面对在场媒体,施密特举例称:“你们都是记者,在会场还要不停地用电脑打字,而不只是听和说。为什么不能让机器去做比如制造业的重复工作、很多打字的工作?”他预计,在Google公布开源第二代机器学习系统之后,尤其是在医疗、游戏、教育等领域,机器学习将发挥巨大的价值。

机器学习背后的黑科技

机器具备学习能力究竟有多重要?Google科学研究员GregCorrado做了一个比喻:“机器学习就像火箭助推器,而大量的数据就是火箭的燃料。”

谷歌机器学习的原理是:用众多的电脑模拟人脑中的“神经元”,形成一个人的“神经网络”(ArtificialNeuralNetwork)。它不需要借助大批研究人员帮助电脑标明事物之间的差异,只要为算法提供海量的数据,“神经元”与“神经元”之间的关系将会发生变化,让数据自己说话,让组成“神经网络”的机器具备自动学习、识别数据的能力,在新的输入中找出与学到的概念对应的部分,达到机器学习的效果。

例如,当人们需要计算机辨别图片内容的时候,各个人工神经元就会把所抓取的信息传递给被设置为“决策者”的神经元上,它们通过统观其下层所有神经元所呈现的信息,结合案例、数据的分析及算法最终得出结论。

事实上,谷歌对于机器学习的研究要追溯到7~8年前的语音技术开始。但施密特透露,机器学习这一技术取得突破性进展,是发生在计算机视觉领域。

三年前,Google科学家杰夫·狄恩(JeffDean)在接受《第一财经日报》采访时透露,“GoogleX”实验室通过连接16000台计算机处理器,创建了一个机器学习的神经元网络系统。结果发现,这个系统自行创建了猫这个概念并且自学了对猫的辨认,这就是“自我学习”。

不过,当时的谷歌机器学习还只是一个实验项目,局限于认知类的简单工作。几年过后的今天,谷歌的机器学习已经从识别谷歌应用中的语言和图片的第一代机器学习系统“DistBelief”更新到了第二代的TensorFlow系统,并且应用于Gmail、GooglePhotos、Google翻译、YouTube等产品中。

Google研究员GregCorrado告诉记者,利用机器学习技术,Gmail电子邮件服务的垃圾邮件拦截率提高到了99.9%,误报率降低至0.05%。这背后的原因就是,在垃圾邮件过滤器中引入了机器学习,这一技术能够通过分析大量计算机上的电子邮件学习识别垃圾邮件和钓鱼邮件。更重要的是,机器学习能够适应不断变化的情况,而非只是利用预先设置好的规则拦截垃圾和钓鱼邮件,它还能在运行过程中自己创建新的规则。

而另一个能代表这项技术的最新产品是,谷歌在Gmail上推出智能自动回复功能SmartReply。SmartReply是基于Google机器学习系统,对海量邮件里的场景、邮件写作风格和写作语气进行分析,从而帮助用户筛选适合语境的回复短句。

“一小步”与“一大步”

“在Google内部,现在机器学习已经是谷歌搜索中第三大重要的技术。”GregCorrado对记者说,人工智能是科学家希望机器变得更智能,从经验和数据中学习。“手动去编程机器显然没有让它自己学习来得更有效。”

不过,实现机器学习的训练过程仍然漫长。在这个过程中,机器需要做大量测试、调整和适配工作,也很有可能犯一些人们不大可能犯的错误。

这也正是Google把机器学习系统的大门向业界工程师、学者和拥有大量编程能力的技术人员敞开的原因,希望业界将TensorFlow实现各种各样的机器学习算法,同时也为其在各种场景下的应用带来改进。

“例如,计算机的视觉如果比人更好,为什么还要人去开车?应该让机器开车。现在是医生看X光,未来如果让机器看是否会做出更准确的诊断?”施密特说,“在开源之后,如果全世界的聪明人都将给Google很好的回馈,Google会有更好的发现,让产品和服务更完美。”

他同时提到,机器学习非常善于预测时间先后顺序的事件的发生,自己尤为看好机器学习在医疗、游戏、教育等领域发挥的价值。“甚至我们竞争对手的团队都会用它,这就是谷歌不同于别人的原因。”

对于目前Google机器学习的开放策略,GregCorrado表示,一方面,Google开放机器学习,在于鼓励大家从不同角度去研究,即使在Google内部,也不只是一种方法去做机器学习;另一方面,Google已经和学术界、企业界、不同的实验室合作,例如Facebook、百度等。

他同时认为,机器学习并不是魔术,不要盲目地认为机器学习就一定比没有机器学习的好,它只是工具,能够让研究人员转化他们疯狂的创意,而不需要他们重新编写代码。