如何学习计算机视觉范文

时间:2023-12-28 17:38:54

导语:如何才能写好一篇如何学习计算机视觉,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

如何学习计算机视觉

篇1

关键词:计算机视觉;案例推理;图像处理;图像描述

中图分类号:TP391.41 文献标识码:A文章编号:1009-3044(2007)04-11102-03

1 引言

基于案例推理(case-base reasoning)是人工智能中正不断发展的一项重要推理技术。基于案例推理与类比推理方法相似,案例推理将旧经验或教训转换为知识,出现新问题时,首先查找以前是否有相似的案例,并用相似案例解决新问题。如果没遇到相似案例的,经过推理后解决新问题的方法,又会成为新的案例或新经验,下一次再遇到相同问题时,就可以复用这些案例或经验。

这与人遇到问题时,首先会用经验思考解决问题的方式相似,这也是解决问题较好的方法。基于案例推理应用于工业产品检测或故障诊断时具有以下特点:

CBR智能化程度较高。利用案例中隐含的难以规则化的知识,以辅助规则推理的不足,提高故障诊断系统的智能化程度。

CBR较好解决“知识获取”的瓶颈。CBR知识表示以案例为基础,案例的获取比规则获取要容易,大大简化知识获取的过。

CBR求解效率较高。是对过去的求解结果进行复用,而不是再次从头开始推导,可以提高对新问题的求解效率。

CBR求解的质量较高。CBR以过去求解成功或失败的经历,可以指导当前求解时该怎样走向成功或避开失败。

CBR持续不断的学习能力,使得它可以适应于将来问题的解决。

所以基于案例推理方法正不断应用在产品质量检测和设备故障诊断方面,并取得较好的经济效益。为了产品检测和设备故障诊断中,更为智能化,更容易实现现场检测和诊断,计算机视觉技术起到很大的作用。

计算机视觉是研究用计算机来模拟人和生物的视觉系统功能的技术学科,使计算机具有感知周围视觉世界的能力。通过计算机视觉,进行图像的获取预处理、图像分割与特征抽取、识别与分类、三维信息理解、景物描述、图像解释,让计算机具有对周围世界的空间物体进行传感、抽象、判断的能力,从而达到识别、理解的目的。

计算机视觉随着科学技术发展,特别计算机技术、通信技术、图像采集技术、传感器技术等,以及神经网络理论、模糊数学理论、小波的分析理论等计算机视觉理论的不断发展和日趋成熟,使计算机视觉从上世纪60年代开始兴起发展到现在,取得快速发展,已经从简单图像质量处理发展到围绕着纹理分析、图像编码、图像分割和滤波等研究。图像的分析与处理,也由静止转向运动,由二维转向三维,并主要着眼于对图像的识别和理解上,也使计算机视觉的应用领域更为广泛,为案例推理中运用计算机视觉打下基础。

2 案例推理系统的主要关键技术

(1)案例的表示与组织

案例的表示与组织即是如何抽取案例的特征变量,并以一定的结构在计算机中组织存储。如何将信息抽取出特征变量,选择什么语言描述案例和选择什么内容存放在案例中,案例按什么组织结构存放在存储器中,这关系到基于案例推理方法的效率,而且对于案例数量越来越多,结构十分复杂的案例库,尤其重要。

(2)案例的索引与检索

案例的索引与检索即是为了查找最佳相似案例,如何建立案例索引和相似度算法,利用检索信息从案例库中检索并选择潜在可用相似案例。后面的工作能否发挥出应有的作用,很大程度上依赖于这一阶段得到的案例质量的高低,因此这一步非常关键。

(3)案例的复用和调整

案例的复用即是如何根据旧案例得出新解,涉及到找出案例与新问题之间的不同之处,案例中的哪些部分可以用于新问题,哪些部分不适合应用于新问题的解决。而复用还分案例的结果复用,案例的求解方法复用。

(4)案例的学习

案例的学习即是将新解添加到案例库中,扩充案例库的案例种类与数量,这过程也是知识获取。此过程涉及选取哪些信息保留,以及如何把新案例有机集成到案例库中,包括如何存储,如何建立索引等等。

针对案例推理的关键技术,根据检测和故障诊断系统的特点,计算机视觉主要解决如何将产品图像输入系统,如何将产品图像特征进行抽取和描述,如何区别产品不同之处。以便案例推理系统进行案例建模,确立案例的表示形成和案例相似度的计算。本文主要从计算机视觉如何运用在案例推理系统进行探讨。

3 产品输入系统

产品输入系统在不同产品类型和生产环境可能有不同之处,主要应有传感器单元和图像采集单元。如图1。

图1 产品输入系统结构

传感器单元主要判断是否有产品存在,是否需要进行图像采集,是否继续下一个产品图像的采集。这简单传感器可使用光电开关,配合光源,当产品经过时,产品遮挡住光源,使光电开关产生一个0值,而没有产品经过时,光电开关产生相反的1值,系统通过判断光电开关的值,从而判断是否有产品。

图像采集单元简单地说是将产品拍摄并形成数字化图像,主要包括光源、反射镜、CCD相机和图像采集卡等组成。光源和反射镜作用主要使图像中的物体和背景之间有较大灰度。CCD相机主要是拍摄设备。图像采集卡主要是将图像数字化。通过传感器判断有产品后,光源发出的光均匀地照在被测件上,CCD相机拍摄,拍摄图像经过图像采集卡数字化后输入存储设备。存储设备即为计算机硬盘。存放原始图像、数据、处理结果等。

这是案例推理系统的原始数据,是图像处理、图像特征抽取描述的基础。

4 图像处理

在案例推理系统中,需要对案例的组织和案例建模,案例的组织即案例的表示,相对计算机而言,即图像特征的抽取,即某图像具有与其它图像不同之处,用于区别其它图像,具有唯一性。同时,又能完整地表示该图像。所以案例的表示要体现案例的完整性、唯一性、操作容易性。

图像中有颜色区别、又有物体大小之分以及图像由不同的物体组成。如何表示图像,或说图像内部包含表示的本质,即图像的描述。根据图像特点,确立图像案例的表示,以图像的像素、图像的数字化外观、图像物体的数字组成等属性。这需要对产品输入的原始图像进行处理。

在计算机视觉技术中,对原始图像主要进行图像增强、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,输出图像的质量得到相当程度的改善,既改善了图像的视觉效果,又便于计算机对图像进行分析、处理和识别。具体工作流程如图2所示:

图2 计算机视觉的任务与工作流程

图像预处理是将产品的数字图像输入计算机后,首先要进行图像的预处理,主要完成对图像噪声的消除以及零件的边缘提取。预处理的步骤为:图像二值化处理;图像的平滑处理;图像的边缘提取。

图像二值化处理主将灰度图形二值化的关键是阈值的选取,由于物体与背景有明显的灰度差,可以选取根据灰度直方图中两峰之间的谷值作为阈值来分割目标和背景。

图像的平滑处理技术即图像的去噪声处理,主要是为了去除实际成像过程中因成像设备和环境所造成的图像失真,提取有用信息。

图像边缘提取是为了将图像中有意义的对象与其背景分开,并使之具有某种指定的数学或符号表达形式,使计算机能够理解对象的具体含义,检测出边缘的图像就可以进行特征提取和形状分析了。可采用多种算法,如采用Sobel算子提取边缘。

图像预处理是为下一步的特征描述打基础,预处理的好坏直接影响案例推理的结果和检测诊断的效率。

特征提取是对图像进行描述,是案例建模关键,案例建模是根据案例组织要求抽取图像特征,是建立案例索引和检索的关键。如果图像没有特征,就谈不上进行检索。图像特征可通过图像边界、图像分割、图像的纹理等方法,确定图像特征,包括是什么产品、产品形状大小、产品颜色,产品有什么缺陷、产品缺陷在什么位置等特征,根据这些图像特征进行描述,形成计算机中属性值,并从数据库查找相应信息资料,从而确定产品之间的关系,相似度,也就是案例推理的方向。

5 系统的检索

根据案例推理原理和相应算法,建立案例推理系统模型,如图3所示。

图3 案例推理系统

对话系统:完成人机交互、问题描述、结果显示和系统总控制。

案例库系统:由案例库及案例库管理系统组成。

数据析取系统:对各种已有的源数据库的数据通过转换而形成所需的数据。

多库协同器:根据问题求解的需要,按照一定的数据抽取策略,完成问题求解过程中对模型库系统、方法库系统、知识库系统和数据库系统等资源的调度与协调。

知识库系统:由产生式规则组成,这些知识包括专家经验和以规则形式表示的有关知识,也可以是数据挖掘结论,支持案例检索、案例分析、案例调整等。 模型库系统:由模型库、算法库、模型库管理系统组成。完成模型识别和调用,并把结果综合,送入对话系统显示,作为补充信息供案例检索、调整使用。

数据库系统:存放待决策支持的所有问题,并完成其维护与查询等功能。

由于系统主要应用产品的现场实时检测监控或故障诊断,所以系统的检索时,也必须输入检索值,即输入现场产品的图像,在通过产品预处理、图像的二值化、分割和边界处理后,进行图像特征描述,根据图像描述进行分类识别。根据案例推理的算法检索案例库中,是否有相似的案例。即确定相似度。相似度确定主要由案例推理的算法确定,如贴近分析法。确定相似度最大作为结果,并将案例的解输出,给相关控制系统进行决策。如产品质量检测,确定产品质量是否合格,是否有不合格产品,不合格产品是什么原因造成,故障源是什么,如何解决和排除故障,等等。

6 结论

案例推理方法有效地解决计算机视觉技术中图像检索问题。对提高图像检索的效率和准确度提供了平台。

计算机视觉技术也为案例推理系统实现产品现场实时检测、监控、诊断提供技术支持。计算机视觉技术现场的数据采集、处理为案例推理打好基础。

两者的结合设计的系统适用范围很广,只要产品需要进行质量检测、监控,或设备需要进行故障诊断和维护,都可以适用。

系统提供的实时检测、监控和诊断功能,提高企业的生产效益,降低了生产成本。

参考文献:

[1](美)桑肯(Sonka,M).图像处理分析与机器视觉[M].人民邮电出版社.

[2]王宏等译.计算机视觉[M].电子工业出版社.

[3]蔡建荣.自然场景下成熟水果的计算机视觉识别[J].农业机械,36(2):61-64.

[4]王宇辉.基于计算机视觉的锥体零件尺寸在线检测算法[J].重型机械,2005,2:4-6

[5]骆志坚.基于计算机视觉检测技术自动计数系统的研究与应用[J].仪表技术与传感器,2005,3:41-43.

[6]左小德.贴近度分析法在案例库推理中的应用[J],南大学学报(自然科学版),1997,18(1):21-26.

[7]姜丽红.案例推理在智能化预测支持系统中的应用研究[J].决策与决策支持系统,1996,6(4):63-69.

篇2

近日,国内创业公司商汤科技宣布获得4.1亿美元B轮融资,这是截至目前为止全球范围内人工智能领域单轮最高融资。至此,这家成立仅三年的公司累计融资额达4.5亿美元,估值超过15亿美元,成为全球融资额最高的人工智能独角兽企业。当前,人工智能发展势头良好,技术和产品研发能力大幅提升,市场空间逐步拓展,社会关注与投资力度持续加大,技术创新驱动的人工智能企业正成为资本青睐的热点。

一、商汤融资背景分析

人工智能迎来估值猛涨期。自2014年起,人工智能领域一直都是全球投资热点。近年来,技术与产品的迅速成长带动国内创业热情高q,也引发了资本的高度关注。据统计,截至2017年5月31日,我国人工智能类创业公司已超过650家,产业规模较2016年同期增长达到51.2%,投融资事件超过430起,融资总额达340亿元。科技巨头加大在人工智能领域的布局,投资案例不断涌现。同时,社会资本竞相追逐人工智能领域的优质项目,整体行业获投率偏高,超过一半的人工智能公司成立时间在两年之内,可见资本市场对人工智能产业发展的信心。

计算机视觉领域成为热点聚焦。在大数据、深度学习等新技术推动下,以计算机视觉和语音识别为代表的感知智能正呈现出高速演进态势。目前我国计算机视觉技术水平已达到全球领先水平,并在安防、汽车、金融等领域取得了显著的应用成效。在安防领域,智能技术如人脸识别、图形识别应用场景众多,如车牌识别、车辆视觉特征识别、被动人像卡口、身份证比对等应用。在汽车领域,围绕智能驾驶汽车人工智能在环境感知、路径规划与决策等关键环节均有所应用和体现,在该领域百度、乐视等企业已开展卓有成效的实践。广泛的商业化渠道和技术基础推动计算机视觉成为创投热门领域,据数据显示,中国人工智能创业公司所属领域分布中,计算机视觉领域拥有最多创业公司。2016年,人脸识别服务开发商旷视科技完成至少1亿美元融资,估值超过20亿美元,专注图像识别的图普科技获得千万美元A轮融资。

商汤科技技术实力领先,发展潜力巨大。商汤科技主攻人脸识别、视频监控识别算法、增强现实、文字识别、自动驾驶识别算法和医疗影像识别算法等技术,基础研究实力强大,高质量专利数量、专业学术数量均保持全国领先水平。在2015年ImageNet大规模视觉识别竞赛中,商汤科技获得视频识别冠军,次年在该竞赛中,商汤科技凭借原创深度神经网络平台,获得3个项目的冠军。商汤科技主要业务范围是将计算机视觉技术赋能给安防、金融、机器人、政府大数据分析以及虚拟增强现实等行业。

二、由商汤融资带来的两点思考

篇3

自主车辆

人工智能技术在实现完全自主的汽车方面具有重要作用。

计算机视觉

人工智能为车辆提供了所谓的“计算机视觉”,因而实现自主驾驶和大多数高级驾驶辅助系统(ADAS)功能。车辆能够在不受约束的环境下识别各种物体、场景和活动,这是如今竞相搞自动驾驶汽车的关键技术之一。在车内各种人工智能技术中,计算机视觉最复杂、最先进。车辆“视觉”由大量摄像头、雷达传感器和激光雷达(LIDAR)装置来处理。然而,要是没有“大脑”,所有输入的这些数据毫无用处。车辆的计算能力由复杂的机器学习算法组成,构成了车辆的人工智能。

机器学习算法基于对象跟踪和复杂的模式识别应用于计算机视觉输入。计算机视觉不断分析环境,将感知图像馈送到算法中。然后通过人工智能分析图像,对对象的性质进行分类。这些算法为车辆赋予“智能”,让车辆得以学习对象特征(比如运动、尺寸和形状),以便以更高的准确性对未来图像进行分类。

联网汽车

自动化和网络连接在汽车行业相辅相成。借助人工智能,联网汽车能够很快地与其他汽车以及道路基础设施进行联系。V2X通信主要分为两类:V2V通信和V2I通信。

重要的是人工智能在V2X通信技术中扮演的角色,即处理所有的后端计算和分析工作,以便为司机提供准确、及时的数据。机器学习算法将跟踪车辆速度、位置、目的地甚至驾驶偏好,提供和传送信息。人工智能将学习了解你的日程安排、选择的路线和经常停靠的点,以便在你出门上班前提供宝贵信息。

信息娱乐系统

如今最具创意的车辆功能之一是车载信息娱乐系统,人工智能让该系统上了一个新的台阶。

语音识别

语音识别为人类与技术进行交互提供了一种更简便的方法;在这种情况下,它提供了司机与汽车之间的交互。由于深度学习算法,语音识别技术已取得了长足发展。那么,人工智能如何与语音识别结合使用?首先,将你的语音解读成声波。然后,这些声波转换成算法可以解读的代码。代码被馈送后,语音与通常存储在云端(大多数人工智能计算能力在云端)的现有样本进行比较,确定所说的内容。

由于人工智能,语音识别软件会立即开始更新语音样本,并考虑特定单词的发音方式和用户语音的声调。该技术能够学会你的独特口音和单词发音方式,有出色的准确性和精确度。人工智能还帮助语音识别技术识别语音背境和声调。比如说,回复文本时,语音识别会了解你是不是提出问题,会根据需要自动添加标点符号。

虚拟助手

语音识别领域的进步为车载虚拟助手铺平了道路。虚拟助手最先出现在智能手机上,现正慢慢进入到车载信息娱乐系统。最初,司机用语音识别技术能做的事情非常有限;而如今,虚拟助手让司机可以询问路线,获取一般信息,甚至调整座位位置和空调设置。最近向汽车行业推出的Google Assistant和Siri是市面上人工智能方面最先M的虚拟助手。

比如说,用户只要说一声“Okay,Google”,Google Assistant就能激活。助手会识别你的声音,调整车辆设置和专门针对你的建议。这让Google Assistant得以管理多个用户及使用偏好。通过学习了解用户的驾驶偏好、习惯、日常行程,甚至跟踪你的位置、路线和目的地,虚拟助手可以随时给出建议。它可以提醒你在回家的路上取物件,推荐附近的餐馆,甚至在你去当地咖啡馆的路上预订咖啡。

汽车行业

人工智能技术的进步不仅影响了车辆本身,还影响了整个汽车行业。

智能机器人

在人工智能的帮助下,汽车装配线变得更高效、更具成本效益。生产车间使用智能机器人彻底改变了车辆生产,使制造过程越来越自动化。制造过程中,时间至关重要,而这些智能自动化机器人大有帮助。多年来,机器人一直就出现在汽车制造领域,但如今生产的日益先进的人工智能机器人会对汽车行业产生重大影响。

篇4

3月17日,阿里巴巴宣布成立VR实验室,瞄准的是VR购物。同时,它会联合旗下的阿里影业、阿里音乐、优酷土豆,制作VR内容。而今年下半年,腾讯将基于PC端和移动端的两款VR头部显示器。

根据美国风险投资数据公司CB Insights的数据,2017年第一季度,AR/VR领域的投资项目超过80个,同比增长60%。报告还披露了Facebook和苹果分别为其A/VR工作招聘了一千多名员工。

所谓VR,就是通过计算机技术为用户模拟出逼近现实的虚拟环境。其沉浸式体验和交互方式带来的新的娱乐方式,吸引了从硬件技术到内容生产和分发的多个公司。除了阿里巴巴、腾讯、Facebook和苹果,HTC、三星、索尼等公司都在这个领域展开业务。

目前,这个行业的人才供应远低于需求。人力资源平台领英去年的一份针对全球范围内VR人才的报告显示,在领英的人才库里,有18%的人才需求来自VR行业,仅次于美国,但合适的VR人才只有2%。

熬过资本的冬天并存活下来的公司变得更加务实,而且开发了更多样化的应用场景―除了去年的影视、游戏产业,今年它们还进入到了医疗行业、制造业、零售业等新领域。

如果你对VR行业感兴趣或者看好它的前景,我们将告诉你这个领域正在找哪些人、薪水怎么样,以及怎样可以加入。

AVRO备的核心职位主要有3种

VR硬件的核心技术很复杂,涉及算法、光学、系统开发、交互、图形图像等多个领域,核心职位围绕的都是这些方向。它们也多是HTC、三星等硬件公司的VR业务范围。

算法工程师

这是VR领域最基础的职位。VR的功能是通过一副眼镜,让人既看到人眼看不到的东西,又能在虚拟空间中移动,还能对虚拟景象形成真实感,因此需要一套算法把这些感官上的功能都实现。通常,算法工程师关注的是如何解决某一类特定问题或实现某一特定功能。在VR领域,这一职位主要需要懂计算机视觉、空间定位、交互技术、图形图像等算法。

计算机视觉主要是指以摄像头代替人眼识别目标和提取特征,工程师需要探索最新的算法以及技术的可行性,负责视觉和图像的处理;空间定位指的是通过VR设备使用者能确定自己在空间中的位置,高精度的空间定位可以为用户带来更好的沉浸感并降低眩晕程度;接下来,交互算法工程师负责手势识别、视线估计、动作捕捉、追踪等相关计算机视觉算法的研发,研究实际空间中的动作如何延伸到虚拟空间中;然后是图形图像的处理,它要求在满足性能的前提下提高画质,用更快的速度和更少的资源去画像。

光学和人体工学工程师

光学要解决的是让VR设备的镜片在保证沉浸感和清晰度的同时,尽可能加大视场角,让人在佩戴VR设备时看得更清晰;人体工学关注的则是人在佩戴VR眼镜时的舒适度,设备是否透气、不漏光、足够轻盈等。目前消费级的VR产品在这方面仍处于初级阶段,如何让人更舒适持久地使用VR设备,是行业发展的瓶颈之 一。系统架构师

与成熟的智能手机、智能手表的开发系统不同,VR的系统架构到目前为止并没有行业标准,面对陌生的领域,系统架构师需要驾驭和设计整个系统,负责VR头部显示器及整个主机设备的集成。

BVR产业链上的工作还有这些

要实现VR体验,只有一部VR硬件设备可不够,可以观看的内容、节目效果,以及应用场景的开发,这些需要硬件公司以外的公司参与,Facebook等公司涉及的主要是这部分内容。

3D引擎开发和3D美术

3D引擎开发人员主要负责VR场景的搭建―戴上VR眼镜后你看到的“新世界”,就是所谓的VR场景。市场上主流的开发引擎有两种,一种是可以快速开发的Unity3D引擎,一种是可以制作恢弘场景和细致光效的虚幻4引擎,这种引擎在游戏开发中常使用。

3D美术人员则需要制作3D美术素材,将素材置入场景后,再配合引擎程序员优化游戏的性能。

内容制作

你知道,无论电影还是游戏,当你想要通过VR眼镜获得这些娱乐的时候,它们除了像一般的电影和游戏产品那样需要脚本,还需要影视制作人员使用360度全景视频的拍摄技术去拍摄和剪辑,这是二者在内容制作方法上的不同之处。

销售运营、产品经理

不同于刚起步的人工智能,VR已经迈入产业化阶段,公司除了需要尖端技术人员,对市场销售、平台运营方面的人才同样有需求。要求与其他领域大同小异,都是负责开拓市场和客户,增加产品的销售范围等。因VR企业希望快速打开市场,销售人才目前高居中国VR领域人才需求的第二位,高于全球水平。

产品经理的职责也很共通,负责其他VR公司与本公司部门的配合,制定和推进合作项目,把控整体合作项目的时间,并对最终合作质量负责。

常规开发

和任何智能硬件一样,VR也需要内置一套系统,其中包括App Store一样的平台以及应用软件,这部分工作与传统互联网、手机行业的开发工作相似,即在实现VR设备的智能化的同时,保证软件在不同平台间能流畅交互。

C要进入这个行业,需要你有这些能力和资历

技术岗位硕博优先

VR行业的岗位主要指向三个方面:硬件、软件和内容制作。

硬件领域涉及到计算机、光学、电子、机械、生物学、自动化等方向。软件需要计算机图形学、程序设计、数据结构、操作系统、算法设计与分析等相关背景。这两个方面对工科背景的人才需求更大。VR内容包括游戏、影视等,需要3D美术、拍摄方面的学术背景。

由于VR产业相对细分,产业上游硬件、软件开发的岗位会以硕士、博士学历优先,因为硕士和博士在学术领域的研究方向更为明确,企业在筛选简历时更容易适配岗位。

“如果毕业论文方向是图形图像、计算机视觉,就会非常抢手,不仅是VR行业,在人工智能领域也会受到欢迎。”科锐国际高科技行业总监田丹说。

VR行业的核心技术岗位中,招人要求最高的是算法工程师,这也是最难招聘的岗位。学历必须是硕士以上,同时是模式识别、信号处理等科班出身。另外,对深度学习和机器学习有了解是加分项。

至于市场销售、平台运营甚至内容领域的人才,这个行业对学历背景要求不高,更看中经验、人脉以及办事的灵活度。毕竟,新兴行业最需要资源嫁接能力。

应届生也有机会,尤其是海归

打开招聘网站,VR技术岗位的招聘一般以最少一年工作经验起步,往上的话,有的职位要求3到5年的工作经验,有的甚至要求10年以上的经验。这个门槛主要是因为VR技术虽然还不怎么成熟,但它是高集成性产品,需要在算法、架构、光学和人体工学等成熟技能的基础上再提出应用上的高要求。

但应届毕业生并非完全没有机会。对国内的VR公司来说,开放应届毕业生招募主要有两种情况。一是已经在行业里挖到技术领域的大牛,需要为其配备团队,因此会招聘一定比例的应届毕业生。二是产品经理这类岗位入门门槛不高,公司也愿意花时间培养。

相较而言,海归会比较受到这个行业的欢迎。微鲸VR人力资源总监Tony在为3D场景交互岗位招聘时发现,国内很少有这方面的专业人才,但德国的3D场景交互领域向硅谷输送了不少人。他后来意识到,这是因为德国的高校有对口专业,所以即使是刚毕业的应届生,Tony也会第一时间把对方请到公司来。

再说到内容领域,VR内容领域要制作哪些内容并没有明确标准。毕竟,还没有人敢下结论说:VR只能用来做什么、不能做什么。这个行业眼下正是需要创意和研究拍摄方式的时候。

D这些领域,跨行到VR更容易

游戏

游戏是VR最早被应用的场景之一。虽然VR游戏一度遇冷,但从长远角度看,从游戏行业跳到VR行业尝试新的游戏形态未尝不可。擅长技术的话,可以继续走Unity3D开发、3D建模和3D美术的路。即使有大量游戏公司仍在观望,但VR游戏带来的体验感确实是电脑、手机无法取代的。这也是HTC Vive、PS VR、Oculus等公司目前大量需求的产品。

互联网和半导体

互联网和半导体是VR行业人才来源的两大核心区域。VR行业缺少的系统架构人才在微软、IBM、AMD、英特尔或者高通都能找到。

工业设计

截至目前,用户对于VR硬件设施的体验普遍是抱怨“长久佩戴时头显过重,舒适感不够”。这就需要人体工程学领域的人才来改进产品,他们一般会从设计领域找人,尤其是工业设计。

影视

影视行业从业者主动跳到VR行业的比例相对更高。“他们对整个行业的理解和感知更多,当他们意识到有新的拍摄方式可以尝试,主动投身的人就会更多。”Tony说。他以微鲸一位制片人为例,对方在电视台累积了多年经验,有自己的工作室,同时还在高校任教,最终选择进入VR领域就是想尝试不一样的东西。

E哪些公司在寻找人才?

初创公司

新技术面前,全球企业处于同一起跑线。以技术为核心的初创公司为了站稳脚跟,同样在该领域争夺人才。暴风魔镜、蚁视、大朋、微鲸等国内VR厂商熬过资本严冬,对招聘也有了更高需求。“初级岗位不难招,要招就招核心算法,特别是如果我们想超越海外同行,招人就更重要。”大朋VR合伙人兼首席战略官章立说。

大公司

虽然无论是Facebook,还是HTC、索尼,都没有将技术研发落地中国,但巨头们为了造势,频频联合产业链上下游合作,发起各类联盟,为开发者提供诸多便利,这从另一个角度为从业者带来了更多机会。

Fa c e b o o k今年4月宣布建立首个增强现实(Augmented Reality,AR)平台,同时VR社交平台Facebook Spaces的Beta版;微软于5月10日宣布将开放Windows Mixed Reality开发者套件预购。5月18日,Google也宣布要在今年年底推出Daydream VR一体机,其首批合作伙伴是HTC和联想。

还有苹果,在6月6日的WWDC大会上,苹果宣布Mac将支持HTC Vive,开发者可在MacBook上使用SteamVR平台。同时,AR方面推出开发套件ARKit。

从这些大公司的策略中也能看出,VR已经不仅是它们手中的一张牌,混合现实(Mixed Reality,MR)、AR以及人工智能日后都将联合起来。

F这行的薪水到底怎么样?

去年5月,拉勾网了一份《VR/AR行业薪酬报告》,报告显示,技术职位在过去几年始终是核心诉求职位,即使岗位需求在2016年有所下降,也在总体岗位中占比50.5%。同时,市场方面的人才需求明显提高,2016年占比12.3%,两年间增长了一倍。

根据报告,在VR行业,无论是技术、产品还是市场、运营等岗位,薪酬水平皆高于互联网领域。去年5月,全行业技术岗位月平均薪资为1.35万元,而VR/AR行业技术岗位的月平均薪资达到了1.85万元。即使是最弱势的职能部门,薪资也高于行业平均值7100元,达到8300元/月。

Tony证实了这一现象。物以稀为贵,VR行业里技术岗薪水最高,而在技术岗里,算法工程师的薪酬排名第一。算法工程师如具备硕博学历,年薪一般在30万元至60万元,3D引擎开发人才的年薪也在30万元至40万元。这还不包括公司为留住人才发放的期权和奖金。非技术职位的薪水也会比原行业略高,但总体上相差不大。

科锐国际在《2017年薪酬指南》中也指出,在新技术领域里,计算机视觉、深度学习方向薪酬涨幅最快。人才储备主要在几家跨国公司和顶级高校,VR行业的人才薪酬已经在高点,人才流动的吸引力更多来自职位前景。不过若遇到急缺位,跳槽涨幅可能高达50%以上甚至100%,比如算法类的岗位就是如此。

G进这行前,你得有点心理准备

如果你有兴趣进入这个新兴行业试一试,章立和Tony提醒你:

篇5

1)等高线生成及等高线分析:等高线图是人们传统上观测地形的主要手段。可以在等高线图上精确地获知地形的起伏程度、区域内各部分的高程等等。等高线图可以从格网数字地形模型仍TM)中获取,也可在不规则三角形格网T(NI)中生成。

2)立体透视图分析:当用户需要从直观上观察地形的概貌时,用绘制透视图的方法(还可以用色彩)可以更逼真地显示地形。

3)坡度分析、地表面积计算及挖、填土方体积计算:建立DTM后就可以用之计算坡度、面积和挖、填土方体积,以其作为土地适宜性评价的因子。

4)断面图分析:断面图主要有利于工程设计和工程测量,如工程勘察的纵向图分析、地质钻孔分析等。

一 CIS技术在矿区土地管理信息的具体形式

在以往的测量中,选择的测量方式还是完全采用机械的形式,但是在使用了计算机CIS技术精密测量后,完成了许多以往技术所不能达到的任务。在我们的研究中,计算机CIS技术测量的原理是通过摄像机将被处理的对象采集进行影像采集,在多个控制点的数据采集完成后,系统会自动将这些图像进行整合,得出相关的几何多变参数,再在计算机上以具体的数据显示出来,以供矿区技术人员使用参照。

在上面所说的摄像机并不是我们通常意义上生活中使用的摄像机。它是一种可视化较强,表针比较敏感的测试仪。可以将视觉中的二维形态通过显影,记录在机械的光谱仪上,再将这种的二维图像做数学处理,有二阶矩阵转换为三阶矩阵,通过播放仪呈现出三维的影像。这时的图像变为立体化,更有层次感,效果上也有了明显的变化,这是一种显示方法。此外还有一种造价较高的仪器,我们不常使用,就是图像提取器。同样是采集控制点的数据,将数据整合在系统之内,然后对于原始的图像进行预处理,不再经过有曝光这个程序,将图像中关键点的坐标在整个内部轴面上体现出来,提取数据帧数,再运用机器的智能识别系统,对控制点的坐标进行数据分析,自动生成图形,这也可以用于精密测量。它的优点就是使用上极其的方面,基本只要架立仪器和打开开关,其他的工作机械系统都会自动的完成。使用的困难就是造价极其的高,不适合一般企业使用。在基于计算机视觉图像测量中使用上的原理如下:

(1) 计算出观察控制点到计算机视觉图像测量仪器的有效距离;

(2) 得出观察点到目标控制点之间的三维的运动几何参数;

(3) 推断出目标控制点在整个平面上的表面特征( 大多时候要求形成立体视觉) ;

(4) 还通过观察可以判断出目标物体的几何坐标方位。

在整个计算机CIS技术精密测量的在矿区土地信息管理中最关键的元件就是压力应变电阻仪,这也是传感器的一部分。压力应变电阻仪的使用方式是将应力片粘贴在控制点位上,事先在物体表面打磨平整,清理干净后,涂抹丙酮试剂,在液体完全风干后就可以黏贴应力片,通过导线的联接,形成了一小段闭合的电路,时刻让计算机CIS技术系统可以感应到并作跟踪观察。因受到来自不同方面谐波的影响后,应力片会产生一定数值的电阻,在电路中,这些电阻会转化为电流,视觉图像系统接收到了电流后就会显示在仪表盘上相应的数据,我们就可以根据仪表盘中的数据记录测量中的数据,很好的解决了原始机械在使用过程中大量的做无用功所消耗资源的现象。传感器对每个应点都进行动态的测量,将数据模转换成现实中的图像,精确的成像可以测算出控制点的位置,用计算机视觉图像精密测量结合数据方面的相关的分析,得出矿区施工中的可行性报告分析,减低了施工中的成本,将施工的预算控制在一个合理的范围之内。

当无法观察到控制点是,计算机CIS技术测量可以通过接收信号或是相关的频率波段来收集数据,不会因为以往测量的环境不好,距离太远,误差太大的影响。

二 计算机CIS技术测量的关键技术分析

在计算机CIS技术测量中解决了很多以往很难完成的任务,但是在使用过程中还是发生了很多的问题。尤其在土地信息的选择中,无法使用高帧数的图片显示,无法将计算机测量的关键技术的优点发挥出来。我们就计算机CIS技术测量的关键技术中常见的问题进行讨论。

1. 降低失误的概率

在很多的数据误差中,有一部分是出现在人为的因素上面。对于机器的不熟悉和操作中的疏忽都会在一定程度上对图像的视觉感模拟带来麻烦。对于网络设备的配置上,要经常性的学习,将配置在可能的情况下设置的更加合理和使用,保证网络连接系统的安全性。为防止更多因操作带来的误差,选用系统登入的制度,用户在通过识别后进入系统,在采集数据后,确定最终数据上又相关的再次确定的标识,系统对本身有的登录服务器和路由器有相关的资料解释,记录好实用操作的时间,及时备份。

2. 对于权限的控制

权限控制是针对测量关键所提出的一种安全保护措施,它是在使用计算机CIS技术测量的关键技术中对用户和用户组赋予一定的权限,可以限制用户和用户组对目录、子目录、文件、打印机和其他共享资源的浏览和更改。图像中的运行服务器在停止的情况下可以做出不应答的操作指令,立刻关闭当前不适用的界面,加快系统的运行速度,对于每天的日志文件实时监控,一旦发现问题及时解决。对于数据终端的数据可采用可三维加密的方法,定时进行安全检测等手段来进一步加强系统的安全性。如果通过了加密通道,系统可以将数据自动的保存和转换为视图模式,对于数据的审计和运行可以同时进行,这样就可以很好的保证大地测量中的图像数据安全,利用防护墙将采集中废弃的数据革除在外,避免数值之间发生紊乱的现象,进一步改善计算机CIS技术。

3. 开启自动建立备份系统

计算机CIS技术测量的关键技术的完善中会常遇到系统突然崩溃或是图像受到严重干扰导致无法转换的一系列情况,发生这种情况最大的可能性就是系统在处理多组数据后无法重新还原成进入界面。这时为保证图片转换成数字的系统数据不丢失,我们对系统进行备份。选定固定的磁盘保存数据,定期将产生的数据(转换前的图像和转换后的数值)导出,保证程序的正常运行。当系统一旦发生错误,可以尽快的恢复数据的初始状态,为测量任务的完成争取更多的时间。我们还要减少信号源周围的干扰,定期的更新系统数据库,保持数据采集的稳定性,把摄像机记录出的数据节点保存在相应的技术图纸上,用这样的方式来知道测量工作。系统备份的数据还可以用于数据的对比,重复测量后得出的数据,系统会自动也备份的数据进行比对,发现误差值在规定以外,就会做出相应的预警,这样也能在工作中降低出现误差的概率。

三 CIS技术测量的关键技术遇到的困难和使用前景

计算机CIS技术测量的关键技术作为一种新兴技术在使用时间上不过十几年,其使用的程度已经无法估算。正是因为它的简单、使用、精度高以及自动化能力卓越的特点受到了矿区土地信息管理部门的广泛青睐。在测量调控方面的这些可靠性和稳定性也是有目共睹的。这项关键技术中涵盖的学科非常的多,涉及到的知识也很全面,一旦出现了机器的故障,在维修上还是一个很大的问题,如何很好的解决计算机视觉图像技术的相关核心问题就是当下亟待解决的。

我们都知道,人的眼睛是可以受到吱声的控制,想要完成矿区土地观测是十分简单的,但是在计算机CIS技术中,毕竟是采取摄像机取景的模式,在取得的点位有的时候不是特别的有代表性,很难将这些问题具体化、形象化。达不到我们设计时的初衷。所以在这些模型的构建中和数据的转换上必须有严格的规定和要求,切不可盲目的实施测量,每项技术操作都要按规程来实施。

四 结束语

篇6

关键词:人工智能;云计算;大数据

最近火热的美剧《西部世界》里传递出很多关于人工智能的信息,在围绕如何突破机器极限,形成自主意识方面,提出了富有科幻现实色彩的方法-冥想程序, 将意识形成描绘成了“走迷宫”的过程,同时在道德层面又一次将“人工智能是否能成为有别于人类的另一个物种”的问题呈现在广大观众面前。

“人工智能”(AI)这一概念最早由马文・明斯基和约翰・麦卡锡于1956年的“达特茅斯会议”上共同提出。1960年,麦卡锡在美国斯坦福大学建立了世界上第一个人工智能实验室。经过近几年互联网的飞速发展,AI对企业甚至是行业产生了巨大而又深远的影响。机器学习,尤其是深度学习技术成为人工智能发展的核心。越来越多的硬件供应商专为深度学习和人工智能定制设计芯片。如IBM的人脑模拟芯片SyNAPSE(Systems of Neuromorphic Adaptive Plastic Scalable Electronics,自适应塑料可伸缩电子神经形态系统)芯片,含有100万个可编程神经元,2.56亿个可编程突触,每消耗一焦耳的能量,可进行460亿突触运算。

云计算和大数据作为人工智能的基础, 在工业制造等众多场景中得到了广泛应用,比如很多工厂都在传送带上加装了传感器,将压力、温度、噪音和其他一些参数实时传到云端,将工厂真正连上网络,然后利用人工智能的算法对这些数据进行比对,由此提前为工厂提供预警和远程检测服务。这种将生产流程及产品通过物联网连接到云端,然后利用算法进行大数据分析的模式,将在更多的行业被广泛应用。

目前人工智能主要有10个应用子领域,分别是机器学习、计算机视觉、智能机器人、虚拟个人助理、自然语音处理、实时语言翻译、情感感知计算、手势控制、推荐引擎及协同过滤、视频内容自动识别。各方向处于不同的发展阶段,发展程度有高有低。但驱动发展的先决条件主要体现在感知能力、理解能力、学习能力、交互能力四个方面。

1 感知能力

目前人工智能的感知主要通过物联网来实现,它提供了计算机感知和控制物理世界的接口与手段,能够采集数据、记忆,分析、传送数据,进行交互、控制等。比如摄像头和相机记录了关于世界的大量图像和视频,麦克风记录了语音和声音,各种传感器将它们感受到的世界数字化。这些传感器就如同人类的五官,是智能系统的数据输入,是感知世界的方式。

2 理解能力

智能系统不同于人脑,没有数以千亿的神经元,对事物问题的理解在现阶段还很大程度上依赖于处理器的计算分析能力。近年来,基于GPU(图形处理器)的大规模并行计算异军突起,拥有远超CPU的并行计算能力。从处理器的计算方式来看,CPU计算使用基于x86指令集的串行架构,适合尽可能快的完成一个计算任务。而GPU诞生之初是为了处理3D图像中的上百万个像素图像,拥有更多的内核去处理更多的计算任务。因此GPU具备了执行大规模并行计算的能力。云计算的出现、GPU的大规模应用使得集中化数据计算处理能力变得空前强大。

3 学习能力

学习能力的培养类似人类需要教材和训练。据统计,2015年全球产生的数据总量达到了十年前的20多倍,大数据的发展为人工智能的学习和发展提供了非常好的基础。机器学习是人工智能的基础,而大数据和以往的经验就是人工智能学习的书本,以此优化计算机的处理性能。不可忽视的是近年来科技巨头为了提前布局AI生态,纷纷开源平台工具,极大地丰富了机器训练的素材和手段。如谷歌了新的机器学习平台TensorFlow,所有用户都能够利用这一强大的机器学习平台进行研究,被称为人工智能界的Android。IBM宣布通过Apache软件基金会免费为外部程序员提供System ML人工智能工具的源代码。微软则开源了分布式机器学习工具包DMTK,能够在较小的集群上以较高的效率完成大规模数据模型的训练,并于2016年7月推出了开源Project Malmo项目,用于人工智能训练。

4 交互能力

篇7

关键词:对象轮廓;分水岭;支持向量机;场景标注

DOIDOI:10.11907/rjdk.171167

中图分类号:TP301

文献标识码:A 文章编号:1672-7800(2017)006-0015-04

0 引言

在计算机视觉领域,场景标注[1]作为图像分析的一个重要环节受到广泛关注。场景标注的主要任务是识别图像中每个像素所属类别。由于图像常会受到不同光照强度、对象遮挡以及对象种类繁多和复杂的场景问题,导致像素标注错误,无法很好地标注对象轮廓,最终导致场景标注效果不理想。因此,如何有效提取图像中对象的整体信息,描述图像对象轮廓,一直都是值得研究的问题。

当前的场景标注方法是直接在图像像素的基础上训练模型,而单纯在像素上训练模型很难描述对象轮廓,从而使场景标注难以获得理想效果。基于此,本文提出一种基于支持向量机的场景标注方法SVM-SLM(Scene labeling method based on support vector machine),通^训练图像块,有效解决了基于图像中对象轮廓的描述问题,在像素精确度上也有良好表现。

2 SVM-SLM方法描述

传统的基于像素训练的场景标注模型无法描述对象轮廓,会出现预测对象丢失和对象不完整的问题,从而影响像素精度。文献[2]、[ 3]、[4]研究的场景标注方法时间开销过大,并且精确度不高。针对以上问题本文提出了SVM-SLM方法,具体步骤如下:①采用结构森林方法[5]生成图像的边缘概率图;②将上述生成的边缘概率图用分水岭方法将图像划分为初始图像块;③为防止分水岭方法过度分割并且减少接下来的训练开支,通过UCM算法选取阈值,优化图像块;④对图像块提取特征,利用支持向量机训练图像块得到场景标注结果,并实现具有良好精确度及轮廓效果的场景标注方法。

3 生成图像块

边缘检测是计算机视觉系统中的一个重要环节,包括对象检测[6]、目标预测[7-8]以及场景分析[9]。边缘形状是目标对象几何形态描述的重要表现内容,图像中对象的轮廓往往来自于图像的边缘信息,所以有效提取图像边缘信息方法是关键。

传统的水平集模型需把轮廓曲线演化的能量方程转化为微分方程,进而借助梯度下降法求得方程最优解。这一过程不仅耗时,而且导致计算结果不稳定。考虑到一般图像块对图像的局部特征表现效果很好,本文利用图像块对边缘学习能力很强的特点,提出结构森林[5]与分水岭相结合的方法。首先利用结构森林的学习方法建立随机决策森林,学习每个像素的边缘概率,生成边缘概率图,此过程不但解决了耗时问题还取得了良好的边缘检测效果;再将边缘概率带入分水岭方法生成初始图像块,得到包含轮廓信息的初始图像块,效果如图2所示(彩图见封二)。图2(a)和图2(d)测试为图像,图2(b)和图2(e)为对应的边缘概率图,图2(c)和图2(f)为初始图像块。

4 训练SVM模型

传统的像素训练无法保留图像中对象的轮廓信息,训练时单纯对像素提取特征,忽略了像素之间的局部空间信息,不能很好表达图像中像素之间的区域结构信息。本文通过对带有对象轮廓信息的图像块进行训练,在进行语义标注的同时保留了对象轮廓信息。

采用核描述、核匹配方法,通过2*2网格模型提取像素的纹理特征、颜色特征和梯度特征,对应于同一图像块的像素特征加权合并为图像块特征。随机提取10块图像块生成特征图,利用支持向量机算法对图像块进行训练,如图4所示。

5 实验结果及分析

为了验证方法的有效性,图像数据集采用Stanford Background数据库[11],数据库共715幅复杂的户外场景图片,每张图像大小为320×240像素,附有标注好的正确语义图片。每个像素划分为一类,共8个类别,总计5 491万多像素标记样本,类别分别为天空、树、马路、草地、水、建筑物、山脉和前景对象。

实验随机提取五组训练集和测试集依次带入公共图像块阈值[0.1,0.2,0.3,0.4,0.5]进行评估,每组训练集提取572个图片,运用本文方法分割成若干图像块,平均每组图片被分割成5万多块图像块,运用支持向量机对这些图像块进行训练。用剩余143个图片作为测试集,平均分割成1万多个图像块进行测试,并对每个像素进行语义标注。实验效果如图5所示(彩图见封二)。图5(a)为部分测试图像,图5(b)为数据库正确标注图像,图5(c)为本文方法的场景标注图像,图5(d)为标注失准图,标注错误的像素呈黑色,正确的为白色。图5下方8个色块分别代表8个不同的类别。

利用结构森林生成边缘概率图,将图像边缘作为对象轮廓候选区,提高了场景标注对对象轮廓的标注能力。再通过UCM算法优化图像块,最终场景标注结果如图6所示。图6表明,本文方法在人物、车辆、动物等重要的前景对象轮廓细节上有较好的描述。

6 结语

场景标注是计算机视觉技术的关键步骤。针对像素训练模型容易忽略图像空间结构信息,无法描述对象轮廓的问题,提出一种基于支持向量机的场景标注方法。通过结构森林/UCM生成图像块,构建支持向量机模型,训练得到场景标注结果。实验表明该方法较好地描述了图像中的对象轮廓,获得了良好的精确度和标注效果。但是,由于特征描述采用核描述提取特征,对部分图像块不能有效提取特征,导致部分图像块标注不正确,影响了总体精确度。下一步的工作目标是提高有效特征的提取,以获取更高的精确度及场景标注效果。

参考文献:

[1]顾广华,韩晰瑛,陈春霞,等.图像场景语义分类研究进展综述[J].系统工程与电子技术,2016 (4):936-948.

[2]马成虎,董洪伟.一种基于深度学习的多尺度深度网络的场景标注算法[J].计算机工程与科学,2016,38(7):58-63.

[3]MUNOZ D,BAGNELL J,HEBERT M.Stacked hierarchical labeling[C].European Conference on Computer Vision,2010:57-70.

[4]TIGHE J,LAZEBNIK S.Superparsing:scalable nonparametric image parsing with superpixels[J].European Conference on Computer Vision,2010,63(15):352-365.

[5]DOLLAR P,ZITNICK C L.Structured forests for fast edge detection[C].The IEEE International Conference on Computer Vision (ICCV),2013:1841-1848.

[6]GALL J,LEMPITSKY V.Class-specific hough forests for object detection[C].The IEEE Conference on Computer Vision and Pattern Recognition,2009:143-157.

[7]ARBELAEZ P,JORDI P T,T BARRON J,et al.Multiscale combinatorial grouping[C].The IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2014:328-335.

[8]JORDI P T,ARBELAEZ P,BARRON J,et al.Multiscale combinatorial grouping for image segmentation and object proposal generation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2016.

[9]KUMAR P,KOLLER D.Efficiently selecting regions for scene understanding[C].The IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2010:3217-3224.

篇8

关键词:牛肉分级;边缘检测;二值化处理;自动分级

中图分类号:TS251.52 文献标志码:A 文章编号:1001-8123(2013)04-0010-05

2003年10月我国农业行业标准《牛肉质量分级标准》开始实施,鉴于牛肉眼肌横切面包含了大理石纹、肉色、脂肪色、背膘厚度和眼肌面积等评定指标,所以在牛肉质量的分级标准和体系中,进行牛肉等级评定时,通常都将眼肌面积横切面作为主要的评定对象。但目前为止,国内外的牛肉分级体系采用的分级方法还是以主观的视觉评定为主,评定过程受到人为因素的干扰,不仅效率低,而且还会产生较大的误差。因此,计算机视觉、人工神经网络和图像处理技术,被认为是实现牛肉自动分级的最有效的方法。在国外,1989年Chen Shengwei等[1]首次针对美国牛肉大理石花纹标准图版,应用图像处理技术对美国牛肉的肌肉脂肪面积进行计算,用于牛肉质量分级,并将其作为判定牛肉质量等级的定量指标,在随后的相关研究中,研究学者运用图像处理方法等技术分别有效的预测大理石纹、颜色等级、脂肪面积比、脂肪颗粒分布均匀度等特征参数,探讨了基于图像处理的牛肉等级评定技术[2-5]。在国内,计算机技术在牛肉等级评定中的应用还处于初步研究阶段,主要是通过眼肌切面图像的纹理分割,通过计算脂肪面积比[6-7]的方式来计算牛肉等级[8-10],对脂肪在肌肉中分布所形成的特征分析不够深入,对牛肉等级评定的准确性和实际应用等方面都有不足之处。本研究拟运用计算机视觉系统对牛肉眼肌的形状特征值、脂肪含量和分布进行量化,在VC++6.0的环境下自行开发适用于牛肉眼肌自动分级软件,提高分级的准确性和工作效率,为我国牛肉智能化分级技术的研究奠定理论依据[10]。

1 材料与方法

1.1 材料、软件及基本原理

采用Visual Basic6.0作为实验分析软件,利用图形处理中的二值化算法、边缘检测算法等对采集到的数字图像进行处理和分析,提取出用于牛肉眼肌自动分级的眼肌面积、圆度、大理石纹密度等重要参数,再利用模糊数学理论利用计算出的参数数据,实现对牛肉眼肌的智能自动分级。

1.2 方法

1.2.1 边缘检测法

物体图像的边缘信息特征因为颜色、纹理结构和灰度值的变化是以不连续性的形式出现,是图像最基本的特征之一。边缘检测法提取图像特征是图像识别中的一个重要属性和重要环节[11]。图像边缘检测中的经典算法SUSAN算法[12]选用放在不同5个位置上圆形模板,如图1所示。

比较模板内像素的灰度与核心的灰度,其差值在阈值内时,认为灰度相同。与核的灰度相同的像素数目之和称为模板的面积(USAN)。SUSAN算法根据USAN区的大小和矩阵特性来检测图像边缘及角点等特征的位置及方向信息[13]。由图1所示,平坦区域USAN区最大(d,e),边缘处USAN区大小降为一半(a),角点附近USAN区变得更小(c)。

1.2.2 二值化处理

图像二值化是指对仅含黑白二值的图像进行参数提取数据预处理的重要技术。采用直方图均衡化,同态滤波对图像进行预处理抑制外界因素提高图像质量,或者将图像划分为若干区域,分别设定阈值Tn,则:

(1)

由于所提取的大理石纹图像中,仅有肉色和脂肪色,即只有红色和白色两类颜色信息,因此在二值化处理过程中,采用第1种方法进行二值化处理。

图像分割是基于边缘检测或基于区域的分割,将同一属性但区域互不相交,均满足特定区域一致性条件的不同区域分割开来[14]。本研究采用区域生长法实现对图像的分割。

1.2.4 模糊综合评判

对模糊事物实现较合理的评价可采用模糊数学中的模糊综合评判法 [15]。设定因素集,集合中的某一元素Ui表示决定事物的第i个因素,评价集Vi表示对事物评价结果。

2 结果与分析

2.1 利用二值化算法提取大理石花纹

2.1.1 二值化算法

对大理石纹图像的特征参数提取时,均需要先对图像进行二值化处理,将彩色图像处理成只包括黑色像素点和白色像素点的图像。由于所提取的大理石纹图像中,仅有肉色和脂肪色,即只有红色和白色两类颜色信息,因此在二值化处理过程中,采用第1种方法进行二值化处理。

假定彩色图像的大小为M×N,fn其表示像素点的颜色值,f(I,j)表示像素点(I,j)的二值化结果,当f(I,j)=1时,像素点(I,j)被标记为黑色像素点,当f(I,j)=0时,像素点(I,j)被标记为白色像素点。对于某一像素点(I,j),如果该像素点的颜色值fn大于阈值T,则令f(I,j)=1,否则f(I,j)=0,实现对彩色图像的二值化处理。二值化方法如式(2)所示在二值化算法中,阈值的选取是二值化处理的关键,如何选取合适的阈值t,准确提取出不同图像中的大理石纹,是本算法的一个关键技术。本研究的所有实验,都是基于VC++6.0编程完成。在所有图像的二值化处理中,程序设计使用inputbox函数的数据输入方式,由用户根据个人经验输入某一个阈值T。

(2)

经过二值化处理后的图像,白色点表示脂肪像素点,黑色点代表肌肉像素点。本算法进行大理石纹的面积计算、圆度测量、密度分析等算法都是在图像二值化的基础上进行的,因此,图像二值化的结果将直接影响到后面参数的提取准确度问题。

2.1.2 二值化实验结果分析

图2是对原图像1采用不同阈值t的检测结果,图3是对原图像2采用不同阈值t的检测结果。从图2、3结果可以看出,对于不同亮度的图像,采用相同的阈值,如t=90时,对原图像1,可以很好的提取出二值化图像;而对原图像2,无法正常提取出所需要的区域信息。同样,对于t=160时,从图2D可以看出,对于原图像1,由于阈值太大,造成一些有用的大理石纹信息丢失,而对于原图像2,能更好的提取出需要的大理石纹信息,为后继准确的提取大理石纹信息提供保证。

本算法中,阈值的选取采用人机对话的方式选择阈值,希望后期工作中能研究出一种能自动根据图像颜色亮度特征智能选取阈值的算法。

2.2 利用区域生长算法提取有效眼肌面积

由于眼肌面积图像中仅含有白色和红色两种颜色区域,有效眼肌面积区域是一块连通区域,因此,采用种子点生长算法,可以很好的提取出和所选种子点相连通的所有连通区像素点。

有效眼肌面积的提取步骤如下:以原图像1(图3A)中眼肌面积的提取为例,先采用二值化算法,选用阈值t=90,使得眼肌内的区域为大片黑色联通区,再利用种子点生长算法,利用鼠标选取眼肌中黑色联通区中的一点作为种子点,生成的眼肌面积内的联通区,如图3所示。由于生成的联通区内存在大理石纹,所以眼肌面积是图像总面积减去灰色联通区的面积。

首先采用二值化算法,对原图像进行二值化处理,然后对处理好的二值化图像,用鼠标选取属于要计算面积区域中的某一黑色像素点,采用种子点生长算法[16],将所选取的像素点作为种子点,进行生长,识别出面积轮廓。由于图4中的面积区域,还存在白色大理石纹,不能直接计算出面积大小,因此,再对图4进行二值化处理,选取背景色中的任意1点作为种子点进行生长,然后进行背景图像区域的识别,再用总面积减去背景区域的面积,即可算出眼肌面积。对原图像1,利用本实验算法计算出的有效眼肌面积共14742个像素点。

2.3 肌肉和脂肪色度值

将图像中所有肌肉像素点采用种子点生长的算法提取出来所有的红色像素点区域,对提取出的肌肉连通区图像,遍历整个图像,计算出连通区中所有像素点的Red、Green、Blue三个颜色分量的平均值,再使用颜色公式w(x,y)=Red+Green×256+Blue×65536,计算出所有肌肉像素点的颜色平均值。同样的算法,可以提取出白色脂肪的色度值。对原图像1(图2A)进行肌肉色度和脂肪色度的计算,计算出了脂肪色度为11437206,肌肉色度为7428162,对原图像2(图3A)所示的图像,计算出的脂肪色度为11718453,肌肉色度为127466071。该颜色值越大,说明图像颜色亮度越大,色值越高。

2.4 眼肌圆度

有效眼肌面积的圆度可以采用计算其长轴的长度和短轴的长度,通过长短轴的比值来衡量眼肌面积的圆度。在一幅灰度图像中,已知中两个像素点的坐标(x1,y1)、(x2,y2),利用两点间距离的计算公式:

(3)

可以计算出某一直径,直径的大小即为长轴的长度。因此,查找到有效眼肌面积的长轴的两个像素端点是计算长轴的关键。

本算法采用种子点生长算法提取出有效眼肌面积的连通区,然后由用户利用鼠标,选取出长轴的起点,如图5B所示,设置出长轴的起点坐标(x1,y1)。然后在如图5C所示的连通区中找到离该点最远的像素点坐标值(x2,y2),利用两点间距离公式,计算长轴的长度。短轴是在长轴垂直平分线上的离长轴中点((x1+x2)/2、(y1+y2)/2)最远的点和中点间的距离。测量结果显示,长轴215.94,短轴55.08,长短轴比率:55.08/215.94≈0.51,比值越接近于1,说明眼肌面积越趋向圆。

2.5 大理石纹密度

对大理石纹密度统计分析分为5个步骤进行:第1步,采用区域生长法或者边缘检测算法对原图像进行图像分割,将图像分割成不同的很多连通区;第2步,对所有连通区进行着手标记,同一连通区着相同的颜色,不同的连通区采用不同的颜色;第3步,统计所有连通区各自的面积大小区域;第4步,统计图像中连通区总数目;第5步,统计标记的连通区面积在0~5、5~10、10~15、15~20等范围内的连通区个数。

2.5.1 不同连通区着色

采用眼肌面积算法中的种子点生长算法,对整个图像进行遍历,识别出所有的连通区,并用不同的颜色值标记出不同的连通区。

对照高标准的密度检测结果图7和低标准的密度检测结果图8检测结果发现,相同像素点下连通区总数越多,说明大理石纹越丰富。像素点总数小于5的连通区的个数表明大理石纹的分散程度,值越大,说明越分散,密度越大。

2.6 基于模糊数学理论的牛肉大理石花纹自动分级系统

针对牛肉自动分级中大理石纹参数特征值的模糊性、相关性、多变量等特点,结合模糊数学理论,将所提取出来的所有眼肌面积、大理石纹密度,眼肌面积的圆度、色度等多个参数,采用模糊数学理论中的综合评判技术建立了基于模糊综合评判的牛肉大理石纹自动分级模型。例如:使用模糊综合评判算法记U={眼肌面积,圆度,肌肉色度,脂肪色度,大理石纹密度},表示因素集,表示决定牛肉分级品质的所有因素。记?={a1,a2,a3,…,an}。取评价集V={低品质牛肉,中等品质牛肉,优质牛肉,特优级牛肉},表示牛肉的评价结果。

对牛肉品质等级的判定,需要综合考虑各种因素,如牛肉的大理石纹分布的密度,有效眼肌面积的圆度、色度、面积大小等。结合本系统中采用数字图像处理技术自动提取出的相关的参数信息,然后考虑所有因素对评价集V中各等级的隶属度,可得综合评判矩阵如。

3 结 论

利用了图像处理中的边缘检测技术、二值化处理和图像分割技术,先对原牛眼肌图像进行二值化处理,然后对处理好的二值化图像,采用种子点生长算法,识别出眼肌面积轮廓,进行背景图像区域识别,计算眼肌面积,并采集连通区中所有像素点的Red、Green、Blue 3个颜色分量,计算出所有肌肉和脂肪像素点的颜色平均值,并对有效眼肌区域的圆度和大理石纹分布密度进行参数提取和检测。结果证明,本实验设计的算法能够近似的估算出牛眼肌面积、脂肪比例、色度值、眼肌圆度和大理石花纹密度,是一种有效的估算方法,并通过大量实验数据和人工测量数据进行比对,证明使用图像处理技术自动估算上述5个特征参数是可行的,为基于计算机视觉的牛肉品质自动分级检测奠定基础。后期工作中希望能并结合大理石花纹的特点和特征描述以及具体牛肉图像的特点,通过大量的数据,使用模糊聚类,模糊识别、模糊综合评判等技术,给出接近现实的、准确的牛肉等级判定结果,为进一步研究基于计算机视觉的牛肉自动分级系统打下基础。

参考文献:

[1] CHEN Shengwei, SUN Xin, QIN Chunfang, et al. Color grading of beef fat by using computer vision and support vector machine[J]. Computers and Electronics in Agriculture, 2010, 70(1): 27-32.

[2] YOSHIKAWA F, TORAICHI K, WADA K, et al. On a grading system for beef marbling[J]. Pattern Recognition Letters, 2000, 21(12): 1037-1050.

[3] SHIRANITA K, HAYASHI K, OTUSBO A. Determination of meat quality using texture features[J]. The Institute of Electronics, Information and Communication Engineers Transactions on Information and Systems, 2000, 83(4): 1790-1796.

[4] AASS L, FRISTEDT C G, GRESHAM J D. Ultrasound prediction of intramuscular fat content in lean cattle[J]. Livestock Science, 2009, 125(2/3): 177-186.

[5] KAZUHIKO S, KENICHIRO H I, AKIFUMI O, et al. Grading meat quality by image processing[J]. Pattern Recognition, 2000, 33(1): 97-104.

[6] CHEN Kunjie, QIN Chunfang. Segmentation of beef marbling based on vision threshold[J]. Computers and Electronics in Agriculture, 2008, 62(2): 223- 230.

[7] 陈坤杰, 姬长英. 牛肉自动分级技术研究进展分析[J]. 农业机械学报, 2006(3): 159-162.

[8] 陈坤杰, 孙鑫, 陆秋琰. 基于计算机视觉和神经网络的牛肉颜色自动分级[J]. 农业机械学报, 2009(4): 179-184.

[9] 陈坤杰, 秦春芳, 姬长英. 牛胴体眼肌切面图像的分割方法[J]. 农业机械学报, 2006(6): 161-164.

[10] 任发政, 郑丽敏, 王桂芹, 等. 应用MATLAB图像处理技术评判牛肉大理石花纹[J]. 肉类研究, 2002(4): 14-15.

[11] 贾渊, 李振江, 彭增起. 结合LLE流形学习和支持向量机的猪肉颜色分级[J]. 农业工程学报, 2012(9): 154-159.

[12] 魏光杏, 吴锡生. 新型边缘检测法[J]. 计算机工程与设计, 2007(4): 144-145.

[13] GE X W, FU K T. Edge detection in image method research[J]. Digital Community & Smart Home, 2007, 3(16): 1144-1145.

[14] 王文渊, 王芳梅. 改进的最大熵算法在图像分割中的应用[J]. 计算机仿真, 2011(8): 297-300.

篇9

关键词:图像处理技术;深度学习;教学探讨

中图分类号:G642.3 文献标志码:A 文章编号:1674-9324(2016)09-0115-02

引言

图像处理是电子信息、计算机类专业的重要课程[1],是一门涉及多领域的交叉学科,是模式识别、计算机视觉、数字视频、视频通讯、多媒体技术等学科的基础。在图像处理技术课程的教学中,不但要让学生掌握其基本概念和原理,还要让学生尽可能理解和掌握图像处理在当前时代应用的最新发展。图像处理所讲授的理论和实验过程较复杂[2,3],如何让学生能灵活应用这些知识,是课程学习的难点。

在高度信息化的知识经济时代背景下,深度学习已经引起高校教师的普遍重视[4],深度学习特别是“如何促进深度学习”也成了当前学习研究的重要内容。本文结合电子信息学科的特点和多年的教学经验,引入深度学习框架,对图像处理技术课程的教学模式与实践模式进行了探讨。

一、图像处理课程特点

图像处理有相关课程、基础课程较多,实践性强,发展快、应用领域不断扩展,新方法内容抽象,要求数学基础高等特点。随着安防系统中图像处理技术的广泛应用,智能手机中的拍照功能越来越强,以及指纹识别、人脸检测等功能在智能手机中的引入,图像处理技术在生活中已经无处不在了。图像处理技术涉及的相关课程有模式识别、数字视频、计算机视觉、多媒体技术等。基于随机场MFS的方法、基于图论的方法、基于偏微分方程的方法在图像增强、分割等各个方面的应用,这些方法要求数学基础高,给教学带来了难度。

理论和实践的结合是本课程的关键,注重基础理论和技术的教学,以及加强学生实践能力和课题研究能力的培养是本课程的主要教学目的。由于涉及课程较多,只有在相关的模式识别、数字视频等课程学习完后,才能进一步的开展实践。这些工作需要在课程设计、毕业设计等实践环节中才能开展。

二、走向深度学习

深度学习是指在理解学习的基础上,学习者能够批判性地学习新的思想和事实,将其融入原有的认知结构中,并将已有的知识迁移到新的问题中,做出决策并解决问题的学习。它是一种主动的、探究式的、理解性的学习方式,将其引入图像处理课程的教学实践中,可以让学生进行理解性的学习,深层次的加工各门相关课程的信息,进行主动的知识建构和知识转化,灵活应用知识来解决实际问题。反思是贯穿于整个学习活动过程的一个重要环节,其主要目标是通过对学习过程及结果的调控来促进问题解决,是促进深度学习的重要策略之一。针对课程构造了一个较为复杂、完整的深度学习框架,参考这个框架,本文构造一个简化的深度学习策略,主要过程为:a.基础知识学习;b.问题提出;c.反思、知识建构或转化;d.知识应用、解决问题。

“基础知识学习”是一般教学过程都具备的前期学习过程,为后面的深度学习提供基础;“问题提出”是结果应用实践,给出学生们感兴趣的问题,引起对学习的注意;“反思、知识建构或转化”是深度学习的关键环节,通过对知识的建构,促进对各个相关知识的综合理解、转化,完善基本技能;“知识应用、解决问题”体现深度学习的高阶特性,将知识、技能进行综合联接。

深度学习的一个重要特点是灵活的知识应用。图像处理是门实践性很强的课程,需要通过解决实际问题,促进学生对知识的深刻理解,把知识灵活运用,促进深度学习的开展。图像处理要求的知识面较广,新技术、新方法很多,受到学生基础知识限制,不能在短短的课堂上讲述所有的方法。针对本科生的教学过程,不仅在课堂教学中引入深度学习,在相关的课程、实践环节中都体现图像处理技术的具体应用,每个环节中根据实际情况,引入深度学习过程模式。让学生能真正学会自己动手解决问题,提高学习的兴趣和主动性。

三、课堂教学中的深度学习

在课堂教学过程中,可以根据“问题―反思―生成”模式来开展教学活动,即通过创设问题情境、制造认知冲突来引导学生进行反思探究、知识建构及问题解决。部分教学知识点的深度学习教学模式设计如下。

(一)图像增强教学中的应用

“问题―反思―生成”模式设计对应如下:

“噪声对图像的影响―产生原因―低通滤波器设计(平滑模版)”。

教学过程中,首先联系电路分析、数字信号处理等课程提出问题:

1.“图像噪声和电路噪声的相同点”。

2.“电路中用RC电路去除噪声,数字信号中如何模拟这一过程”等。

在反思环节中,引导学生明白,噪声在时域上的体现是快速变换的信号,在图像中是随着空间间隔快速变换的光的强度;RC电路的本质是利用电容的充、放电过程,减缓信号的变化,达到去除噪声的目标。

在生成环节中,引导学生结合数字信号处理中的FIR数字低通滤波器,采用简单的邻域加权平均,减弱信号的变化量,达到平滑噪声目的。不同加权系数,构成了不同的平滑模版。

(二)车牌识别教学中应用

车牌识别是图像处理中结合实践常见的一个应用例子,包含图像预处理、车牌检测、二值化、字符分割、字符识别等多个子过程,每个子过程都可以利用“问题―反思―生成”的深度学习模式来开展教学活动。

例如在字符识别子过程中,首先提到的问题是“计算机如何做识别”,这个问题比较有难度,在“反思”阶段只能引导学生通过比较两幅数字图像的每个像素值,也就是模版匹配的方法,到达识别的目的。这样在“生成”阶段可以利用相关法进行匹配,完成识别过程的任务。

四、将科研思想、深度学习方法运用到实践科研过程中

课堂学习,以老师讲授为主,没有体现学生的主动性。在相应的实验课上,以及后续的课程设计、毕业设计环节,引入深度学习,结合老师的一些科研课题,让学生主动思考,增强学生的主动性。在这阶段的实践中结合深度学习,以问题为中心,让学生通过查阅资料和及时的交流讨论自主的解决问题,这样培养了学生初步开始科研活动的能力。

(一)课程实验中,引入深度学习,合理设计实验方案

图像处理课程实验方案设计中,结合生活中的实际问题,实现photoshop、美图等软件中的部分相应算法,实验素材采用学生自己生活中的照片。让学生自己寻找想解决的问题,通过反思、分析,灵活运用相关知识,解决问题。这样达到提高学生学习兴趣、增强学习主动性的目的。

(二)课程设计过程中设计简单的应用题目

课程实验中,由于时间短,只能对课本上的部分算法进行实现,不能进行更多的综合反思。课程设计是一个持续数周的实践过程,在这过程中,设计些简单的应用题目,让学生有充足的时间反思,为后续的毕业设计做准备。

(三)本科毕业设计阶段,提炼综合题目

教师可以从科研课题和开发项目中,提炼出一些关键问题,并结合当前学生感兴趣或觉得有前途的工具平台,作为本科生毕业设计的题目。临近毕业了,学生们在找工作过程中已经接触了较多的社会,他们选择课程设计经常带着较强的倾向性,选择通常受到以后工作的需求、媒体上宣传等因素影响较重。近年来,随着智能手机的普及,社会上对Android环境下的编程工程师需求较多,学生们对这方面的知识需求也较迫切,而课程的设置却难以跟上这些需求。毕业设计中如果可以补充学生的知识需求,无疑可以大大提高学生们的兴趣。

将教师图像处理方面的科研与学生需求结合,提出“Android平台下的人脸检测”、“Android平台下的字符识别”、“二维码的检测与提取”、“Android平台下视频运动目标检测与跟踪”等题目,这些题目的成果可以运行在学生手机上,提高了学生的兴趣和成就感。

五、总结

针对数字图像处理课程的特点,结合多年的教学体会,在课堂教学、实践等环节引入深度学习,对一些教学过程进行了探讨。通过深度学习模式,激发学生的学习兴趣,培养学生的动手能力,促进学生对知识的深刻理解,灵活掌握知识运用,提高学生的学习兴趣,增强创新能力。教学改革是一项长期任务,如何更有效地改善教学效果,还需要在教学实践中不断的探索。

参考文献:

[1]张永梅,马礼,何丽.图像处理技术课程教学探讨与实践[J].计算机时代,2014,(10):76-77.

[2]李金萍,陆玲,刘自强,徐玮.数字图像处理课程实验教学改革探索[J].科技视界,2012,(7):23-24.

篇10

【摘要】2016年是“十三五”的开局之年,也是全面建成小康社会决胜阶段的开局之年,设施农业产业将面临更多的机遇和挑战。在以往的研究中,针对物联网对设施农业影响的研究比较多,本文将以人工智能在设施农业领域应用为视角,分析人工智能对设施农业的潜在发展优势。

施农业是集种植、农业装备等多领域为一体的系统工程,是一种在人为可控环境下进行的高效农业生产方式,具有成套的生产技术、完整的设施装备和生产规范[1]。近几年,随着信息技术的发展,物联网技术逐渐被应用到农业生产和科研中,这是现代农业依托新型信息化应用的一次进步[2]。本文结合人工智能研究成果,着重介绍人工智能技术在设施农业种植领域方面的应用前景,根据设施农业产前、产中、产后3个阶段,对现有研究成果进行了阐述。

人工智能概述

“人工智能”一词是1956年在Dartmouth学会上提出。从那以后,研究者们发展了众多理论和原理,人工智能的概念也随之扩展。人工智能(Artificial Intelligence),英文缩写为AI,它是研究用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的新型科学技术[3]。

作为计算机科学的一个重要分支,人工智能技术着眼于探索智能的实质,模拟智能行为,最终制造出能以人类智能相似的方式做出反应的智能机器。著名的美国斯坦福大学人工智能研究中心尼尔逊教授对人工智能下了这样一个定义:“人工智能是关于知识的学科,即怎样表示知识以及怎样获得知识并使用知识的科学。”而另一位美国麻省理工学院的温斯顿教授认为:“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”@些说法反映了人工智能学科的基本思想和基本内容。人工智能自诞生以来,理论和技术日益成熟,应用领域不断扩大,可以设想,未来应用了人工智能的科技产品,将会是人类智慧的“容器”。

随着人工智能技术的日益成熟,人们意识到人类已经具备了设计和建造智慧型设施农业所需的硬件和软件技术条件,结合设施农业高投入高产出,资金、技术、劳动力密集型的特点,完成工厂化农业生产已经不是梦想[4]。依靠人工智能技术,作物可以在适宜的温度、湿度、光照、水肥等设施环境下,生产优质、高产的农产品,摆脱对自然环境的依赖,实现设施生产的高度智能化,提高农业生产的效率,降低劳动成本[5]。

人工智能在设施农业领域的应用

人工智能技术在产前阶段的应用

在设施农业产前阶段,凭借人工智能技术可对土壤、灌溉水量需求、作物品种质量鉴别等方面做出分析和评估,为农民做出科学指导,对后续的农业生产起到很好的保障作用。

土壤分析是农业产前阶段最重要的工作之一,是实现定量施肥、宜栽作物选择、经济效益分析等工作的重要前提[6]。在土壤分析等农业生产智能分析系统中,应用最广泛的技术就是人工神经网络(简称ANN)。ANN是模拟人脑神经元连接的,由大量简单处理单元经广泛并互连形成的一种网络系统,它可以实现对人脑系统的简化、抽象和模拟,具有人脑功能的许多基本特征。目前可以通过该技术分析土壤性质特征,并将其与宜栽作物品种间建立关联模型。土壤性质特征的探测主要是借助非侵入性的探地雷达成像技术,然后利用神经网络技术在无人指导的情况下对土壤进行分类研究,进而建立起土壤类别与宜栽作物的关联关系;土壤表层的黏土含量也可通过人工智能方法预测,该技术通过分析电磁感应土壤传感器获取的信号,使用深度加权方法从中提取土壤表层质地信息,然后使用ANN预测土壤表层的黏土含量。

传统农业对灌溉用水的使用量往往依靠经验,无法根据环境变化进行精确调节,对多目标灌溉规划问题也无能为力。人工智能技术可帮助人们选择合适的水源对作物进行灌溉,保证作物用水量,大大减轻灌溉问题对作物产量造成的不良影响。在美国,有专家研制出一个隐层的反馈前向ANN模型和一个位于科罗拉多州地区阿肯色河流域的消费使用模型,使用它们可勘察区域气候变化对灌溉用水供应和需求可能产生的影响。在灌溉项目研究中,为了选择最好的折中灌溉规划策略,还可基于多目标线性规划优化,利用神经网络将非支配的灌溉规划策略加以分类,将这些策略分为若干个小类别。结果表明,在对多目标灌溉规划问题加以建模时,综合模型方法是有效的。

人工智能技术在产中阶段的应用

在设施农业产中阶段,主要应用是农业专家系统、人工神经网络技术、农业机器人等。这些技术能够帮助农民更科学地种植农作物并对温室大棚进行合理的管理,指导农民科学种植,提高作物产量。这些人工智能技术的使用推进了农业现代化的发展,提高了农业生产的效率,使农业生产更加机械化、自动化、规范化。

专家系统是指应用于某一专门领域,拥有该领域相当数量的专家级知识,能模拟专家的思维,能达到专家级水平,能像专家一样解决困难和复杂问题的计算机(软件)系统。国际上农业专家系统的研究始于20世纪70年代末期的美国,1983年日本千叶大学研制出MTCCS(番茄病虫害诊断专家系统),到了20世纪80年代中期,农业专家系统不再是单一的病虫害诊断系统,美国、日本、中国等国家也相继转向开发涉及农业生产管理、经济分析、生态环境等方面的农业专家系统。农业科研人员把人工智能中的专家系统技术应用到农业生产中,开发出了农业专家系统。它可代替农业专家走进生产温室,在各地区具体指导农民科学种植农作物,这是科技普及的一项重大突破。

在设施生产中可以使用机器人来代替农民进行作物采收,不仅可以降低劳动成本,也可以提高工作效率。Wolfgang Heinemann等人研发出的具有独特设计结构的采收机器人,该机器人可以在无需人类干扰的情况下自动采收白芦笋。为了保证机器人能够精确行进,它使用了2个独立的速度控制轮和级联控制结构(其中包含了一个内部的定位误差控制器和一个外部的横向偏置控制器)。借助PID算法①,机器人系统可以分析自己的运动轨迹,优化驱动电机的控制参数,保证系统能够稳定自主的运行。

在中国,应用人工智能技术的智能杂草识别喷雾系统已经得到了长足发展。图像分析系统通过分析田间图像的颜色模型,根据色差分量②颜色特征实现杂草实时识别,并基于Canny算子对识别到的杂草进行边缘检测,提取其特征参数,配合超生测距等技术可以精确控制喷头位置及用药量[7]。该技术的应用可以大大提高除草剂的经济性,对保护环境也大有益处。

人工智能技术在产后阶段的应用

人工智能技术在设施农业产后阶段也有相当多的应用前景。

在农产品分类方面人工智能技术能提供很好的支持。张嘏伟[8]等提出了一种基于图像识别的番茄分类方法,该方法根据番茄的表面缺陷、颜色、形状和大小,使用遗传算法训练的多层前馈神经网络对番茄进行分类,并与BP训练神经网络③进行了比较。结果表明,遗传算法在训练次数和准确性上都具有优势。谢静[9]等对图像识别分类中的图像预处理方法进行了研究,包括图像噪声去除方法、图像分割方法、边缘提取方法等。提出了使用改进的canny算法④和当量直径法相结合来检测水果大小的新思路,并使用模糊聚类方法处理gabor滤波器提取水果表面缺陷特征,对水果表面缺陷进行了分类。

随着社会的发展,人民生活水平的提高,广大消费者及国家都对食品安全问题越来越重视,农产品质量检测方法也在不断进步。图像识别、电子鼻等技术都应用在了农产品检测中。李洪涛[10]等利用人工嗅觉装置,模拟人的嗅觉形成过程分析、识别和检测农产品在腐败过程中释放的不同特征气体。其制作了小型化的传感器阵列并利用半导体制冷片搭建了一个PID温度控制系统,保证传感器正常工作的温度及湿度。在当前技术的发展下,科学家们以彩色计算机视觉系统为重要技术手段,综合运用图像处理、人工神经网络、遗传算法、模拟退火算法以及决策树、专家系统等人工智能领域的技术,研究出了众多实现农产品品质检测和自动分级的新方法。

草莓、葡萄等农产品很容易破损和受伤,依靠人工采摘和搬运,不仅增加了劳动成本,也影响农产品采摘后的品质。结合磁流变(MR)流体技术,工程师们设计出了一种可用于搬运农产品的磁机器人手爪,该手爪经过精确设计,可以搬运胡萝卜、草莓、西兰花和葡萄等不同形状食品,而且不会在食物表面留下任何淤痕和凹陷。为了让机器人手爪更为快速、准确地工作,在磁流变手爪的基础上结合力传感技术开发出了更为灵活、智能的新型手爪。该手爪可在410~530 ms内抓握50~700 g重量的农作物,还能显著减少细菌的交叉感染。

人工智能发展前景

近年来,人工智能技术已经取得了长足的进步,语音识别、自然语言识别、计算机视觉、自动推理、数据挖掘、机器学习以及机器人学都在蓬勃发展。人工智能的未来就是在智能感知的前提下,结合大数据技术自主学习,椭人们做出决策、代替重复性工作。在农业方面出现全天候全自动平台,实现农业生产的全自动化[11]。物联网技术在设施农业中已经得到普及,在温室大棚中的大量智能传感器是机器感知的基础,而感知则是智能实现的前提之一,通过感知,农业数据源源不断地汇集在一起。云计算的发展为大数据存储和大规模并行计算提供了可能[12],而数据则是机器学习的书本。设施农业是物联网、云计算、人工智能三大技术结合应用的领域之一,它们的结合颠覆了传统农业生产方式。

面对众多的新技术、新成果,把它们投入到生产中去才是关键。如何让技术能够适应中国复杂的农业生产环境,同时还要面对不同知识水平的用户,这些都是人工智能技术、云计算技术等高新技术在农业生产中所面临的问题。设施农业高产出高投入的特点,正适合应用这些新技术,这样既可以让新技术有实践的机会,又可以让其他涉农用户对新技术有直观的感知,这对技术进步和技术推广都很有帮助[13]。

人工智能技术虽然前景光明,但其应用的研究才刚刚起步,离目标还很远。未来,人工智能技术可以更好地为人们服务,改善人们的生活,并带来巨大的社会和经济效益[14]。在人工智能的引领下,农业已迈入数字和信息化的崭新时代,借助其技术优势来提高农业生产的经济效益,是全面实现农业生产现代化、智能化、信息化的必由之路。

参考文献

[1]李雪,肖淑兰,赵文忠,等.信息技术在农业领域的应用分析[J].东北农业大学学报,2008,39(3):125-128.

[2]施连敏,陈志峰,盖之华,等.物联网在智慧农业中的应用[J].农机化研究,2013(6):250-252.

[3]刘现,郑回勇,施能强,等.人工智能在农业生产中的应用进展[J].福建农业学报,2013,28(6):609-614.

[4]姜芳,曾碧翼.设施农业物联网技术的应用探讨与发展建议[J].农业网络信息,2013(5):10-12.

[5]陈超,张敏,宋吉轩,等.我国设施农业现状与发展对策分析[J].河北农业科学,2008,12(11):99-101.

[6]邹承俊.物联网技术在蔬菜温室大棚生产中的应用[J].物联网技术,2013(8):18-24.

[7]石礼娟.基于可见光/近红外光谱的稻米质量快速无损检测研究[D].武汉:华中农业大学,2011.

[8]张嘏伟.计算机视觉系统在番茄品质识别与分类中的研究[D].保定:河北农业大学,2005.

[9]谢静.基于计算机视觉的苹果自动分级方法研究[D].合肥:安徽农业大学,2011.

[10]李洪涛.基于农产品品质检测的专用电子鼻系统的设计与研究[D].杭州:浙江大学,2010.

[11]张震,刘学瑜.我国设施农业发展现状与对策[J].农业经济问题,2015(5):64-70.

[12]施连敏.物联网在智慧农业中的应用[J].农机化研究,2013(6):250-252.