计算机视觉发展趋势范文

时间:2023-12-22 18:04:03

导语:如何才能写好一篇计算机视觉发展趋势,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

计算机视觉发展趋势

篇1

关键词 疲劳驾驶 人眼、人脸 嘴巴 专利

中图分号:C18 文献标识码:A

0引言

造成交通事故的原因25%-30%产生于疲劳驾驶,因此疲劳驾驶已成为诱发交通事故的重要因素。国内外专家和学者针对疲劳驾驶的检测开展了大量的研究工作,目前研究的重心主要集中在基于计算机视觉的疲劳驾驶检测,因此对基于计算机视觉的疲劳驾驶检测的相关专利进行分析尤为必要。

1基于计算机视觉的疲劳驾驶检测专利申请数据分析

1.1全球专利申请量趋势

从图1可以看出,基于计算机视觉的疲劳驾驶检测专利申请量从1990-2001年间处于技术研发初期,专利申请量相对较少。从2002年开始该领域的专利申请量逐渐呈现持续增长趋势,并在2014年达到最大值153件。由此可知,随着疲劳驾驶的增多,人们对疲劳驾驶的检测也越来越重视,相应的研究也正不断增加。基于此,在今后的一段时间内,相关的专利申请量有望继续保持。

1.2专利申请产出地区分布

目前各领域的专利申请量主要集中在中国、美国、韩国、日本和欧洲,通过对该领域在中国、美国、韩国、日本和欧洲的专利申请量进行统计分析发现,中国的申请量以48%的占比雄居第一,其他几个地区的申请量相差不大,具体如图2所示。

1.3在华专利申请量变化趋势

图3为1990年至2014年基于计算机视觉的疲劳驾驶检测在华的申请量变化趋势图,由该图可以看出,1990-2002年是技术的萌芽期,在2003年以后申请量才呈现逐年增长的趋势,并且在2012年-2014年将均维持在较高的申请量。因此,该领域国内虽然起步较晚,但是最近几年申请量相对其他地区却具有压制性的优势。

1.4在华主要申请人分析

图4展示了在华主要申请人的申请量份额,主要以科研院所和大型汽车企业为主,其中吉利汽车公司以领先优势排名第一。

2主要技术分支的专利申请分析

基于计算机视觉的疲劳驾驶检测的主要技术分支有:基于人眼的驾驶疲劳检测、基于人脸的驾驶疲劳检测、基于嘴巴的疲劳检测。下面从三个技术分支的发展概况、三个技术分支的主要工作原理及重点专利等方面进行分析。

2.1全球专利申请主要技术分支的申请量趋势图

由图6可知,近年来基于人眼和人脸的驾驶疲劳检测的申请量呈现较快增长,申请量也较基于嘴巴的疲劳检测的申请量大,体现了该领域近年来的发展趋势,并体现出基于人眼和人脸的驾驶疲劳检测的技术分支发展已较为成熟。三个技术分支在2006年之前,申请量的差别不大且数量均较小,显示出在2006年以前三个分支的区别并不明显,发展也较为缓慢,这说明基于计算机视觉的疲劳驾驶检测也是近10年才兴起的一项技术,它依赖于图像处理技术的发展水平。

2.2在华专利申请主要技术分支的申请量趋势图

由图7可知,三个技术分支在2006年以前均只有零星的申请量,这与该领域在全球的发展情况相符合,基于人眼的疲劳驾驶检测在华申请量自2006年以来呈现稳步增长,且近年来申请量最大。基于人脸的疲劳驾驶检测申请量虽小于基于人眼的疲劳驾驶检测,但近年来的申请量也呈现出稳步增长的势头。然而,基于嘴巴的疲劳驾驶检测虽有增长趋势,但申请量一直都较小。由此可知,在国内疲劳驾驶的检测主要是采用人眼检测和人脸检测,这两个分支是国内的研究的热门,也是今后国内在该领域的发展趋势。

3结语

通过对基于计算机视觉的疲劳驾驶检测专利的申请量的总体分析,以及基于人眼、基于人脸、基于嘴巴三个技术分支的申请量趋势分析可知,基于计算机视觉的疲劳驾驶检测在近10年取得了较快发展,这与计算机图像处理技术的发展密不可分;同时,科研院所作为该领域研究的主体,应加强与中小企业的合作。国内疲劳驾驶的检测研究主要集中在人眼检测和人脸检测,这两个分支是国内的研究的热门,同时,基于人眼的疲劳检测其发展方向明确,后续发展将集中在眼睛定位算法的研究上,并且定位精度将越来越高,越来越满足实际的要求。

参考文献

[1] 朱淑亮.基于视频图像分析与信息融合的驾驶员疲劳检测技术研究[J].济南:山东大学,2011.

[2] 刘学.基于人脸图像分析的疲劳驾驶检测方法研究[J].南京:南京航空航天大学,2012.

[3] 张灵聪,王正国,朱佩芳,等.汽车驾驶疲劳研究综述[J].人类工效学,2003.

篇2

关键词:计算机; 交通运输; 视觉; 信号控制

中图分类号:TP39 文献标识码:A 文章编号:1006-3315(2013)06-175-001

近20年来,随着我国经济社会的快速发展,大家直接的感觉是交通和运输行业呈现出井喷式的发展:在1990年的时候,我国机动车保有量是1476.26万辆,我国公路的总里程102.83万公里;到了2010年,我国汽车的保有量已经达到了2706.13万辆,我国公路总里程已经达到了482万公里。交通运输对经济的发展起着至关重要的作用,高效的运输保障能力是促进经济发展的重要措施;自上世纪计算机技术在交通运输领域应用以来,其高运算性、集成性为交通运输系统的发展提供了充分的技术支持,提高了运输效率,缓解了交通运输压力。随着计算机技术的飞速发展,在交通运输系统中将会有更为广泛的运用。

1.计算机视觉技术在交通运输中的应用

基于图像处理的计算机视觉技术是通过摄像机获取场景图像,并借助于计算机软件构建一个自动化或半自动化的图像/视频理解和分析系统,并提供及时准确的图像/视频处理结果,以模仿人的视觉功能。采用人工值守的方式来处理交通问题是一种劳动力成本高昂且效率极为低下的一种工作模式,为了极大地提高工作效率并降低劳动力成本,计算机视觉技术应用于交通领域则成为了近年来的热点之一,其主要应用于以下几个方面:

①基于计算机视觉技术的车辆牌照自动识别。

②基于计算机视觉技术的车辆检测与流量统计。

③基于计算机视觉技术的公交车辆乘客人数统计。

④基于计算机视觉技术的公交专用道非法占道抓拍。

⑤基于计算机视觉技术的驾驶员工作状态判断。

⑥基于计算机视觉技术的行人检测。

随着图像处理、模式识别与人工智能技术的发展,更多的基于计算机视觉新技术将在智能交通系统中涌现,并以此进一步便利人们的出行方式与交通职能部门管理水平与工作效率。

2.车辆收费系统中计算机技术的应用

在近期我国兴起的不停车收费系统(ETC系统)是一种先进的电子收费系统,它包括自动车辆识别系统、计算机网络、监控系统和车道系统4个部分。与之前人工的收费系统相比,节约资源、减少污染、杜绝票款流失、减少车辆延误、提高通行能力与服务水平;该系统普遍采用非接触式的射频卡,以天线的方式对车辆上卡中信息进行读写,采用高速率的半双工协议来进行车辆识别与数据交换,实现车辆不停车收费,不停车收费系统将是未来收费系统的发展趋势,具有极其广阔的应用前景。

3.在交通信号控制领域计算机技术的应用

随着大、中城市不断增加的车辆和有限的道路空间矛盾日益加剧,交通系统面临着越来越多的问题。合理的运用计算机控制管理技术是缓解城市交通问题的重要措施之一,交通信号自动控制是交通控制的重要组成部分。智能交通中的信号灯控制显示出了越来越多的重要性,采用计算机技术、自动化控制技术和现代网络通讯技术,使车辆行驶和道路导航实现智能化,从而缓解道路交通拥堵,减少交通事故,改善道路交通环境,节约交通能源,减轻驾驶疲劳等功能,最终实现安全、舒适、快速、经济的交通环境。

随着我国交通建设的发展,未来的交通控制将在道路、车辆和驾驶员之间建立快速通讯联系。哪里发生了交通事故,哪里交通拥挤,哪条路最为畅通,会以最快的速度提供给驾驶员和交通管理人员。同时专为外出旅行人员及时提供各种交通信息,提供信息的媒介是多种多样的,如电脑、电视、电话、路标、无线电、车内显示屏等,任何一种方式都可以。无论你是在办公室、大街上、家中、汽车上,只要采用其中任何一种方式,你都能从信息系统中获得所需要的信息。有了该系统,外出旅行者就可以眼观六路、耳听八方了。

4.总结

21世纪将是计算机技术高速发展并更加广泛应用的世纪,也是公路交通智能化的世纪,人们将要利用计算机技术,构建更加智能的交通运输体系。计算机技术在将来的交通运输管理中将发挥更加重要的作用。计算机技术将使未来的车辆靠自己的智能系统和道路交通管理体系在道路上自由行驶;公路交通依靠自身的计算机视频传感技术将交通流量调整至最佳状态。计算机技术使得交通运输的效率更高,更好的为经济飞速发展做好支持。

参考文献:

篇3

【关键词】OpenCV视觉库 图像处理 Android平台

Opencv全称:Open Source Computer Vision Library,是一个可以移植到其他开发工具中的一个跨平台的图像处理视觉库,它由C++语言编写,主要有C++、C语言接口,为了能在手机等移动端更方便的进行图像处理,我们利用其JAVA接口将opencv视觉库添加到Android的开发工具中,实现了在移动端的图像处理功能。

1 opencv的特点

(1)跨平台,有很好的移植性。Opencv由跨平台的中高层API构成,可以运行在Linux、Windows和Mac OS操作系y上,该库有C++、C、Java接口,我们运用Java接口就可以将Opencv视觉库移植到Android studio开发工具中。

(2)免费、开源,与耗费很高的商业化工具(比如 MATLAB+Simulink)有很大的区别。

(3)高效、快速、使用方便。Opencv视觉库具有强大的图像运算功能,API中有比较完善的处理函数,能够明显提高开发效率。

2 Opencv在Android studio中的环境搭建流程

2.1 安装Java JDK

需要完成JDK的下载、安装和环境配置的流程,安装完成后,要运行资源管理器输入 Java Version来验证是否安装成功,若显示Java版本信息,则安装成功。

2.2 下载Android Studio开发工具并安装

在Android Studio的中文社区下载最新的Android Studio开发工具(要包含Java SDK),并运行Android Studio,根据安装提示进行安装,并运行开发工具。

2.3 配置Opencv Android SDK

在Opencv官网(http://)下载Opencv Android SDK并解压。在Android Studio中,新建一工程,点击File并import Module,并选中解压的Opencv SDK文件夹中的Java文件夹,这样就将Opencv视觉库移植到了Android Studio中。然后右键App project,打开open Module Settings中的Depencies,点击Module Dependency,添加OpencvLibrary,这样就完成了深层配置。最后把Opencv SDK文件夹中的native文件夹中的libs的4个文件夹复制到所建好的工作空间中的project中的libs中。

3 图像的灰度处理和像素取反处理的应用举例

本文中是用的移动端为魅族MX3,Android版本号为5.0.1。

3.1 灰度处理

使用OpenCv将一幅图像转换为灰度图像在实际应用中也不少,转换为灰度图像比较简单,关键函数: cvCvtColor:cvCvtColor(IplImage* src, IplImage* dst, CV_BRG2GRAY)。值得注意的是:最后一个参数为 CV_BRG2GRAY ,表示将BRG图片(彩色图片)转换为灰度图片(黑白),参数src、dst必须事先分配好内存空间,使用完之后必须要释放空间。

3.2 像素操作―取反

OpenCV中图像取反是将图像中的像素点变为原来像素点的反色。例如,如果一副灰度图像的每个像素值由2^8=256个,假设点i点像素值为brga[i] ,则取反后的像素值为 255- brga[i]&oxff。

关键代码为:

int cnum = src.channels();

byte[] bgra = new byte[cnum];

for (int i = 0;i

bgra[i] = (byte) (255 - bgra[i]&0xff);}

然后运用matToBitmap函数将Mat格式的图像转换成Bitmap的图像,并显示在android手机移动端。

经过编写代码并运行得到的处理结果如图1所示。

4 结束语

OpenCV视觉库是一套简单易用且完整的计算机视觉框架,帮助开发人员完成大量的底层工作,减少了工作量,更有效提高了设计出复杂计算机图形处理的能力。并且我们将OpenCV移植到Android操作系统中去,也是图像处理领域的一大进步。我们相信,在OpenCVForAndroid的应用不断拓展中,众多图像处理领域会有广泛的前景。

参考文献

[1]陈雪娇.基于Open CV的计算机视觉技术研究[J].电脑知识与技术,2015(30).

[2]张家怡.图像识别的技术现状和发展趋势[J].电脑知识与技术,2010(21).

[3]黎松,平西建,丁益洪.开放源代码的计算机视觉类库Open CV的应用[J].计算机应用与软件,2005.22(08).

[4]何鹏,王连鹏,楚艳红.基于Open CV 的机器视觉在智能手机中的应用[J].计算机工程与设计,2011(10).

[5]王福斌,李迎燕,刘杰,陈至坤.基于OpenCV的机器视觉图像处理技术实现[J].机械与电子,2010(06).

作者简介

刘贤辉(1992-),男,山东省青岛市人。现为青岛市山东科技大学在读研究生。主要研究方向为移动端的图像处理研究

篇4

关键词: 计算机视觉; 车辆检测; 速度检测; 消除车辆阴影

中图分类号: TN911.73?34 文献标识码: A 文章编号: 1004?373X(2016)09?0164?03

Abstract: On the basis of the comparison of the traditional moving vehicle real?time detection methods, a new G?C double difference method is proposed. The edge detection of a certain current frame and background frame in video stream is conducted, and then the results are subtracted from the two frames to get the gradient difference. After that the ″or″ operation for the difference result and background color difference result is performed to greatly improve the accuracy of the vehicle judgment. This algorithm can accurately detect the existing moving vehicle on the road and effectively eliminate the effect of vehicle shadow, which provides a strong guarantee for the real?time detection of the following vehicle moving velocity. Based on the results of moving vehicle detection, the programming realization was conducted in VC environment to automatically detect the real?time speed of the moving vehicle. The test results show that the effect of the algorithm is perfect.

Keywords: computer vision; vehicle detection; speed detection; vehicle shadow elimination

0 引 言

计算机视觉(Computer Vision)主要研究如何运用照相机和计算机获取被拍摄对象的数据与信息,形象的说,就是给计算机安装上“眼睛”(照相机)和“大脑”(算法)。目前,计算机视觉技术的应用领域十分广泛,其在道路交通管理中的应用更是取得了很好的效果。随着科学技术的飞速发展,现代交通在经济发展中所起的作用越来越大,而交通现代化带来的问题也越来越多,诸如交通拥挤、交通事故频发、交通环境恶化等。在这样的大背景下,智能交通系统(Intelligent Traffic System,ITS)作为一种强有力的交通管理手段应运而生,其高效率的管理特点使其成为当今世界道路交通管理的发展趋势,而计算机视觉技术则是ITS的重要技术支持。

实时车辆运动速度检测是ITS对交通实施监测和管理的重要一环,对车辆速度的检测一方面可以监控超速等违章问题,减少交通事故的发生,另一方面可以根据车速判断道路拥挤程度,进而迅速采取措施,保证道路交通的安全和畅通,从而实现智能交通管理的目的。在上一代ITS中,实时车辆运动速度检测的方法主要有线圈检测、激光检测、雷达检测等,这些速度检测方法多多少少都存在一定的问题,如容易受路基状况、自然环境等的影响精度降低,而在新一代ITS中基于计算机视觉的车辆速度检测法则大大提高了测速的精度,这有赖于计算机有一个“超强大脑”,即好的算法。

1 运动车辆的检测

运动车辆的检测是实时运动车辆速度检测的基础,使计算机能够自动的把相机摄取的视频里的静止物体与运动物体区别开,并且自动提取出运动物体。所以,在研究实时车辆速度检测算法前,先要研究运动车辆的检测算法。

1.1 现有运动目标检测方法比较

目前,常用的运动车辆实时检测方法主要有帧间差分法和背景差分法。

1.2.2 预处理帧的颜色差分

由于无论车身像素值是否低于路面像素值,其梯度边缘必然存在,而交通路面一般都很平坦,除了车道线外检测不到边缘,将当前帧与路面背景模型均进行边缘检测,再将两个边缘图像按式(8)做差得到运动物体的边缘梯度差分图像:

3 实验结果与分析

笔者用实际拍摄的视频图像对上述算法进行了试验测试,实验时模拟实际交通摄像机的安装情况,使其固定不动,计算机处理的速度约为20 f/s。首先将视频中的某一帧进行边缘检测,与背景做梯度差分,并与背景颜色差分的结果进行“或”运算,最后对图像去噪并二值化,通过测试多种路况、天气和光照条件,试验结果显示该算法可以在阳光充足、遇到物体阴影明显的情况下准确地将运动车辆从视频的背景中提取出来,并能准确检测出车辆的速度,如图3所示。

4 结 语

计算视觉的应用提高了智能交通系统的准确性,本文在对比了传统运动车辆实时检测方法的基础上,提出了一种新的运动车辆实时速度检测算法,此算法与传统的算法相比,可以更加准确地检测出路面运动车辆的存在,同时有效消除车辆阴影的影响,为后续车辆运动速度的实时检测提供有力保证。基于运动车辆检测的结果,进行编程实现,可以自动检测出运动车辆的实时速度,测试结果表明该算法效果很好。

参考文献

[1] MARR D, HILDRETH E. Theory of edge detection [J]. Royal society of London proceedings, 1980, 207(1167): 187?217.

[2] 高富荣,方强.机动车地感线圈测速监测系统性能和检测方法研究[J].上海计量测试,2008(2):27?28.

[3] 安福东.机动车的几种测速方式原理及性能的分析比较[J].警察技术,2003(3):33?35.

[4] 姜永林,孙国栋.交通车辆视频测速技术[J].仪表技术与传感器,2007(9):69?70.

[5] 弼程,彭天强,彭波.智能图像处理技术[M].北京:电子工业出版社,2004.

[6] 邢霄飞,李永宁,林木华.一种基于纹理分析的视频车辆测速方法[J].计算机应用,2005(12):2803?2805.

[7] 周许超,屠大维,陈勇,等.基于相位相关和差分相乘的动态背景下运动目标检测[J].仪器仪表学报,2010(5):980?983.

[8] 王芳林.稳健视觉跟踪算法中的关键问题研究[D].上海:上海交通大学,2009.

篇5

关键词:农业生产;机械制造;应用;自动化技术

我国是一个农业大国,农业生产和农业经济对于我国而言非常重要。为了更好地提高农业生产效率,在农业生产过程中,合理地应用行之有效的机械制造自动化技术,对于提升农业生产有着明显的推动作用。在农业生产当中借助机械制造自动化,不仅可以大大减少农民的工作量,还可以显著提升劳动生产的舒适性以及效率,实现成本节约的同时,还可以显著优化农产品的生产。因此,探讨农业机械制造自动化的应用具有显著意义。

1机械制造自动化技术

机械制造主要是按照机械设计的最终效果发展生产以及制造的过程,其中会涉及许多类型的设备,例如工业当中的仪器仪表、机床等机械设备,在农业生产中主要是一些能够提高农业生产行为效率的机械设备。近些年,我国机械制造行业的发展速度十分明显,并且也获得了大量的创新成就。通过相应的研究,我国机械制造行业目前已经处于国际先进水准,同时逐渐向自动化、数字化、智能化的方向发展。其中,虚拟化、自动化是主要发展目标,通过虚拟化的控制,自动化的操作与控制可以实现更好的优化生产效率和效果的目的。机械自动化技术可以为农业生产提供至少以下几个方面的优势和特点:优化产品质量、提高生产效率、控制生产周期、控制生产成本、提升经济效益、降低人工劳动力投入、实现生产环境环保型,推动相应行业与技术不断发展和创新。

2农业机械制造自动化的应用现状

机械自动化技术是农业生产中最为重要且应用意义巨大的一种技术,国外一些发达国家,已经能够将大量的农业机械制造自动化技术应用到农业生产当中,并且在农业生产中的收割、整理、筛选、加工、包装等流程中应用自动化机械,可以实现自动化的生产效果。农业机械制造自动化技术仍然需要坚实的科学技术为基础,其中主要包含计算机集成制造系统、计算机辅助设计技术、高精度的加工技术等,目前我国机械制造自动化技术仍然处于萌芽阶段,仍然需要更加深入的研究和创新。根据机械自动化技术的制造规模划分,农业行业当中的机械自动化主要可以分为自动化制造、自动化制造系统、制造线、制造工厂等。就农业机械制造领域而言,我国仅仅达到了自动化制造、自动化制造系统的建设和创新,在其他方面仍然有待提高。

3农业中机械制造自动化的未来发展前景

3.1自动化视觉技术的应用

计算机的视觉技术是新时期的一种重要技术之一,国外许多发达国家已经针对这一技术开展了相应的工程性应用。计算机视觉技术在农业生产当中的应用主要表现在评判农产品的质量、管理农业种植的资源、记录农作物的生产信息以及自动收货等方面。例如,英国通过计算机视觉技术制造了专用于采蘑菇的机器人,通过其中的视觉处理技术以及图像处理功能,可以让机器人在采蘑菇时准确定位并有效采集。当前,这一技术在我国仍然不够成熟,需要进步一研究和应用。

3.2农产品检验与包装技术

就目前的农产品检验与包装效率而言,大多数属于密集劳动的方式,想要有效提升这项工作的工作效率,可以应用自动化检测包装设备,其中可以借助摄像机或X射线等方式探测农产品的病害程度以及受损害程度,并将包装完好的农产品挑选出来,并计算农产品的数量以及体积,之后再借助包装机,根据不同质量等级以及体积将农产品包装好。这一技术在许多发达国家已经达到了生产线密集型的应用,但是在我国存在着明显的问题,仍然需要相关研究人员不断探究和实践,并根据我国实际的农业生产现状,设计出符合我国农业生产的农产品检验与包装自动化技术。

4总结

综上所述,农业机械制造的自动化技术未来必然是农业社会经济发展的必然,对农业生产均有着明显的意义和作用。因此,在农业机械生产以及制造过程中,需要不断提高对机械自动化技术的重视和探讨,提升农业机械制造设备以及管理的自动化状况,从而更好地推动我国农业生产。

作者:李洪芹 颜廷婷 鲁鸿 单位:1、山东省临沂市费县农机监理站 2、山东省临沂市兰山区方城农机管理服务站

参考文献:

篇6

智能家居是以住宅为平台,基于物联网技术,由硬件(智能家电、智能硬件、安防控制设备、家具等)、软件系统、云计算平台构成的一个家居生态圈,实现人远程控制设备、设备间互联互通、设备自我学习等功能,并通过收集、分析用户行为数据为用户提供个性化生活服务,使家居生活安全、舒适、节能、高效、便捷。智能家居包括家居生活中多种产品,涵盖多个家居生活场景。

2016年中国智能家居市场规模达到1140亿元,2017年第二季度智能家居活跃用户规模达到4600万。随着物联网技术、人工智能技术的发展,及90后婚育潮的到来,智能家居将成为主流的发展趋势。

从智能家居发展阶段来看,中国智能家居市场正处于市场启动阶段,尚未进入爆发期,智能家居产品渗透率较低。目前,智能家居领域依然存在诸多制约因素,如产品本身智能化程度低,多数产品是按既定的程序完成任务,在主动感知和解决用户需求、人机互动等方面达到的体验依然较初级,因此没有形成广泛的用户粘性,消费者对智能家居产品抱有观望态度。而相较于亚马逊的echo和GoogleHOME,国内还没有成熟的智能家居控制中心,仍处于以手机APP向智能音箱、智能电视、机器人等控制中心的过渡时期。

人工智能技术可以带来硬件背后的软件及服务能力、与智能硬件相匹配的交互技术。人工智能+智能家居,有利于形成适配下一代硬件的真正的“智能化”及深入场景体验的个性化计算,语音及视觉等人机交互技术有助于提升与智能家居产品的交互体验。

“AI+智能家居”提升智能家居产品交互体验

语音交流更倾向于日常交流方式:通过人类的语言给机器下指令,从而完成自己的目的,而无需进行其他操作,这一过程将更为自然。同时语音交互在特定的场景中具有优势,比如远程操纵、在行车过程中等,能够实现在特定场景中解放双手的作用,在家居相对封闭的环境中,语音识别成为主流的人机交互方式。

近年来,语音交互的核心环节取得重大突破,语音识别环节突破了单点能力,达到97%以上的中文语音识别准确率,从远场识别,到语音分析和语义理解技术都日趋成熟,多轮对话的实现等都有利于语音交互取代传统的触屏交互方式,整体的语音交互方案已被应用到智能家居领域中。

计算机视觉、手势识别等交互方式成为语音交互的辅助,echo在新推出的echoshow产品中已搭载屏幕,而智能电视除语音交互之外,通过计算机视觉分析视频内容,并对内容相关的资料进行下一步操作,包括短视频剪辑、边看边买等,比如Yi+搭载在天猫魔盒中的“瞄一下”功能。再比如在智能冰箱中,通过计算机视觉实现对冰箱内食品的分析,以及衍生出的用户健康管理和线上购物等功能,多种交互方式将统一在家居生活场景中,从而提供更为自然的交互体验。

另一方面伴随着智能家居平台的发展,通过“IFTTT”的场景布局,智能家居实现多种家居产品的联动,用户可以自定义多个使用场景,实现定制化、个性化。在人工智能技术的发展将使得个人身份识别、用户数据收集、产品联动在潜移默化中变成现实,未来家居生活场景中将提供千人千面,家庭成员的个性化服务。

“AI+智能家居”实现内容和服务的拓展

找到合适的语音入口是挖掘智能家居背后用户价值的关键。硬件本身具有入口价值,智能音箱,智能电视,家庭机器人等都有可能成为合适的入口。

传统的鼠标操作、触屏操作逐渐向语音交互这种更为自然的交互方式演进,语音交互的未来价值在于用户数据挖掘,以及背后内容、服务的打通,以语音作为入口的物联网时代将会产生新的商业模式。智能音箱、服务机器人、智能电视等智能化产品成为现阶段搭载语音识别技术和自然语言处理技术的载体,作为潜在的智能家居入口,智能音箱、服务机器人和智能电视等产品在提供原有的服务的同时,接入更多的移动互联网服务,并实现对其他智能家居产品的控制。这些产品为付费内容、第三方服务、电商等资源开拓了新的流量入口,用户多方数据被记录分析,厂商将服务嫁接到生活中不同的场景中,数据成为基础,服务更为人性化。

“AI+智能家居”的未来发展趋势

a.带来更好的智能化、更高体验的人机交互

从最早的WiFi联网控制到如今的指纹识别、语音识别,人机交互性能大大提升,智能家居产品正在由弱智能化向智能化发展。而智能家居产品受众也将从尝鲜者转向更为普通的用户,甚至包括老人和小孩。更智能化的技术应用、更复杂的用户结构和更广泛的用户覆盖等因素必将促使智能家居产品趋于简单实用。

智能化和人机交互体验的升级将大大扩宽智能家居应用场景,2016年,智能安防类产品落地,指纹锁、智能摄像头等产品受到了广泛关注。随着智能感知、深度学习等技术的提升,智能灯光、智能温控等产品也逐渐趋于成熟,2017年智能音箱成为爆款产品。当用户需求不断扩大,产品愈加丰富,智能家居将会渗透到家居生活的方方面面。智能家居市场将迎来爆发,2019年,智能家居市场规模有望达到1950亿元。

b.智能音箱、智能电视、管家型机器人将继续抢占智能家居控制中心,智能家居趋于系统化

篇7

关键词:机器视觉;自动化;图像处理

中图分类号:TP391.4 文献标识码:A 文章编号:1006-8937(2013)23-0012-021 机器视觉的定义

机器视觉是用机器来代替人的眼精来做测量和判断的一门技术。机器视觉系统是通过图像摄取装置将被摄取目标转换成图像信号,并且传送给专用的图像处理系统,把图像信息转变成数字化信号;图像系统对处理好的信号进行运算抽取目标特征,从而根据目标特征来控制现场设备的动作。

2 机器视觉技术的发展

机器视觉这门技术从80年代开始全球获得了蓬勃发展,不断涌现出新的理念。在中国该项技术自起步发展至今,机器视觉已经有20多年的历史,其功能以及应用范围随着工业自动化的发展逐渐完善和推广。研究领域发展十分迅速。机器视觉的发展已有20多年。1990年以前,仅仅在大学和研究所中有一些研究图像处理和模式识别的实验室。1990~1998年为初级阶段。主要的国际机器视觉厂商还没有进入中国市场。越来越多的电子和半导体工厂带有机器视觉的整套的生产线和高级设备被引入中国。1998~2002年定义为机器视觉概念引入期。在此阶段,许多著名视觉设备供应商,开始接触中国市场寻求本地合作伙伴。从2002年至今,我们称之为机器视觉发展期,中国机器视觉呈快速增长趋势并且应用范围广泛。

现在,机器视觉仍然是一个非常活跃的研究领域,目前国际上从事机器视觉技术研究较为成功的企业主要有:美国邦纳工程公司、捷达科技有限公司、东芝泰力株式会社等。国内深圳、广州、西安等地此项技术发展较为迅速。比如深圳市视觉龙科技、广州三拓识别技术有限公司等。

3 机器视觉技术的工作原理

机器视觉是一项包括了光学成像、传感器、图像处理、机械工程等光、机、电及计算机图像处理的综合技术。

它一般包括照明、镜头、CCD相机、图像处理软件、图像处理单元、监视器和动作执行机构等。其工作流程如图1所示。首先光源投射到被测物体,通过CCD相机捕捉获取被测目标的相关图像信息,然后通过PC机等设备A/D变换转换成数字信号传给图像处理单元,图像处理单元对捕捉到的像素进行分析运算来提取目标特征,输出判别结果,最后把处理过的相关信息传输给执行机构。

4 机器视觉技术的特点

机器视觉系统最大特点是可以提高生产的柔性和自动化程度。通常机器视觉可以代替一些人的视觉难以满足要求的场合或者不适合人工作业的工作环境。另外机器视觉系统在检查大批量生产过程中体现了速度快、精度高等特点。比如产品包装生产线的自动化程度很高,用视觉识别系统代替人工进行在线检测,可以大大提高生产效率。虽然机器视觉系统的优点很突出但是也有它的局限性,所以要根据检测对象的不同特点采取适合的方案。

5 机器视觉技术的应用

当前机器视觉的应用主要体现在以下三个方面:

第一是检测功能,它是机器视觉系统在实际中应用最多的一项功能。能够检测出包装、印刷有无错误、划痕等表面的相关信息。

第二是定位功能,能够自动判断被检测物体的位置,并将位置信息输出。它主要在全自动装配和生产过程中使用。比如自动包装、机械手等执行机构。

第三是测量功能,主要是自动测量被检测物体的外轮廓尺寸等,提高了人工作业的测量精度。

6 机器视觉技术的发展趋势

构建一个合格的机器视觉系统离不开合理的硬件搭配和可靠的控制程序。对于视觉系统的未来研究过程中,图像处理技术和运动控制技术将是整个视觉控制系统开发工作的重点。机器视觉的发展趋势主要有四点。

趋势一:产品标准化。目前从事机器视觉软硬件开发研究的公司中都开发自己独立的产品,导致各个公司生产的硬件产品不能通用,软件兼容性也存在一定的问题,造成了资源的浪费。因此,有必要设立产品软硬件的行业标准,规范各种接口定义和技术指标,降低用户使用成本。

趋势二:产品集成化。越来越多的公司正在开发集成有图像处理芯片的摄像机,这类摄像机在完成图像采集任务的同时,可以对图像进行预定的处理,输出用户指定的信息或者一定标准的图像,由于采用硬件处理图像,一般可以达到很高的处理速度,减少系统等待时间。

趋势三:图像处理软件的人性化。虽然现在的图像处理软件还需要具有图形处理知识背景的工程人员去使用,但是这些软件都在向着一个共同的趋势改变,那就是软件使用变得越来越简单,功能划分越来越细致具体。很多开发软件还提供了开发助手等工具,使即使没有专业知识的工程人员也可以很快的编写出满足要求的处理流程并自动生成程序代码。

趋势四:机器视觉与运动控制、网络化等技术的结合。视觉系统涉及到多种领域,是一种高度专业化的产品,在实际产品生产线上对多工序同步连续检测时,必须使视觉系统具备分布式联网能力。

7 机器视觉技术存在的问题

机器视觉系统在应用中也同时存在着一定的问题,比如:如何准确高速地识别出目标、解决实时性问题的能力、多传感器融合问题、视觉系统与执行机构的协调问题、系统的稳定性问题等问题。机器视觉技术比较复杂,机器视觉不能通过省法来来描述整个视觉过程。所以机器视觉系统的建立十分复杂。但随着机器视觉技术逐渐的成熟和发展,它一定将在制造企业中得到越来越广泛的应用。

参考文献:

[1] 梅江平.高速包装机器人技术与应用[J].机器人技术与应用,2007,(5):18-20.

[2] 谢勇,彭涛.机器视觉及其在现代包装中的应用[J].株洲工程院学报,2002,(4):1-4.

篇8

关键词:禽蛋 无损检测 机器视觉技术 光学无损检测 新鲜度 大小分级 孵化蛋成活性检测

中图分类号:TS253 文献标识码:A 文章编号:1672-3791(2017)04(b)-0109-02

1 国内禽蛋产业发展现状

我国是世界第一禽蛋生产大国,禽蛋产业不但在我国农业中占有重要地位,而且是关系国计民生和社会稳定的重要产业。据统计数据分析,鸡蛋消费以鲜蛋为主,鸭蛋大部分是经过再制和加工后再使用,鹌鹑蛋的鲜销和再加工比例接近1∶1。

相比较产业集中、加工趋升、品质提升的国际蛋业未来发展趋势而言,我国蛋品的集中化程度和产业发展水平都较低,而且相比较发达国家集约化产销体系规模大、产业集中度高等特征,我国较大型的蛋品加工企业较少,蛋品集中化程度和产业化发展水平较低。但是,近年来,我国的禽蛋加工业也有了一定的发展,尤其是禽蛋的无损检测方面。

无损检测,即非破坏性检测,是在不破坏待测物原来的状态、化学性质等前提下,为了获取与待测物品质有关的内容、性质或成分等物理、化学情报所采用的检测方法。

目前,我国禽蛋的无损检测主要集中在以下几个方面:禽蛋的内部品质检测、外部品质检测、禽蛋储存时间的检测、孵化蛋成活性的检测以及大小的自动分级等方面。

2 禽蛋无损检测的现状

2.1 禽蛋的内部品质检测

禽蛋的内部品质检测主要是针对新鲜度的检测。禽蛋新鲜度的主要检测指标包括3个方面:气室的大小、蛋黄哈夫值、蛋黄指数。根据国际上新鲜禽蛋内部品质的检测标准,用蛋黄指数和蛋黄哈夫值作为禽蛋新鲜度的评价标准[1]。禽蛋新鲜度的检测可以利用光学特性、计算机视觉等方法来实现。

光学无损检测的原理是:光照射到物体上以后,光能一部分被外表面反射;一部分进入物体内遇到细胞结构或产生散射,或被物体所吸收;其余部分则透过物体。由于被测物体的内部成分、表面状况、入射光波长以及折射率等因素都各不相同,因此通过入射光照射物体得到反射、折射和散射等比例不一样。2002年,刘燕德等利用光学无损检测原理,取波长为200~600 nm的入射光,通过实验分析该波段内鸡蛋新鲜度的光特性,分析鸡蛋内部品质与透射特性的关系,对鸡蛋新鲜度做出估量,证实了利用鸡蛋投射特性对鸡蛋进行无损检测和分级是可行的[2]。

机器视觉技术是人工智能的一个分支。简单来说,机器视觉就是用机器代替人眼来做测量和判断。计算机视觉系统利用相机获得被测目标的图像并将其转换为数字信号,再将该信号传送给专用的图像处理系统,得到被摄对象目标的形态信息,根据像素分布和亮度、颜色等信息,转变成数字化信号;并通过合适的算法提取图像特征值作为图像分析的依据。2014年,杨简等人利用机器视觉装置获取鸡蛋透射图像,进行图像处理并提取合适的特征参数,在BP神经网络中引入灰色理论,建立灰色神经网络,并以该参数集为样本训练灰色神经网络,预测鸡蛋哈夫值,检测鸡蛋的新鲜度。试验结果表明,灰色神经网络预测精度较高,哈夫值残差为5.268 4,鸡蛋分级的正确率为92.7%[3]。2015年,刘艳等人通过冷光源照射获取鸡蛋彩色透光图像,在自适应灰度调整和改进空间滤波等预处理的基础上,利用阈值分割法并结合最小二乘法进行蛋黄椭圆拟合,提取与鸡蛋新鲜度相关的3个特征参数,采用梯度下降算法得到鸡蛋透光图像三元新鲜度模型。经检验,该模型具有较高的可靠性,可对禽蛋进行实施新鲜度检测与分级[4]。

2.2 禽蛋的外部品质检测

禽蛋分级检测的主要指标是轮廓特征,可用蛋形指数(蛋形指数=蛋的纵轴/蛋的横轴)表示。根据国内外禽蛋分级标准,蛋壳颜色、外形轮廓、质量、颜色等都可以作为禽蛋外部品质分级的特征参数。禽蛋外部品质检测的主要方法有利用动力学、声学特性和机器视觉等。2003年,丁幼春利用机器视觉技术,分别对鸭蛋蛋心颜色、蛋壳厚度、蛋的新鲜度以及质量进行检测,利用光密度值进行模糊识别,建立相应模型并得到鸭蛋大小及蛋心颜色自动分级系统[5]。2004年,王树才等人利用敲击声音信号进行禽蛋破损检测和模糊识别,该试验结果表明,可以利用正常蛋、破损蛋、钢壳蛋、尖嘴蛋的敲击声音信号在衰竭时间、最小共振峰频率和四点最大频率差等参数上存在的差异性,实现破损蛋的识别,准确率达95% [6]。2006年,熊利荣等人利用机器视觉系统得到鸡蛋图像,经图像处理技术提取能够表征鸡蛋大小的特征参数(蛋的像素和A、长轴长L、短轴长S、蛋型指数K),建立了重量和短轴之间的线性回归模型,该模型能够检测鸡蛋的外形尺寸。试验结果表明,鸡蛋的大小与像素和A以及短轴之间均存在显著线性相关关系,修正后的模型相关系数达到了0.981[7]。

2.3 孵化蛋成活性的检测

种蛋孵化率的高低是影响养殖业经济效益的一个重要因素,而种蛋受精率的高低在很大程度上决定了孵化率的高低。据统计数据研究表明,种蛋的受精率一般低于90%。鉴别孵前或孵化早期无精蛋是禽蛋生产的难题之一,目前主要有有机器视觉、利用近红外光谱和高光谱等方法实现孵前种蛋的检测。2000年,陈家娟等人在获取孵化鸡蛋色度直方图的基础上提取孵化鸡蛋表面颜色作为特征值,并结合遗传神经网络,建了一套适合于孵化鸡蛋可成活性自动检测的机器视觉系统[8]。 2012年,祝志慧等人利用近红外漫反射光谱分析技术对种蛋中的无精蛋和受精蛋进行检测,通过对不同波段范围、不同主成分因子数和不同光谱预处理方法对种蛋类型检测结果的比较分析,建立种蛋的定性检测模型。该研究为孵前无精蛋和受精蛋的无损检测提供了新的途径[9]。2015年,祝志慧等人运用高光谱成像技术将图像信息与光谱信息结合起来,通过研究孵化前受精蛋与无精蛋的图像差异、光谱差异,运用高光谱成像技术,结合D像信息和光谱信息,提取图像的特征值,运用不同的方法建立关于孵化前受精蛋和无精蛋分类的判别模型,并比较。实验结果表明,利用RVM检测孵化前受精信息具有可行性,可以提高检测模型的精度[10]。

3 禽蛋无损检测的现状分析

在广泛阅读国内禽蛋品质无损检测技术相关文献的基础上,了解到,目前我国禽蛋品质的无损检测主要集中在禽蛋新鲜度,储藏时间;禽蛋大小、颜色分级以及禽蛋蛋壳裂缝检测;孵化蛋、种蛋和无精蛋检测等方面。禽蛋新鲜度和大小颜色分级的检测方法主要通过有机器视觉技术、光学无损检测技术、利用声学特性结合机器视觉技术,建立新鲜度相关的数学模型和大小分级模型;孵化前种蛋和无精蛋的鉴别虽然暂时还没有实现精度很高的鉴别方法和模型,但是近红外光谱漫反射光谱分析技术和高光谱成像技术的运用,为禽蛋孵化前受精信息的定性检测提供了新的方法和思路。但是,综合以上分析来看,目前我国禽蛋品质的无损检测仍存在一些问题有待改进。

(1)目前,有关禽蛋品质检测的研究和实验品种及检测功能都比较单一,相关研究应该在现有成熟技术手段和方法的基础上结合实际生产的需要,适当拓展试验品种,综合检测项目,以满足禽蛋业发展品质提升的趋势。

(2)利用光学、声学特性无损检测虽然已经取得一定成果,但与实际生产需要仍有距离。可以考虑将这些成熟技术与一些精密仪器和机械结合起来,投入到实际的生产线中。

(3)禽蛋孵化前种蛋的鉴别检测仍然是需要攻克的难题,虽然目前已经提出了可行的检测方法,并实现了定性的检测,但是孵化中死胚蛋的鉴别检测方法有待进一步研究。

针对以上问题,在今后的禽蛋品质检测的探索中,研究者一方面需要跟踪世界先进技术,另一方面寻求图像增强、分割、特征提取、提高无损检测准确性的算法和判别模型。

参考文献

[1] 杨旭,郑丽敏.计算机视觉在禽蛋品质检测中的应用研究进展[J].农机化研究,2008,9(9):168-170.

[2] 刘燕德,乔振先.鸡蛋光特性及其与新鲜度的相关性研究[J].江西农业大学学报,2002,24(1):45-48.

[3] 杨简,潘贺,李太浩,等.基于灰色神网络的蛋品新鲜度无损检测的研究[J].中国农机化学报,2014,35(1):229-234.

[4] 刘艳,李庆武,黄小微,等.鸡蛋图像特征提取与新鲜度检测模型研究[J].科学技术与工程,2015,15(25):72-77.

[5] 丁幼春.基于机器视觉鸭蛋品质无损自动检测分级系统的改进[D].华中农业大学,2003.

[6] 王树才,任奕林,陈红,等.利用敲击声音信号进行禽蛋破损检测和模糊识别[J].农业工程学报,2004,20(4):130-133.

[7] 熊利荣,王树才,任奕林,等.鸡蛋大小等级模型的修正[J].农机化研究,2006(2):104-105.

[8] 陈佳娟,陈晓光.采用计算机视觉进行孵化鸡蛋成活率可能性的自动检测[J].计算应用与软件,2001(18):5-10.

篇9

仅在一年前,被誉为“世纪之战”的李世石对战AlphaGo令人工智能(AI)进入公众视野。彼时,VR市场颓势已现,渐入谷底。AI概念的及时出现拯救了寥落许久的资本市场,凛冽的“资本寒冬”一度回暖。根据CBInsights的数据,2016年,全球人工智能领域的投资数量达到698笔,是2012年的近5倍。而在国内,BAT带头布局,创业项目四起,一时间全民AI,2016年也因此被称为“人工智能元年”。

潮水退去,才展现出行业的本来面目。“有一些泡沫,但没有‘’、O2O那会儿那么多。”创新工场技术副总裁、人工智能工程院副院长王咏刚告诉《21CBR》记者。

“扎实”、“踏实”是众多投资人谈及人工智能时提到的关键词。对创业者而言,技术的重大突破、庞大的用户市场以及多方政策的利好,似乎预示着人工智能的商业春天才刚刚开始。然而,要想站在下一波浪潮的潮头,成为这场堪比工业革命的时代获益者,既要比拼硬实力的突破,也依仗对行业的理解,二者缺一不可。在人工智能的商业化进程中,脆弱的科学家式创业将难以冲破重重阻碍。

李开复重仓

当下提及人工智能,不能不关联至创新工场。2016年,这家专注于Pre-A到C轮的早期投资机构重仓人工智能,投资相关领域创业公司超过30家。早年研究语音识别的创始人李开复身体力行,一举一动不离人工智能:演讲、出书、为投资公司站台、成立人工智能工程院。直到今年初,李开复公开表示:“能投的已经不多了。”

王咏刚告诉《21CBR》记者,人工智能尚处在行业发展的早期阶段,“我们看好整体的发展趋势,但现阶段项目的绝对数量是少的,找好项目相对来说也就困难一些。”对创新工场而言,好项目各有各的好,不投的项目归结起来则离不开三个方面:技术、团队和模式。

第一类是技术令人难以信服的概念炒作式项目。“开复就是搞人工智能出身的,我之前在谷歌工作,接触的项目比较多。有的创业公司说得天花乱坠,实际技术上是做不到的。”对于技术本身的发展趋势、在哪个领域能够解决哪些问题,创新工场自信在国内VC界的判断是较为准确的。

其次,对于纯科学家团队创业,由于不具备足够的商务落地渠道,“我们也会非常谨慎。当然不排除有的科学家确实技术很好,我们就帮他做孵化”。至于商业模式,在当下的国内互联网企业中,阿里、腾讯纷纷成立人工智能实验室,百度索性称自己是一家“人工智能公司”。那些巧妙避开了巨头现有业务冲击,自身具备不可复制和可持续性的创业项目,成功几率自然更高。

元Z资本合伙人陈洪亮认为,在人工智能这一强技术领域,图像和语音是已被验证的两个赛道。过去10年间,得益于深度学习算法和GPU等计算设备的发展,计算机视觉技术快速落地金融、安防、医疗等B2B领域。相比之下,语音技术偏重在客服、车载、智能家居等消费端领域,背后也有赖于语音识别、声纹识别等工业级算法的日趋成熟,“未来在这两块,将会出来一批比较扎实的成果。”

2014年底创立的Rokid(若琪)是元Z资本在语音赛道的代表项目,从天使轮到B轮一路跟进。5月15日,Rokid旗下第二款产品、名为Pebble(月石)的智能音箱在天猫开售。用户运用语音指令可以操控音箱播放音乐、报告天气,甚至控制家中的照明、电视等智能家居设备。Pebble意在通过日复一日的“自我学习”,无限趋近用户的偏好习惯。

相比用智能家居APP开关灯,一条语音指令显然要简单得多。无论是手机还是PC,都需要人去适应机器,声音似乎是人与机器更自然的交流方式。从天气到音乐,从新闻播报到童话朗读,元Z资本相信,声音将作为一种人机交互的无形界面,成为下一个平台级入口。而新入口的诞生,将带来变革性的机会。

不过,在陈洪亮眼中,对领域知识的依附使得创业初期的技术优势正在减弱,“行业细分,客户分散,即便有强悍的技术背景,过了一年左右的时间窗口,最后比拼的还是对商业的理解。”从这个角度而言,人工智能更以行业为导向,而非纯技术项目。“是行业+,不是AI+。”陈洪亮称。

这也是创新工场成立人工智能工程院的目的之一:源源不断向创业者推送产业项目,挖掘适合团队技术的商业模式并加以验证,为创业科学家寻觅商业合伙人,从而帮助团队尽快步入创业正轨。王咏刚表示,“商业合伙人具备的行业经验,必须令其懂得如何在行业里面拿到项目,纯科学家式的B2B创业很难。”

4月,在一次企业家公开活动上,北极光创投创始人邓锋面对两位业界人士发问:“讲究强关系的B2B行业会否影响人工智能的游戏规则?”依图科技CEO朱珑当时回应:“(关系)是现状,但产品真的能打动人。”或许可以这么理解,“关系”在某种程度上也代表着,你比别人更了解行业。

对于AI创业者,B2B意味着赚钱的难度和门槛更高了。不过,收费的价值也因此体现。在陈洪亮看来,一旦客户为此买单,其在组织机构内部能够被更高效地推行,避免沦为乏人问津的免费试用。王咏刚也相信,移动互联网的免费打法在人工智能时代将难以延续。

尽管业内少有公司公布自己的营收情况,但投资人大都表示,人工智能正在加速变现,“有些2B的项目,盈利已经很好了。”对于投资人和创业者而言,变现不仅仅代表了财务模型的转正,也意味着终于赢得了市场与用户的认可。

四家独角兽

拥有大数据支持的金融、安防和医疗,被视为是人工智能的下一个机会,也成为过去一年资本聚集的行业。国内计算C视觉赛道的创业公司接近30 家,人脸识别领域更是出现4 个独角兽――旷视(Face++)、商汤、依图、云从科技,纷纷完成融资。2017年,在工信部的“独角兽”企业榜单中,旷视的市场估值突破20亿美元。

旷视市场部副总裁谢忆楠告诉《21CBR》记者,2013年,旷视开始专注于人脸视觉的产品通用化。“当时主攻三方面的算法――人脸检测、关键点标注和人脸识别,团队基于行业做了很多技术上的研究。”2013-2014年,旷视拿下3项世界计算机视觉竞赛的第一名。2015年,在德国汉诺威IT博览会上,马云向德国总理默克尔演示Smile to Pay扫脸技术,就是由旷视提供核心算法,将刷脸支付模块内置到支付宝客户端中。

目前,旷视的Face++人工智能开放平台面向中小银行、地产园区、IT企业及独立开发者开放人脸、图像、文字等识别能力。其中,人脸识别API的日均调用量超过2400万次,是目前世界最大的人脸技术平台。旷视方面声称,其人脸识别技术在国内互联网金融领域拥有80%以上的份额。

旷视的快速崛起得益于技术和市场的多重利好。一方面,深度学习算法在过去10年间取得重要突破,给计算机视觉的大规模应用奠定了基础。另一方面,2014年,国家实名制工作相继在网络、电信和金融领域全面铺开。2015年,互联网金融雨后春笋般涌现,通过人脸识别技术完成远程开户和身份验证,成为各方普遍采用的技术手段。计算机视觉创业公司步入商业化时期。

谢忆楠表示,公司在商业化前期关键性地走通了“数据―算法―产品―技术”这一循环,面向行业的通用服务乃至更为深度的定制化方案得以落地。

而另一家独角兽公司――依图科技则啃下了安防这块骨头,其“蜻蜓眼”人像大平台服务于全国上百个地市的公安系统,是全国唯一拥有十亿级人像库比对能力的公司。

利用技g优势,快速切入一两个行业,从而形成深度合作,是上述独角兽公司早期脱颖而出的共同原因。在现有技术已然成熟、各家准确率纷纷达标的情况下,如何基于真实痛点挖掘场景,提供定制化且可复制的解决方案,成为打破传统行业壁垒、快速拿下市场的关键。

而在语音赛道,技术成熟也意味着消费级机器人市场的打开。Rokid并非头一个玩家,却自带网红体质。其迄今为止的两款产品,在未设独立展位的情况下,连续两年获得CES(国际消费电子展)创新类奖项。创始人Misa(祝铭明)在江湖上见首不见尾,研究团队的阵容却堪称强大:位于北京和旧金山的两个实验室由数十名全职博士科学家组成,来自中科院、哈佛、斯坦福、伯克利等一批海内外顶尖院校。

Rokid北京实验室负责人高鹏告诉《21CBR》记者,智能音箱Pebble的核心功能体验分为三类:音乐、儿童读物等内容服务,天气、闹钟等工具类服务,以及智能家居控制服务。凭借600万首320K码率高品质曲库和喜马拉雅FM等对接资源,Pebble向用户提供的内容涵盖音乐、新闻、电台、相声、戏曲和脱口秀等。一切体验从用户对其说出激活词“若琪”的一刻开启。

激活词“若琪”的设计和打磨用了将近一年时间。高鹏介绍,激活词的识别错误率随着音节的加长而降低。目前国内外同类产品的激活词大多设置在3-4个音节,而双音节的高激活率很难成功。在经历“若小琪”、“Hi,若琪”的反反复复后,研究团队还是通过算法验证实现了双音节。在公开的试用报告中,Pebble多个维度的人机交互体验超过了谷歌推出的业内首款产品Google Home。

而在声音定位上,祝铭明早年从威尔・史密斯主演的科幻电影《我,机器人》中的机器人女声获得灵感。高鹏坦言:“当时根本没有那样的现成声音。”团队开始在市场上寻觅适合的音色,同时自主研发TTS(Textto-Speech)语音合成技术,并由专门团队对声音处理和内容反馈进行设计,“若琪”最终被定位为一个温柔、幽默、聪明且不失个性的女声。

通过开放基于网络协议的API标准,Rokid还将飞利浦、小米、lifesmart等品牌纳入到其智能家居生态链中。在几乎未做投放、线下推广的情况下,开售三个星期的Pebble在天猫官网的销量逼近千台。祝铭明对媒体表示:“产品日活跃用户数量超过50%,用户使用时长平均超过1小时。”6月8日,Rokid宣布开通全渠道销售,Pebble登陆全国500多家经销商门店。

在Rokid的品牌文案中,“自然”是多次出现的一个词。产品负责人向文杰对此表示,语言、视觉和触摸是人类最自然的交流方式,“未来的产品方向就是向用户提供最自然的交互体验,希望让用户感受到,我们的产品是有温度的家庭成员,而不是一台冷冰冰的机器。”

智能的未来

人工智能的商业春天才刚刚开始。

埃森哲的研究结果显示,到2035年,人工智能将有望令包括美国、日本在内的12个发达国家的经济增长率翻番,劳动生产率增长40%。在谢忆楠看来,目前国内人工智能市场仍处在存量消化阶段,保守估计仍有七成左右的垂直行业尚待开发,在教育、交通、社保等领域潜力巨大。朱珑则表示,过去一年间,性能成倍提升的人工智能技术不断解锁应用场景,人类的想象力已经跟不上人工智能的发展速度。

机器的迷人之处在于智能未来。业内普遍认为,无人驾驶将是未来人工智能的重要落点。在创新工场的投资策略里,未来5-10年的投资项目中有相当一部分投给了无人驾驶。“机会太大了,将是万亿级的市场,且很难被个别巨头垄断。”王咏刚表示,无人驾驶是一个完整的产业链,从感知、决策、控制等多个模块的算法,再到各类传感器,乃至汽车共享和交通改造,有着巨大的想象空间,远未到技术收敛的阶段。

另一个充满未来感的方向则是沉浮数年的消费级智能硬件。亚马逊在6月初宣布,旗下智能音箱Echo的年出货量预期突破1000万台;苹果则被传即将在年度开发者大会中一款由语音助手Siri控制的智能音箱。国内方面则早有叮咚、小智者激起的浪花,“千箱之年”的说法因此在业内盛行开来。

Rokid将自身定位为一家科技公司而非硬件厂商,著眼于更宏大的语音技能生态建设。高鹏表示,Rokid将在近期推出开放平台,有望接入外卖、快递、叫车等来自第三方开发者的扩展功能,为用户提供更为丰富的语言技能应用。

人工智能从来就不是一场轻巧肆意的游戏,参与者面临的仍将是重重阻碍。

首先是巨大的人才缺口。陈洪亮称,未来很长一段时间,人工智能的马太效应将体现在人才方面。李开复提过一组数字,全球当下的人工智能专家不超过7000人,在中国这个数字可能是700个,且大多被BAT收入囊中。这也是创新工场成立人工智能工程院的一大使命:通过人才招聘和高校共建,同时加强与政府部门、国内外高科技公司的合作,培育和孵化高水准的人工智能技术团队。

数据壁垒则是人工智能创业打破大公司垄断、完成行业深度融合的另一项难题,一大原因在于数据安全泄露和用户隐私破坏。王咏刚认为,人工智能的发展与数据安全不是相互撕裂的关系,而是博弈均衡。

而最大的困难还是来源于技术本身。深度学习理论沿革每隔10年左右就会经历巨大变化,每一次的技术递进也推动着人工智能的工业化进程,新商业模式因此而生。“前沿技术当然对一线业务开展有着指导意义。”王咏刚说。

人工智能始终是强技术驱动的领域。谢忆楠称:“从算法、软件、硬件到解决方案,每一步都要靠硬实力说话。纯商业模式的东西,天花板很明显。”计算机视觉领域的四个独角兽之一云从科技CEO周曦也公开宣称:“人工智能是有门槛的,短期之内只要自己保持足够快的进步速度,别人很难对你构成威胁。”

篇10

工信部下属中国电子技术标准化研究院的《2016年虚拟现实产业发展白皮书》中指出,中国虚拟现实产业潜力巨大,以用户体验佳为代表的创新性产品推动了供给侧改革,成为提升用户满意度的重要手段。在今时代背景下,新媒体作为一个不断变化的媒体,其应用引起了广泛的关注。文章首先剖析虚拟现实技术的原理,然后总结新媒体的特点,最后对新媒体的应用进行研究与分析,具有一定的实用价值。

【关键词】虚拟现实技术 新媒体 应用

虚拟现实技术开始于20世纪60年代,指的是通过计算机软件、硬件以及相关配套设施,生成一种三维环境,从而创造出全新的交互方式。其通过用户的视觉、触觉、嗅觉等来增强用户体验,使得用户产生身临其境的感觉。而新媒体的产生是相对于传统媒体来说的,指的是报刊、广播等传统媒体以后出现的新的数字媒体,其通过移动互联网以及其它数字渠道进行传播,在手机、电脑等终端进行展示,从而向用户提供服务的媒体形态。在虚拟现实技术发展如火如荼的今天,如何利用虚拟现实技术来促进新媒体应用的发展,成为人们关注的焦点。

1 虚拟现实技术原理

虚拟现实技术是一门生成虚拟现实场景的技术,而生成虚拟现实场景的关键是如何创造虚拟世界,即建模虚拟场景。虚拟现实场景对模型的要求很高,而如今解决建模问题的方法主要有两种:一种是基于计算机图形学的方法,一种是基于图像建模的方法。

基于图形学的方法指的是首先利用计算机建立三维模型,然后对模型进行贴膜等纹理的操作,最后对场景中的光照、阴影等进行处理。该方法的优点是模型制作精良,往往会产生逼真的效果。但是,其缺点是需要大量的计算,对计算机硬件的要求较高,而且一般要求制作人员具有编程的能力。

基于图像建模的方法指的是在图像处理算法的基础上,由若干张图像来构造三维场景,往往利用计算机视觉原理进行的。其优点是对计算机硬件要求不高,场景的精良程度只与图像的分辨率有关,从而避免了大量的运算,该方法逐渐成为了研究的主流。

2 新媒体的特点

新媒体的第一个特点是整合了视频、音频和文字信息。通过技术的发展,用户不仅仅局限于文字的阅读,而且能够获得视觉、听觉、甚至嗅觉的体验。

新媒体的第二个特点是加强了交互性。如今,人与人之间的交互不再局限于口耳相传,而是手机与手机、手机与电脑、甚至电视与电脑等方式,这种交互方式不再只是一个简单的技术概念,而是一种理念的提升和发展。

可以说,新媒体的特点符合当今社会的发展趋势。由于生活与工作节奏的加快,人们对时间碎片化的管理也日趋看重,而新媒体的多方位体验正好符合了人们的这一要求。此外,新媒体利用互联网技术,可以随时随地进行互动交流,满足人们对世界信息的需求,人们对新媒体的目的性和选择的主动性也就越强。

3 新媒体的应用研究

3.1 数字教育方面

在全国高校思想政治会议上明确提出,要运用新媒体新技术使工作活起来,推动思想政治工作传统优势同信息技术高度融合,增强时代感和吸引力。其中,虚拟现实技术作为当前最新的技术,与新媒体相结合,共同为教育工作提供服务成为一种可能。

借助虚拟现实技术,数字教育可以对一些过往的历史事件或者无法实际操作进行模拟、仿真,通过对视觉、听觉等感官的刺激来达到身临其境的感觉。例如,化学课中爆炸效果,在实际的操作中,出于教师和学生安全的考虑,不可能真的产生爆炸,而仅仅是讲解爆炸的相关理论,难免会无法引起学生的学习兴趣。而通过虚拟现实技术,教师可以构造一个虚拟环境,在虚拟环境中进行爆炸演示,再利用对学生视觉、听觉甚至嗅觉的冲击,无疑会给学生留下深刻的印象。

3.2 数字电影方面

数字电影是指在电影的拍摄、后期加工以及发行放映等环节,部分或者全部以数字处理技术代替传统光学化学或者物理处理技术,用数字话介质代替胶片的电影,其优点是永远保持影片像素的准确和精美。然而,随着人们欣赏水平的提升,已经不再满足于对影片分辨率的要求,而是追求身临其境的感觉。

将虚拟现实技术融入到数字电影中去,通过头盔以及交互设备,不仅可以满足人们对观赏的需求,而且能够在最大程度上刺激人们的视觉、听觉等感官,同时周围伴有立体声环音,使观众置身其中,现场感十足。

3.3 数字游戏方面

一方面,将数字游戏与虚拟现实技术相结合是有必要的,因为二者在游戏主题和游戏风格的不同,所表现出来的互动模式和感官体验也会不同,从而提高游戏的可玩性和操作性。此外,游戏制作者通过寻找数字游戏和虚拟现实技术之间的联系,将扩展的想象力和情感融入到游戏世界中,已经成为他们最为关注的事情,与此同时,也会大大提高玩家的游戏满足感。

另一方面,部分玩家沉溺于游戏世界,逐渐脱离现实世界,伤害身体事件屡有发生。游戏制作者如果能够在开发游戏的同时,融入进虚拟现实技术,就可以充分利用虚拟与现实之间的关联性,使得玩家在游戏的过程中,不仅体验到虚拟世界的乐趣,更能够联系到现实世界,这样,也能够防止玩家脱离现实。

参考文献

[1]常雪佳.虚拟现实在数字娱乐游戏中的应用[J].信息与电脑,2015,3(06):15-17.

[2]付力娅.基于虚拟现实技术运用的数字媒体交互方式嬗变研究[J].新媒体研究,2016,2(13):28-29.

[3]廖祥忠.何为新媒体[J].现代传播,2008,25(05):121-125.