自动识别技术论文范文

时间:2023-04-08 23:59:53

导语:如何才能写好一篇自动识别技术论文,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

自动识别技术论文

篇1

关键词:超高频;射频识别;车辆管理

1 引 言

随着我国城市化建设的快速发展,人民生活水平的不断提高,车辆数量和道路交通流量急剧增加,而道路的建设远赶不上车辆的增长,伴随而来是交通拥堵、车辆违章违法等现象的日益突出,传统的车辆管理系统已经面临巨大挑战。目前发展的射频识别(RFID)技术为这个问题的有效解决提供了理想的解决方案,同时也是以后车辆管理自动化的发展方向[1-7]。

而对公交公司而言,其停车场平时需要管理大量的公交车辆,同时车辆停放比较分散,出入频繁,车辆日常管理和安全监管难度较大。因此,需要采用高智能化的管理手段来实现停车库信息化管理的建设[8-10]。

在深入分析国内外成熟的基于RFID的智能停车场管理系统关键技术基础上,以某公交公司的车辆管理为典型应用背景,本文提出的一种基于超高频射频识别(RFID)技术的车辆管理应用方案。该方案可有效降低车辆信息查询复杂程度、车辆定位等问题。该系统采用自行研发的FR520读写器等关键设备,并通过立体停车库的大量测试结果证明方案合理可行,运行稳定可靠[11-15]。

2 射频识别技术

自动设备识别系统(Automatic Equipment Identification, AEI)是国际上正在努力开发并快速推广普及的技术。它适用于安全性要求较高的部门的车辆电子自动管理系统。该项技术的基本思想是通过采用一些先进的技术手段,实现人们对各类物体和设备在不同状态(高速移动、静止、恶劣环境)下的自动识别和管理,特别是采用超高频RFID技术的自动设备识别系统正日益广被使用。

RFID也称智能标签,是继个人电脑(PC)、互联网、无线通信之后的第四次信息技术革命。一个RFID系统通常由三部分组成:读写器、标签及相关的天线。读写器天线发射无线电信号给标签,标签通过自己的天线接收此信号,利用该信号得到的能量启动标签上的集成电路芯片工作。作为条形码的无线版本,智能标签技术具有条形码所不具备的防水、防磁、耐高温、使用寿命长、读取距离大、标签上数据可以加密等一系列优点,正在许多领域得到应用。

在图1所示的简单RFID系统中,现将阅读器(Reader)、天线(Antenna)和标签(Tag)的作用分别描述如下:

阅读器:读取(有时还可以写入)标签信息的设备,可设计为手持式或固定式;

标签:由耦合元件及芯片组成,每个标签具有唯一的电子编码,附着在车辆上标识目标对象,标签编写成车辆的编码唯一识别;

天线:在标签和读取器间传递射频信号。

图1 系统工作原理示意图

3 车辆管理系统设计

针对公交公司车辆管理背景,以其所属的一个典型的立体停车场为例,车辆管理系统设计过程中需要重点考虑的问题包括:

(1) 建设目标

为立体停车场管理人员提供实时监控车辆信息的平台、实现智能化车辆规范有序定位管理;还可以在管理立体车库的车辆进出,严密监视出入车辆,有效控制定位车辆的作息位置,保证系统运行稳定可靠。

(2) 丰富的功能

具有自动识别、智能控制、车辆定位管理、报警提示、信息记录、数据通信、查询、统计、分析等功能;同时具备扩展方便,升级容易等特性。

(3) 运行稳定可靠

具有冗余容错性能;系统处理速度快,可靠性高,稳定性好,错漏率低,并具有数据备份、数据恢复能力。

(4) 车辆实时定位管理

对于立体车库内车辆进行数字化管理;通过自动识别车牌卡信息,可以对车辆进出时间进行跟踪,同时定位车辆停放及作息位置的信息。

4 车辆管理系统方案

(1) 系统分部网络结构

图2所示的智能车辆管理系统是以后台管理系统和前端控制系统通过专用网络传输设备组成的管理系统,网络通信协议采用TCP/IP协议。而前端控制系统内的通道识别系统则采用10/100M以太网组成的一个小的局域网系统,进行识别和外设控制管理。

图2 系统分布网络结构

(2) 立体车库平面结构

图3所示为该立体车库的读写系统覆盖效果图。系统软件可以控制读写器的四根天线的轮询读取车辆标签时间顺序,根据每个天线能管理定位对应停车区域的车辆,能把实时的公交停车位置区域上报到公交公司的调度室,方便管理人员对车辆管理与停放位置的查询定位。

(3) 车辆管理平台组成

后台管理平台包括:管理计算机、发卡读写器、读写器、读写器专用天线及电缆。其中上层应用软件及其数据库系统安装并存储在管理计算机上。

5 固定式阅读器选型

图4所示是一种能满足本文系统需求的四通道远距离超高频RFID固定式阅读器产品HIK-FR520,支持DRM工作模式,具有良好的防冲突和抗干扰性能,识别率高,功能强,可靠性高,可扩展性好等特点。

该产品可广泛应用于智能交通、服装盘存、智能仓储等领域,能够实现现代化的物流管理,海关智能通关、城市车辆自动识别、智能停车场、高速公路不停车收费应用等集成系统。其主要特点包括:

兼容EPC C1 Gen2/ISO 18000-6C;

PowerPC架构CPU MPC8308,128 MB RAM;

具有载波消除功能,抗干扰能力更强;

支持EPC密集型读取模式(DRM);

远距离读取,RF输出功率达到32.5 dBm;

支持4路天线接口;

支持640 Kb/s标签数据读取速率;

配置以及参数设定灵活,提供最大化标签阅读量和最佳工作性能;

智能交通及车辆管理

大规模RFID系统应用

图3 读写系统覆盖效果图图 4 超高频固定式读写器

HIK-FR520的主要性能指标如表1所列。

6 车辆管理系统的特点

公交立体停车管理智能是运用超高频自动识别技术,利用现代计算机技术和自动控制技术等多领域技术,综合实现车辆自动识别和定位管理。本文提出的超高频RFID车辆管理系统具有以下主要特点:

整个系统具有远距离快速识别、智能控制、高可靠性、高保密性、易操作、易扩展等特点;

建立安全可靠的注册车辆档案,通过高新技术加强车辆监管防盗功能;

提供一个对进出车辆自动识别、智能管理的先进、可靠、适用的数字化平台,使公交公司对所有公交车辆出行、位置进行实时动态管理的能力得到质的提高;

能有效、准确的对进出停车库的车辆(装有车辆电子号牌的车辆)的数据信息识别、采集、记录、跟踪;

实时数据可以通过网络及时传送到后台管理系统,使管理人员在办公室内就可以及时了解公交车辆的停车在立体车库位置的情况。

7 结 语

基于射频识别的智能车辆管理系统是一种高效、快捷及科学的车辆管理手段。本文提出的超高频车辆管理系统应用于停车场车辆管理中,具有效率高、准确性好、安全性高的优点。该系统易于操作维护,自动化程度高,大大减轻管理者的劳动量。该方案的主要创新点在于为立体停车场管理人员提供实时监控并识别车辆信息的平台、实现车辆的智能化规范有序定位管理,系统功能丰富,运行稳定可靠,具有广阔的市场应用前景。

参 考 文 献

[1]杨笔锋,詹艳军. 基于射频识别的智能车辆管理系统设计[J]. 计算机测量与控制,2010,18(1):97-99.

[2]黄银龙,张辉,徐旭,等. 车辆管理RFID电子标签内存规划研究[J]. 通信技术,2010,43(2):141-145.

[3]王庆安. 基于RFID和GPRS的非机动车辆管理系统研究[J]. 中国制造业信息化,2007,36(13):66-68.

[4]狄巨星,赵建光,范晶晶,等. 车辆管理RFID标签电源低功耗研究[J]. 电源技术,2013,37(7):1233-1274.

[5]尼涛,杨宏,艾春安. 基于RFID技术的车辆管理门禁系统设计[J]. 工业控制计算机,2005,18(9):1-2.

[6]马凯. 基于多节点射频卡的车辆管理系统研究[J]. 交通标准化,2013(13):34-36.

[7]孙欣. 基于超高频RFID的第三方物流车辆管理解决方案[J]. 自动化博览,2012(2):80-82.

[8]杨洋. 基于RFID技术的武警车辆管理系统研究[D]. 哈尔滨:黑龙江大学(硕士学位论文),2011.

[9]杨国荣. 基于RFID技术的智能小区车辆管理系统设计[J]. 信息技术,2012(6):182-185.

[10]程仁镇. 基于车辆管理的RFID读写器设计[D]. 武汉:武汉理工大学(硕士学位论文),2012.

[11]张圣仟,杨小天,迟耀丹. 基于RFID在车辆信息自动识别技术的研究与应用[J]. 吉林建筑工程学院学报,2012(2):76-78.

[12]李元忠,余权,姚海天,等. 构建智能交通平台——RFID技术在城市车辆管理中的应用[J]. 中国自动识别技术,2008(4):90-92.

[13]王煌城,王宇歆. RFID應用於交通管理之研究[C].海峡两岸智慧型运输系统学术研讨会, 2006.

篇2

关键词:识别;定位;分割;数学形态学

中图分类号:TP391.41 文献标识码:A 文章编号:1674-7712 (2014) 02-0000-01

一、前言

我国公路上的各类车辆数目增长很快,交通环境污染、交通事故和交通拥堵对我国经济社会的生活和发展产生越来越大的影响。智能交通系统能够很好的解决这个问题,其重要性已经得到大部分人的认可。车牌识别系统是现代智能交通系统的重要组成部分,对保证交通系统的顺利平稳运行具有积极的意义。在实际生活中,由于汽车的牌照常常作为汽车的唯一标识供交通管理部门查询和管理,为了交通系统的顺利平稳运行,通常先要识别车辆身份。

二、汽车牌照自动识别流程

(一)采集图像。在行驶的车辆进入到拍摄的范围以后,车辆检测系统就会向处理器发出信号要求启动系统,与此同时,摄像机会自动获得车辆的正面图像。实际应用过程中,为了有效提高系统在不同环境、天气和光线下的适应性,摄像机的技术参数会根据处理器的要求进行调整,例如,当光照条件不足时会自动开启照明,以保证照片的拍摄质量。(二)图像预处理技术。系统最终获取的车辆牌照信息,会经过编码器转换为数字编码格式。由于环境条件的限制,例如,光照不稳定、摄像头和汽车牌照间的距离和角度不合适、车辆通过速度过快等,都非常容易造成照片的模糊、缺损和倾斜现象。因此,需要通过必要的图像预处理,增强汽车牌照的信息特征,以便更好的进行车牌识别。(三)车牌定位过程。车牌定位就是通过图像处理技术将车牌区域快速、准确地从车辆照片中提取出来。这一过程是车牌识别过程的核心内容,车牌定位的准确程度会直接影响到以后车牌的字符分割过程和字符识别过程的准确度,所以,选择合理有效的定位处理技术是保证车牌识别效果的关键。

本文中将定位过程分为如下几个部分,如下图所示。

在实际的应用过程中,通常结合拓扑和数学形态学方法进行车牌有效区域的提取。详细处理流程和使用的技术如图2所示。该方法首先应用车牌大小和纵横比等车牌固有的信息特征,使用Top-Hat方法对获取的车辆图像进行变换、运算等处理,以有效强化车牌区域的特征;然后再应用包括连通体态分析法在内的各项技术粗率定位车牌图像,这样就能够最终获取车牌的有效候选区域。最后,通过欧拉数对车牌的各个候选区判别,这样就能够最终获取准确有效的车牌特征区域。实验表明,该技术不仅能够避免各种复杂的背景环境、不断变化的光照影响、摄取图像缺损和污染等情况对车牌定位的影响,还能够对牌照的有效区域进行快速的搜索,进而实现车牌有效区域的提取。

经过一系列运算和处理之后,剩下的部分就是和车牌形状比较类似的候选区域明亮区域,这类候选区域的个数较少。经过前面的预处理,大部分背景都被削去,图像中只剩下了少数连通性比较好的区域,车牌区域已经被准确的定位识别出来。(四)字符处理技术。车牌定位出来以后需要进行字符的识别,这之前还要对单个的字符进行校正、去噪和平滑处理,以消除提取字符中的各种干扰信号;然后,根据字符的基本特征将字符进行细化处理。另外,还存在一些因为拍摄角度与距离影响造成的字符倾斜状况。这类图像不利于字符的识别,因此,字符分割之前,需要校正牌照的倾斜度。(五)字符分割技术。车牌区域被准确的定位提取以后,还需要将单个字符从中分离出来,这样再传输到对应的车牌识别系统,进行字符识别过程。经过图像预处理后的车牌字符笔划变的更细,字符相对之前更加清晰,而且还删除了细节部分的噪声污染,这样再经过垂直投影以后,汽车的牌照图像就能够被高质量的分割。实现简单,准确率高,运行速度快。(六)字符识别。模板识别技术是车牌字符识别中一种被广泛使用的基于车牌统计特征信息的识别技术。该技术需要借助概率统计学知识,首先将对象的稳定特征信息进行识别提取,组成一组特征矢量,再将这些信息与标准字符模板库中的特征信息进行匹配,进而获得匹配相关度,相关度最大的就是被识别出来的字符。这种技术算法复杂度相对较低,识别率高,具有实现简单、资源占用少的优点。

三、汽车牌照自动识别系统的实现

(一)系统环境。车牌识别系统的硬件环境包括:车辆检测系统、摄像系统、图像采集系统等,软件主要使用VS 2008框架,包括识别系统的管理界面和识别核心算法。其中,应用图像采集系统获取图像,应用OpenCV实现车牌的识别,数据库应用SQL Server 2008。

其中,车牌识别模块是系统的关键,主要包括三个组件:1.应用硬件对来往车辆进行检测;2.传输图像;3.车牌识别。

三个主要组件通过数据库进行时时更新,从而达到汽车牌照的自动识别。

四、结束语

汽车牌照自动识别研究由于受到各个方面的条件限制,在技术上还存在很多的不足。但是,由于现代交通监控与管理的迫切要求,车牌识别技术仍具有巨大的潜力。随着研究的深入,车牌自动识别系统一定会越来越成熟。

参考文献:

[1]冈萨雷斯.数字图像处理(中文版)[M].北京:电子工业出版社,2006.

篇3

论文摘要:rfid俗称电子标签,是一种非接触式的自动识别技术。目前正在我国高校图书馆推广应用。该技术与图书馆目前普遍应用的条形码系统相比,具有显著的功能优势。文章对rfid技术及在图书馆的应用进行了介绍,并对在应用过程中存在的问题进行了分析。

射频识别(radio frequency identification,简称rfid),俗称电子标签,是一种非接触式的自动识别技术。它通过射频信号自动识别目标,可以快速地对物品进行追踪和数据交换,能够识别高速运动物体并可同时识别多个标签。

rfid是一种简单的无线系统,由一个阅读器(询问器)很多标签(应答器)以及传递信号的天线所组成。其工作原理也并不复杂:标签进入磁场后,接收解读器发出的射频信号,利用感应电流所获得的能量发送出存储在芯片中的信息,阅读器读取信息并解码后,送至中央系统进行有关的数据处理。

20世纪末,国外开始将rfid技术应用于图书馆。2006年,深圳图书馆成为国内首家运用rfid技术的图书馆。到目前,国内使用rfid系统的图书馆已接近百家,但约2/3为公共图书馆,高校图书馆不到1/3,北京地区只有北京理工大学、北京石油化工学院、北京农学院等少数几所高校。

1rfid技术在图书馆管理中的应用

rfid其实就是一种电子条码,与图书馆目前普遍应用的条形码系统相比,rfid系统不仅可以完全替代条形码系统,而且具有更显著的功能优势。

1.1 自助借还书

使用条形码系统,读者借还书籍时,必须由馆员手工一本一本地扫描书籍的条形码。而借助rfid自助借还书系统,rfid可以同时读取多个芯片信息,读者只需将其要借阅的所有书籍放在自助借还机上,按照提示进行操作,就可以自行完成书籍的借阅和归还,无需再由馆员逐一手工进行。馆员的手工劳动量降低,提高了工作效率。

尤其在读者归还图书时,不必受图书馆开闭馆时间的限制,可以在任意时间、任意地点(自助还书系统可以通过网络设置在宿舍、教室、食堂等任意地点)自助办理,方便、快捷。

1.2 图书清点

条形码阅读机必须在近距离才能辨别条形码,因此,清点文献时需要将每本书从书架上取下、翻开,扫入条码后再逐本放回,工作极为繁重。利用rfid便携式点检设备,一次可以读取多个rfid标签的资料,只需要用扫描棒在书架上横扫1~2遍,即可读取全部图书数据,盘点时间大大缩短,这样不但极大地减轻了工作人员的劳动强度,提高了工作效率,而且可以使馆藏清点成为一项经常性的工作,从而提高管理水平。

由于现在的阅览室多采用开架阅览方式,图书乱架现象较为严重。如果书放错了位置,则很难被查找出来。而采用rfid技术,则只需在rfid阅读器中输入该书的相关信息,沿着书架依次扫描,很快便可发现目标,使得查找工作变得非常方便。

1.3 在安全防盗管理中的应用

rfid防盗检测系统具有识别距离远、识别速度快、误报率低等特点,弥补了磁条检测设备存在盲区和不稳定的缺陷,但由于rfid标签的隐蔽性不好,一旦被连书页一起撕掉,便完全失去了安防功能。因此可以将rfid阅读器与传统的磁条检测设备整合在一起,双管齐下,能大大增强检测系统的可靠性。

2主要应用设备

rfid标签转换系统:标签转换系统的主要作用是对rfid标签进行读写、编码及分发。rfid标签中存储了识别和追踪馆藏文献所必需的信息,包括图书编号、图书名称、检索号、所属书架信息、借阅者信息、借阅日期等信息。

便携式rfid点检设备:通过扫描书架上贴有rfid标签的流通资料,实现错架检查、顺架、排架、倒架、剔除以及阅读统计、数据采集处理等功能。

多功能馆员工作站:集rfid识别系统、读者证件识别系统、条码枪、充消磁仪、显示器等设备于一体,具备馆员管理工作和读者自助操作双面、同步显示功能,同时进行多本图书的借还及充消磁操作。

自助借还书系统:可以对粘贴rfid标签的流通文献进行扫描、识别和借还处理的设备系统。用于读者自助进行文献借还的操作,可打印借阅凭条并取得收据,操作简单,可24小时运行。

安全检测系统:当读者出入图书馆经过该系统时。如果有图书被遗漏处理,系统将自动发出提醒,同时可侦测多个标签,误报率较低。

此外还有自动办证系统、封闭式自助还书系统、24小时室外还书系统,以及自动分拣系统、自动上架系统等多种设备,用户可以根据自己的需要进行选配。

3rfid技术应用中存在的问题

3.1 技术标准尚不统一

rfid技术应用于图书馆,按照应用频率分为两种技术流派,即高频(hf)和超高频(uhf)。这两种技术的工作原理并不相同,从应用效果上看,也是各有利弊。高频技术相对比较成熟,国际标准完善,设备和生产厂家较多,国内代表性的厂商有上海阿法迪和深圳海恒;超高频技术在标签隐蔽性和价格上有优势,未来很有发展前景,国内代表性的厂商是深圳远望谷。

不同的技术标准使用户在选择过程中,往往难以抉择,一旦选择了一种,就意味着放弃了另一种。因为标签和阅读器不兼容,不能共用。采用不同标准的图书馆之间,也难以进行馆际互借、数据交流等合作。

3.2 应用成本较高

随着rfid技术的推广和产品的国产化,rfid产品的价格不断下降,一枚电子标签的价格已经从五六年前的一美元降到目前的一元多人民币,但对于藏书量基本都在百万册以上的高校图书馆而言,这仍不是一个小数目,加之上述的系统设备,起步就需要二三百万元,如果没有专项经费的支持,多数高校图书馆是无法承担的。

3.3 传统观念的束缚

凡历史悠久、管理完善的图书馆都有一批经验丰富的管理人员,丰富的经验常常伴随着根深蒂固的传统观念,他们对书架的布局、图书的排列以及图书的流通程序都有自己的规范和习惯,而这些规范使rfid系统难以充分地显示出其功能优势。短时间内,这也是难以改变的现实。

任何一项新技术的推广和普及都不会是一帆风顺的,rfid也一样。但应该相信,rfid技术代表着未来的趋势,随着不断发展和完善,它终将会被高校图书馆广泛接受。在现代信息技术的推动下,图书馆传统的管理体系和服务方式正在发生巨大的变革,正在向电子化、数字化、虚拟化方向迈进。我们必须解放思想,积极接受和利用现代信息技术,不断提高业务工作质量和工作水平,更好地为读者服务。rfid技术的应用,将使高校图书馆工作的整体水平登上一个新的台阶。

参考文献

[1] 王若琳.rfid技术及其在我国图书馆领域的应用前景分析[j].情报杂志,2006,3

篇4

关键词:射频识别技术,推广应用

 

射频识别(Radio Frequency Identification, RFID)技术是一种非接触式的自动识别技术,俗称“电子标签”,通过射频信号自动识别目标对象并获取相关数据。论文参考网。RFID标签相当于条形码技术中的条形码符号,但它与条形码是2种不同的技术,有不同的适用范围。与条形码相比,它有着不可比拟的优势:防水、防磁、耐高温、体积小型化、形状多样化,使用寿命长、读取距离大、标签上数据可以加密、存储数据容量更大、存储信息更改自如,不需要光源、可以透过外部材料读取数据、能够同时处理多个标签、可以对所附着的物体进行追踪定位等。RFID已经被世界公认为本世纪十大重要技术之一,在生产、零售、物流、交通等各个行业有着广阔的应用前景。

1 应用发展目前RFID技术在美国、欧洲和日本等发达国家已经广泛应用于工业、物流和供应管理、生产制造和装配、航空行李处理、邮件/快运包裹处理、文档追踪/图书馆管理、动物身分标识、运动计时、门禁控制/电子门票、道路自动收费。在我国比较典型的应用主要有防伪、工业自动化、交通信息化管理、物流与供应链管理等方面。

据英国调查公司IDTechEx于2008年1月16日报告指出,2007年全球RFID市场增长势头强劲,市场总值约50亿美元,增长主动力是处于高峰期的我国二代身份证,卡片和基础设备总值达20亿美元,这使我国成为最大的RFID市场。但是,如果抛去二代身份证市场的份额,那么美国是全球最大的RFID市场。从全球范围来看,RFID业务很大程度上仍依赖于政府的推动。同时,医药业RFID项目的数量增长尤其快速。而金融、安全领域的RFID项目数量大约占总数量的48%,其次是客运、汽车领域,项目数量占19%。另外,IDTechEx公司还预测今年全球RFID市场将从2007年49.3亿美元上升到52.9亿美元,这个数字覆盖了RFID市场的各个方面,包括标签、阅读器、其它基础设施、软件服务等。这些价值主体主要归功于大量应用于交通和身份证的国际RFID计划。在未来十年,RFID的市场价值将迅速增长,到2018年,RFID市场价值将5倍于2008年RFID市场,而且标签生产量将达到300倍于2008年。

在过去的一年里,我国的RFID市场及技术开始步入一个稳步而快速发展的阶段。国家信息产业部曾做出预测,未来5到10年全球RFID市场规模将达到3000亿美元。由于我国是世界首屈一指的制造业枢纽,RFID产业也将有可观的增长。RFID如今在我国的很多行业都有应用,比如集装箱行业,邮政行业,离散制造业,公路铁路车辆管理,烟草行业等,这些应用相对来说还不成熟,但可以看出巨大的发展潜力。比如对于集装箱制造行业来说,中国占世界集装箱制造量的90%,所以在这一领域应用RFID将是有很大潜力的。从频段来看,大部分应用仍然是集中在低频市场,主要特征是短距离接触,比如身份证、交通卡等。中高频应用相当少,整体规模不大[1]。论文参考网。

虽然RFID的应用有着良好的发展状态和趋势,但仍然存在一系列急需去面对和解决的问题,如标准、成本、产业链建设等主要问题制约着我国RFID技术的推广应用。

2 RFID技术现状分析射频识别系统一般由电子标签和读写器两个主要部分组成。电子标签由天线和RFID芯片组成,每个芯片都含有唯一的识别码(UID)。此外,一个完整的RFID应用系统还包括:

(1)中间件,又称RFID管理软件,它屏蔽了RFID设备的多样性和复杂性,能够为后台业务系统提供强大的支撑,从而驱动更广泛,更丰富的RFID应用。

(2)应用系统软件,记录数据,实现企业管理功能等。

在RFID系统在实际应用中,电子标签附着在待识别物体的表面,电子标签中保存有约定格式的电子数据。读写器可无接触地读取并识别电子标签中所保存的电子数据,从而达到自动识别物体的目的。读写器通过天线发送出一定频率的射频信号,当标签进入磁场时产生感应电流从而获得能量,发送出自身编码等信息,被读写器读取并解码后送至电脑主机进行有关处理[2]。

RFID技术涉及信息、制造、材料等诸多高技术领域,涵盖无线通信、芯片设计与制造、天线设计与制造、标签封装、系统集成、信息安全等技术。一些国家和国际跨国公司都在加速推动RFID技术的研发和应用进程中。在过去十年间,共产生数千项关于RFID技术的专利,主要集中在美国、欧洲、日本等国家和地区。按照工作频率的不同,RFID标签分为低频(LF)、高频(HF)、超高频(UHF)和微波频段(MW)。经过多年的发展,13.56MHz以下的RFID技术已相对成熟,目前业界最关注的是位于中高频段的RFID技术。

近几年来,RFID芯片的制造,标准的制定以及测试技术在我国都取得了一定的成果。电子标签与芯片研发机构目前已经开发出国产UHF,HF电子标签,特别是HF已经比较成熟地实现了规模化的量产,获得广泛应用。读写器及终端方面已经实现了一定程度上的规模化生产,但在总体性能指标上与国外同类产品有一定的差距。在软件及系统集成方面,目前国内有200多家企业,研究机构,大学等从事中间件、RFID数据管理,RFID公共信息服务网络及其应用软件的开发。此外,国内有多家机构在开展具有独立自主知识产权的电子标签封装装备与技术的研发。

虽然,RFID技术在我国起步较晚,但经过几十年的努力,我国在RFID技术上已有一定的技术基础和市场基础,如果措施得当,是完全有机会赶上甚至领先国外竞争对手的。

3推广RFID技术应用建议作为一项技术的推广与普及,既与当时的社会需求与应用环境有关,又取决于它对采纳者所能带来的经济效益。在我国有较成熟RFID应用技术基础、有巨大的市场需求以及广阔的经济发展前景。但是,目前,我国RFID系统推广应用仍有赖于政府的推动。政府应在以下几个方面加大力度,为RFID的应用匹配相关基础设施。

(1)择准时机出台RFID体系标准

RFID标准主要涉及到空中接口协议标准、数据格式标准、公共服务标准、中间件标准、信息安全标准、相关产品标准、测试标准。目前,国际上主要有三大RFID标准体系,即ISO RFID标准体系、EPCglobal RFID标准体系、日本UID RFID标准体系。然而,国内RFID产业的迅速发展没有可以依赖的国家标准,RFID标准又与国家信息安全息息相关。

所以,我国必须根据国家实际情况,坚持及尽快制定一个自主知识产权的RFID国家标准,掌握国家在电子标签领域发展的主动权,并且与国际标准相互兼容,使我国的RFID产品能顺利地在世界范围中流通。对于自主知识产权标准的推出,除了政府的积极推动,同时鼓励我国大专院校、科研院所及企业积极参与国内、国际RFID技术标准和行业应用标准的制定,尽快形成能够支撑产业发展及应用的RFID标准体系,以标准化推动RFID技术更新及应用。RFID标准体系基本结构如图1所示[3]。

而且,我国RFID技术标准出台的时机也非常关键。标准过早出台,可能在后继的推行过程中,标准会与切实可行的技术方案存在冲突。如果推出过晚,在国内出现多个遵循其他技术标准的规模应用后,会对标准的推行形成很大阻力。

(2)降低技术研发和应用成本

RFID系统的制造成本可望随着信息技术的发展和应用领域的扩大而大幅降低。成本问题针对不同行业而言的,一般认为价格在5美元以上芯片,主要为应用于军事,生物科技和医疗方面的有源器件;10美分到1美元左右的常为用于运输、仓储、包装、文件等无源器件;消费应用如零售的标签在5~10美分;医药、各种票证、货币等应用的标签则在5美分以下。目前很多准备实施RFID系统的单位普遍认为居高不下的成本是阻碍他们导入RFID的关键因素之一。标签成本将直接影响RFID的市场规模,要实现大规模应用,就必须降低成本。

RFID在单件低价物品上的使用就会导致成本陡涨,甚至可能超过物品本向的价值。所以,在研究使用RFID电子标签系统时,要充分研究系统优势以抵消所提高的成本,对标签生产的设备及材料进行研究,以降低生产成本。其实,成本问题关键还要看投入产出比,在控制标签价格远低于商品价值的基础上,如能大规模应用,同时RFID系统的应用将会给企业的业务流程大大改善,减少人力成本,提高工作效率,这就使RFID应用的相对成本降低了[4]。

另外,逐步开发和推进RFID的应用,在技术比较成熟、价格不敏感的行业中先进行RFID的应用,以点带面的推动RFID的发展。在RFID产品的价格下降和应用成熟后,再在生产、物流、零售等广大领域推广。论文参考网。在这个方面,政府和行业组织可以共同努力建立公共的RFID实验室和若干典型的应用示范案例等公共的平台,让各企业能够共享资源,从而有效的降低技术研发和应用的成本。

(3)制定发展策略,建设完整的产业链

RFID产业链包括芯片的设计与制造、标签封装、天线的设计与制造、读写设备开发与生产、中间件、应用软件和系统集成集成等环节。在RFID系统中,会涉及到众多的行业和部门,图2为比较典型的行业结构[3]。

从整个产业的情况来看,我国在芯片、中间件和后台软件等方面与国外领先的技术还有很大的差距。要想在关键技术和领域突破,应该由国家和政府牵头,投入巨资兴建巨大的项目工程;而地方政府应选择在封装、读写器、系统集成等方面找准切入点,集中突破。

我国应该制定RFID的发展策略,可以通过制定符合我国实际的RFID产业规划及相关政策,将RFID产业纳入国家重点发展领域;营造良好的技术和产业发展环境,鼓励企业在RFID领域投资、生产,推动RFID产业基地的形成,支持行业应用RFID技术。通过政策、法规、经济、行政等多种手段,对RFID制造、基地建设和应用给予扶持。同时,鼓励我国大专院校、科研院所及企业进行具有自主知识产权的技术产品和标准的开发,建立开放式的技术研发基础平台、支撑RFID技术应用的公共服务平台以及RFID技术测试环境和认证管理机制及质量保障体系。从而形成一个完整的RFID产业链,推动RFID技术的应用。

RFID技术将在不远的将来引起生产和生活方式的全新革命,在国外积极发展和应用RFID技术的情势下,如果我国不发展自己的RFID产业就会受制于人,就会在新一轮技术革命中落伍。

参考文献

[1] 文浩。2007中国RFID发展分析报千。专家论坛,2008,(2):50~54。

[2] 王伟。射频识别(RFID)技术及其应用的研究。安徽师范大学学报(自然科学版)。2008,31(2):139~141。

[3] 陈鹏。RFID产业链浅析。解决方案,2008,(2):34~35。

[4] 郝良彬,李有科。RFID在发展过程中遇到的各种问题分析。金卡工程,2008,(1):49~51。

篇5

关键词:烟叶数字图像;边缘处理;形态学变换;特征抽取;智能识别

1引言

烟叶是烟草工业的基础原料, 对烟草工业生产质量和烟草行业经营效益具有举足轻重的作用。对烟叶生产过程的各个环节包括烟叶品质的智能识别进行技术创新,提高品质和效率,是一个前沿研究方向[1][5]。

当前这一方面的研究,主要集中在数字图像处理方面,把烟叶品质的数字图像处理与神经网络技术相结合,实现烟叶品质的智能识别,是一个极有价值的工作。以下在此方面作出一个系统的、较为完备的、易于实际操作的研究。

2主要技术手段

2.1 MAⅡAB图像处理工具箱

在MATLAB平台上,借助图像处理工具箱,可以简易明快地实现对烟叶数字图像的图像处理。在烟叶生产一线,用数码照相机对各种烟叶样本进行拍照,输入计算机,用MAT_LAB将它转换为各(.bmp;.jpeg;.gif;.png;.t 图片以便进行图像处理。成本低,精确度高,宜于普及推广。获取各种类型的烟叶数字图像以后,经阈值使用权图像二值化,可以当即辨识出这一图像是否具有何种类型的病虫害或品质异变。利用烟叶数字图像的边缘检测、轮廓提取等分析命令,获得待测烟叶的图像参数和特征,再由神经网络技术,完成对烟叶品质的智能识别。

2.2神经网络技术

神经网络是一个新的智能识别工具。毕业论文 经过训练的神经网络能够存储与过程有关的信息,能直接从历史数据中学习,经过用各种烟叶样本训练和学习的神经网络,能自动地识别出待测烟叶样本的品质类型。而且,神经网络具有滤除噪声及在有噪声情况下得出正确结论的能力。这一点对于烟叶生产实际中大量存在各种噪声信息的情况而言,特别重要。它特别适合在线识别。

3应用MATLAB图像处理工具箱和神经网络技术对烟叶品质智能识别的操作过程

3.1烟叶图片样本库的建立

用数码相机或其它数字图像采集工具,采集各种类型的烟叶的标准图片,分类归档,借助MATLAB图像变换功能,将各种类型的烟叶的标准图片,转换成各种图片形式:.bmp;.jpeg;.sir;.png;.tif等,以便随时调用。这些烟叶图片,有不同品质的样本;还有各种病虫害标本和变异标本。

3.2用直方图均衡来实现图像增强

当从生产一线采集的烟叶待测样本的图像对比度较低,硕士论文 即灰度直方图分布区间较窄时,可用直方图均衡实现灰度分布区间展宽而达到图像增强的效果。

3.3烟叶图像的边缘检测和特征提取

烟叶图像的基本特征之一是图像边缘。图像边缘是图像周围像素灰度有阶跃性变化或屋顶变化的像素的集合。烟叶的边缘是由灰度的不连续性所致,因此考察图像每个像素在某个邻域内灰度的变化,利用边缘邻近一阶或二阶方向导数变化规律可以检测烟叶图像边缘。图像特征反映烟叶的几何结构,如面积、周长、分形分维数、孔洞数、欧拉数等等。图像特征的选择是图像识别的重要环节。运用二叉分类法在找出判别特征后,对不同的图像特征由分类阈值按二分的方法进行分类;运用相似距离分类方法把待判图像与一个标准图像相比,标准图像用样本图像特征向量的均值来表示。通过计算待判图像与标准图像之问的在相空间中的距离来判别图像和进行分类。这一过程还为用神经网络技术实现对烟叶品质进行智能识别作出必要的准备。

3.4数字图像矩阵数据的显示及其傅立叶

变换这一变换的目的是为提取特征、进行神经网络模式识别等作出必要的准备。

转贴于 3.5直方图均匀化

这是使烟叶图像性质更为优良而采取的一个技术操作,源代码如下:

I=imread ("yangshuo.tif');imshow (I);

figure,imhist(I);

[J,T]=histeq (I,64);

%图像灰度扩展到0-255,但是只有64个灰度级

figure,imshow (J);

figure,imhist(J);

figure,Dlot((0:255)/255,T);%转移函数的变换曲线

J=histeq (I,32);

figure,imshow 0);

%图像灰度扩展到0~255,但是只有32个灰度级

figure,imhist(J);

3.6采用二维中值滤波函数对受椒盐噪声干扰的图像滤波

MATLA图像处理工具箱具有强大的功能,能够对噪声干扰的烟叶图片进行消噪处理,模拟源代码如下:

I=imread ("eight.tif');

imshow (I);

J2=imnoise (I,"salt&pepper ,0.04);

%叠加密度为0.04 的椒盐噪声

figure,imshow 02);

I_Filterl=medfdt2 (J2,[3 ,3]);

%窗口大小为3x3

figure.imshow (I Fiher1);

I_Filter 2=medfdt2 (J2,[5, 5]);

%窗口大小为5x5

figure,imshow (I_Filter2);

I_Filter3=medf'dt2 (J2,[7, 7]);

%窗口大小为7x7

figure,imshow (I_Filter3);

3.7用神经网络技术对烟叶图像进行智能识别

神经网络作为一种自适应的模式识别技术,并不需要预选给定有关模式的经验知识和判别函数,它能通过自身的学习机制自动形成所要求的决策区域。网络的我由其拓朴结构、神经元特性、学习和训练规则所决定,它可以充分利用状态信息,对不同状态一一进行训练而获得某种映射关系,并且,网络可以连续学习,即使环境变异,这咱映射关系可以自适应调整。在上面各节获取烟叶图像特征基础之上,可以用神经网络技术进行图像模式识别。例如,基于概率神经网络PNN的烟叶品质智能识别,它的主要优点是:快速训练,训练时问仅略大于读取数据时间;无论分类多么复杂,只要有足够的训练数据(而这是烟叶生产一线可以做到的),就可以保证获得贝斯叶准则下的最优解,允许增加或减少训练数据而无需重新进行长时间训练。这一神经网络对于烟叶品质的图像识别,具有重要意义。 4结论

基于计算机视觉和神经网络技术的烟叶品质识别的数字图像处理方法,医学论文 是烟叶生产环节的一种技术创新,它可以在烟叶生产一线普及推广,简便易行,能够较大地提高烟叶品质检测的效率和质量,以及自动化程度和智能化水平。

参考文献

[1]于润伟.基于图像处理的稻米垩白自动检测研究[J].中国粮油学报,2007,1:122—124.

篇6

【关键词】RFID 铁路物联网

中国物联网校企联盟将物联网定义为当下几乎所有技术与计算机、互联网技术的结合,实现物体与物体之间:环境以及状态信息实时的实时共享以及智能化的收集、传递、处理、执行。进入21世纪,随着我国高速铁路、客运专线的快速发展,对铁路综合信息水平的要求也越来越高。逐步发展的铁路通信网络也更加数据化、实时化和多媒体化。物联网在铁路运输领域的推广和应用各方面的条件已经基本成熟。具有全面感知、可靠传送、智能处理特点的物联网是利用强大的的网络技术建立起来的。在物联网中非常重要的技术之一就是射频识别即RFID(又称电子标签、无线射频识别,是一种通信技术,可通过无线电讯号识别特定目标并读写相关数据,而无需识别系统与特定目标之间建立机械或光学接触)技术:

由于RFID系统能全天候全时段作业,不易受恶劣天气和环境的影响,性能稳定并且维护简单,识度正确率高。所以,它被视为了铁路信息化发展中一快新大陆。

RFID系统由三大部分组成:底端信息采集层、网络与处理中心层、应用与管理中心层:底端信息采集层包括电子标签(RFID)、阅读器、天线等;网络与处理中心层由无线路由、适配器、终端服务器组成;应用与管理层主要由使用终端、服务网站组成。硬件系统主要完成数据的采集和传输功能、采集数据为电子标签携带的信息,该信息为实时监控信息;软件系统主要完成采集数据的接受、处理(加工、融合)和存储(管理)。通过软件系统和硬件系统的紧密配合,实现系统设计要求。RFID 技术的基本工作原理很容易理解:当进入磁场(即进入识别器的工作范围)电子标签的接收到识别器发出的数据射频信号后,它会主动发送某一频率的射频信号给识别器。如果电子标签返回的信息能被识别器能够成功读取,那么对其进行解码并送往后台计算机信息系统进行有关数据的处理;若没有能够成功读取信息,那么再次对电子标签发送数据巡检信号直到读取成功。

以往铁路运输中的信息绑定与采集技术主要依赖于条形码。但现行的条形码存在几个明显的不足之处:第一,它能够储纳的信息少,而且在使用它时有时会造成相当复杂和繁琐的数据调取问题。第二,条形码对读取代码的距离要求很。费力、费时、费钱,往往又达不到所要的结果。第三,条形码很容易损坏且条形码上储存的是静态的,灵活性差,难以根据对其信息进行修改和补充。即使可以更新,还是会对资源造成浪费。第四,条形码具有一次使用性,不可重复利用。实际应用时,对标签数量要求极大。

铁路运输信息化进程既要对列车、机车、货车等快速识别与追踪,而且又要能够实现对具体货物的快速识别与定位追踪。RFID技术能够很好的满足对每一个货物的上述要求。RFID技术的特点有:

1.可以通过射频信号自动识别目标,对光线明暗要求较低。

2.可以实现对外部材料数据的直接读取,不会对外部材料造成损坏,同时避免了开箱过程,节约了开箱时间。

3.对环境的兼容性较强,可在恶劣环境下工作。

4.可远距离读取,无需与目标接触。同时可导入数据,重复利用强。

5.具有并行处理性,能够同时对几个射频标签处理。同时,可以对RFID标签所附着的物体进行追踪定位,提供实时位置。

在铁路发展的以下几个方面,携带信息量大,具有动态信息采集能力的RFID可以或已经发挥出了独特的作用:

①客票防伪与识别。铁路客票使用采用了RFID技术的客票,由于对应的电子芯片的内部数据是加过密的,与特定读写器信息对应,可确保实时准确的验证车票真伪。同时检票员还可以使用便携式的识读器对车票上的RFID电子标签进行读取,与已有相关信息进行比对,可以辨别车票,大大加快了旅客进出站的速度,提高了车站效率。

②集装箱追踪管理与监控。随着我国经济的飞速发展,集装箱货物运输量与日俱增,而我国集装箱运输中存在组织流程不合理、技术监控不完备、信息化程度低等问题,加之集装箱内货物状态无法有效监控,导致了集装箱运输超偏载等事故频发。众所周知,运输集装箱化是铁路货物运输发展主流,如果将无线射频技术应用到铁路集装箱,提高集装箱智能性,既能够实时掌握到集装箱在运输途中的状态,减少货物损耗,也能提升铁路集装箱使用效率。

③增强信息共享性。现有铁路在信息共享方面依然有很大的提升空间。目前,铁路现有机制仍然存在较大列车资源浪费的风险。无线射频技术的信息共享能力,及能够时将车站的车票发售情况与火车乘务员在车上的补票情况进行信息对接,清楚的知道有车站的车票发售实时动态信息,从而方便车上的旅客补票,提高现有铁路基础设施利用效率。

④提升仓库管理质量。在铁路的货运仓库管理方面,利用RFID电子标签穿透能力强的特点,利用嵌在商品内发出的无线电波的标签所记录的商品序号、日期等信息,让工作人员清楚方便知道里面有物品强狂。同时也可以提高货物在仓库的安全性。

⑤作用于铁路货车施封锁。现有铁路货车用施封锁一般为钢质施封锁,此类施封锁然结构简单、成本低,但仍存在施手工作业差错率高,检查效率低下,难以对重点货物、重点车辆的施封状态进行跟踪,无法实时掌握货物状态,无法为客户提供及时的物流信息等不足。将RFID技术运用于施封锁中,施封、补封、解封、信息读取等均为计算机控制,差错率小。并能够实时检测棚车及集装箱的施封是状况,实现了施封锁检查的自动化、现代化,增强了货运检查作业的针对性。

参考文献

[1]李恒.《基于RFID技术的铁路物联网电子识别》.大连交通大学硕士毕业论文

篇7

关键词:机器视觉、校车、异常监测、行为识别

中图分类号:Tp391 文献标识码:A 文章编号:1672-3791(2016)06(b)-0000-00

一、校车异常监测系统的设计背景

近年来,全国各地校车事故常有报道,接二连三的车毁人亡校车交通惨剧引起了全社会对校车安全的高度关注。通过对校车事故的分析,超载是其主要原因;同时我们也发现,由于校车乘客的特殊性,学生在校车上任意走动、打闹等行为导致乘车的不安全情况,也是造成校车事故的重大诱因。

针对这些现象,有关部门也纷纷提出了解决方案。如果每辆校车都配备随车老师,其人力成本是很高的;依靠驾驶员对车内行为进行规范,又会导致驾驶员的注意力分散从而导致行车的危险性;不少校车上也开始安装了监控摄像头,但如果监控系统只能作为事后责任分析与追查用,还是无法落实到实时报警的作用。因此,让视频监控系统能自动识别异常情况并进行报警是非常关键的。

本论文针对这一问题,提出了基于机器视觉的校车异常监测系统的设计思路和实现方法,当出现车内异常情况时能自动报警,为校车行驶安全增加了一重保障。如校车行驶中持续发现过道上有人在走动,那么这辆校车就有可能是超载的;另外,如果在视频中观察到多人在车内站立且长时间聚集在一起时,很有可能发生了打闹行为,也应该及时报警。

二、校车异常监测算法设计

要实现校车异常行为监测,实际上已经转化为人体异常行为监测目标,故需要采用机器视觉技术来进行特征提取和行为识别。总体来说,异常行为检测系统要解决的问题主要包括:①如何进行前景提取,即提取出场景中的运动目标;②如何区分各种人体行为;③如何判断异常行为;④当处于拥挤环境或运动目标受到遮挡时,如何保证检测的可靠性。目前,针对每一个问题,都有相应的一系列理论和实验基础。

根据以上待解决的问题,不难得出人体异常行为检测系统的一般步骤。视频序列的某一帧输入后,首先要对它进行前景提取,即找到运动目标;接着,要对运动目标进行特征提取,即用一些量化的、可以被比较的特征参数来表征该运动目标当前的运动状态;然后,根据提取到的特征参数对运动目标进行行为识别;最后,就能够根据识别出的行为来判断是否异常,如此循环就能依次检测出整个视频序列的异常情况。

1、前景提取方法的选择

目前,对于视频中的运动目标提取,应用较多的主要有三种方法:光流法、帧差法和背景减除法。本文采用背景减除法作为前景提取的方法,其基本思想是首先建立背景图像的参数模型,接着将当前帧图像与背景图像进行差分比较,其中将区别较大的像素区域视为运动物体,将区别较小的像素区域视为背景区域。

2、背景建模方法的选择

背景建模主要有三个要素:第一,如何初始化背景模型;第二,如何判断前景点;第三,如何更新背景模型。根据解决这些问题使用策略的不同,背景建模可分为多种方法,如平均背景模型、单高斯模型、混合高斯模型和VIBE等。通过对比实验,本文采用的VIBE背景建模法得到的前景图像与之前的平均背景法和混合高斯建模得到的前景图像相比,轮廓更加清晰、线条更细腻,对前景目标的区域检测也更为准确。

3、人体特征的提取

可用于检测的人体特征包括外观形状特征和运动特征。外观形状特征指人体轮廓、姿态以及区域颜色等信息。运动特征指光流信息、运动方向、轨迹、速度等。形状特征比较稳定,但运动特征在能见度较低时依然可以分辨,因此,将这两种方法结合是一种不错的选择。本文采用了特征+分类的方法来进行人体异常行为检测,因此选择使用最广泛、且效果较好、速度较快的HOG特征作为前景目标的特征。

4、行为识别方法选取

本文将采用支持向量机分类器来对人体行为进行分类。支持向量机的思想主要可以概括为两点:①对于线性可分情况,它基于结构风险最小化理论在特征空间中建立最优分割超平面。②对于线性不可分的情况,它使用非线性映射算法将低维输入空间中线性不可分的样本映射到高维特征空间令其线性可分。

二、校车异常监测系统设计

本系统主要针对校车内人体的异常行为检测,主要完成的功能是①完成基于视频的监控和采集;②完成基于人体行为状态的标准库设计;③对校车行驶过程中的异常事件进行分类,并抽象出若干类异常行为状态,如异常走动、乘客聚集、异常站立等;④基于人体行为状态标准库的匹配,自动分析出校车内的异常状态;⑤完成异常事件的归类与整理,并能够自动报警。

系统的总体设计,程序读入视频序列以后,首先对其背景进行建模,通过背景减除法得到前景图像;接着提取出前景图像的Hog特征,采用事先训练好的HMM分类器来进行识别是否发生异常行为,若是则自动报警,否则继续读入下一段视频。

1、HOG特征提取

HOG特征,即方向梯度直方图的提取是从局部到整体的一个过程,其计算流程如下:

① 归一化图像:本文采用平方根计算对RGB色彩空间的输入图像进行伽马矫正,实现彩色图像到灰度图的转换,同时减少色彩信息对后续操作的影响,提高了检测的准确率。

② 梯度计算:梯度的实质是图像的一阶微分,在实际应用中,一般通过图像与梯度算子的卷积来实现梯度计算。目前,常用的梯度算子有Perwitt算子、Roberts算子、Sobel算子等。梯度算子将对结果产生很大影响,综合考虑计算的复杂度与算子的有效性,本文选用Sobel算子与图像卷积来实现梯度计算。

③ HOG特征维数计算:在HOG的构造函数中,计算得到的HOG特征维数是7200维。

2、SVM分类器

在本文中,要实现三种异常行为的检测,而SVM是一个二元分类器,这里可以采用一个简单的方法来解决,即“一类对其余”的方法,每次仍然解决一个二类分类问题。例如:有三个类别,第一次把类别1定为正样本,其余两类定为负样本;第二次将类别2定为正样本,其余为负样本;第三次把类别3定为正样本。也就是说,分为几类就有几个二元的SVM分类器。

实际应用时,可以预先训练好分类器,直接调用,而不需要重新训练。因此,本文只需要采用异常站立、异常走动和异常聚集三个训练好的SVM分类器即可实现分类。

四、结语

本论文对基于机器视觉的人体异常行为检测算法进行了研究,基于VIBE背景建模的前景提取、HOG特征+SVM训练的方法,成功实现了校车内人体异常站立、异常走动和异常聚集的检测。但真实校车内可能发生更多更复杂的异常行为,因此在异常行为的类别上要进一步细化。

参考文献

[1]杜鉴豪,监控视频中的人体异常行为检测研究[D],杭州,浙江大学,2010,12-40

[2]刘高文,基于隐马尔可夫模型的视觉行为分析和异常检测研究[D],南京,南京理工大学,2008, 31-56

[3]程远航,基于光流和Gabor小波的人脸特征点跟踪[J],计算机仿真,2011, 28(5): 287-290

篇8

论文摘要:在市场经济进入快速发展的转型期,信用缺失正成为侵蚀社会肌体的毒瘤,缺乏诚信不仅会使社会公德丧失,而且会大大提高市场交易的成本和风险,影响市场机制的有效运转和经济社会的健康发展。因此,构建和完善信用体系打造信用社会,不仅仅是一个道德命题,也是一个经济命题,关系到我国经济的长远可持续发展大局。本文提出对电子商务物流领域的“一一三三”信用体系建设的框架布局与目标,仅供同行参考。 

0前言 

信用信息采集作为信用体系中的一个首要和关键的环节。物流信用信息采集是否客观、真实、全面对所收集到的信息能否进行合理加工与处理,使之能够更好地体现物流企业的真实信用水平。信息采集、记录和使用的过程能否实现标准化,能否合法保护数据主体的权利这方面的研究却很少见到。本文从电子商务物流领域的信用现状出发,设计出“一一三三”信用体系建设的框架布局:即一个方针、一个平台、三个最关键环节(货物标识、智能押运和电子签收),三项任务(信息采集、共享、使用)。从而建立物流信用信息平台的数据库中心,对社会化大物流信用数据实时采集、信用数据整合与装载,描述了信用信息从数据采集、建模、校验、比对、容错、整合、入库的策略。 

1实行“一一三三”信用体系的框架布局 

1.1 一个方针:培育信用产品市场需求 

信用缺失同时也制约了物流企业的发展。从一些主要发展中国家建立信用制度的实践看,信用行业的发展是市场经济发展到一定阶段和金融体制改革的必然要求。我国已具备了大规模发展信用消费的客观条件,这就要求信用中介服务行业有较快发展,为社会提供全面、真实、准确的消费者和企业的信用报告。从而增强信用市场的信息对称程度,保证物流信用市场的平稳、持续、健康发展下去。这样,除了政府主管部门制定相应的法律法规之外,物流行业必须自己构建第一手的信用信息通道,培养一个通用的物流信用信息平台。 

1.2 一个平台:物流信用信息平台 

要建设这样一个网络服务开放的物流业信用平台,首要解决平台中的软、硬基础建设问题。物流信用平台的硬基础主要是指智能物流中信息精确采集装置和身份标识装置。在货物标识阶段的主要工作就是统一布置货物身份标识装置;推动电子封、智能锁和周转箱等在物流中的应用;实现运输工具和物流对象货物的身份识别和认证,确保物流信用平台的信息交互与控制识别。物流信用平台的软基础主要是指物流智能软件系统,其充当着物流系统环境的“心脏”和“神经”,是确保物流信用平台多应用领域安全可靠运行的中枢。 

1.3 三个最关键环节 

现代物流已不再局限于简单的运输,更是一种先进的组织方式和管理技术。利用先进的物流装备和技术就可实现从物流源头起完成自动采集,以实现物流过程的全透明化和可追溯化。物流信用平台最重要的工作是做好货物标识、智能押运和电子签收三项工作。物流信用信息就贯穿在这三个最关键的环节中。 

1.3.1货物标识 

货物标识就是对在供应链中运转的物品进行标识。在货物的托运、运输开始,在货物包装层次应当实现自动识别,以支持货物的装车清点、中转分装、发运地自动识别和货物在本次物流全寿命责任管理。在这些环节中,随时随地都要用到货物的标识,其是多种行业共享的通用数据。分拣、配送、签收过程我们所要做的只是将电子标签贴在发送的物品上,并在每个货物交接点装一台rfid阅读器。rfid作为自动识别技术,不需人工操作即可完成管理作业,速度上即时反映,可大幅缩短作业时间,应用范围非常广。 

1.3.2智能押运 

电子商务的物流配送的成功与否,直接关系到电子商务的成败,是电子商务的一个重要衡量指标。智能押运是指物流配送企业采用网络化的计算机技术和现代化的硬件设备、软件系统及先进的管理手段,针对客户的需求进行一系列分类、编码、整理、配货等理货工作,按照约定的时间和地点将确定数量和规格要求的商品传递到用户的活动及过程。这种新型的物流配送模式带来了流通领域的巨大变革,越来越多的企业开始采用电子商务物流配送模式。相对于传统的物流配送模式而言,电子商务物流配送模式具有高效配送、适时控制以及过程简化的优势。 

1.3.3电子签收 

电子签收是物流业根据自身的特点和发展的需求,把一系列物联网技术通过系统一体化的开发集成和应用,以提高企业资源利用率和生产力水平,防范业务流动带来的不稳定性,加强企业对业务过程的管控水平的一种体现。传统的纸质交接方式不仅花费了大量纸张、人力,同时也不能满足日益发展的物流管理的需要。通过rfid识别收/发货方和运输车辆身份及货物与目的地是否一致,扫描商品车条形码信息确认商品车身份及质损状态等信息,连同每次交接货时都形成一个唯一的数字签名,经过gprs的通讯网络,传输到物流信用平台,及时更新订单交接的完成状态。同时,平台在第一时间以短信或电话来通知相关利益者。平台将自动进行解析、核查和回复以完成签收信息管理。 

1.4 三项任务 

电子商务物流的信用体系建设中三项任务,就是加强物流行业信用信息的采集、记录和使用。行业的信用信息是行业内交易主体日常行为的真实记录,即便物流企业上报的公共信用信息和银行信用信息有虚假成分,通过了解行业信用信息可以显出其原形,因而物流行业的信用信息是所有信用信息中重要的信息。在这里我们主张快速、真实、完整、连续、合法、开放的取得物流企业信用信息。 

1.4.1信用信息的采集 

①信用信息采集的内容 

物流企业的信用信息,包括以下几个方面: 

㈠信用能力的信息 

主要物流企业的资产规模以及扩张的速度、资产负债率和偿债能力、盈利水平和盈利产品等。 

㈡信用行为的信息 

物流企业履行各种合同的情况,执行国家的有关政策法规的情况。违规违法收到惩处的记录等。 

㈢其他公开信息 

如物流企业的注册登记信息、公司名称代码、反映企业所在行业的发展前景的信息,企业的投资战略与决策、企业的核心技术和管理、企业主要管理者的背景与履历。 

②信用信息采集的流程 

㈠发运信息采集:发运前,物流商用手持机清点发运货物并将发运货物的信息通过无线网络上传到物流信用平台; 

㈡中转分拨信息采集:中转时,可根据货物标识识别并分类中转,通过手持机采集并上传中转货物信息,可以让平台随时记录货物的运输、中转信息,防止运输过程中的信息丢失; 

㈢接受信息反馈:货物到达结束地后,签收人通过手持机扫描货物标识,并与平台记录的标识信息比对后,快速确认并上传货物签收的信息; 

㈣全寿命跟踪:从货物发运的源头起,利用货物标识的唯一性使货主、物流商、物流中介、物流中心、物流行业协会、行业主管部门都可以通过网络了解相关物流的运输、中转和签收的全寿命管理情况,将大大提高物流全过程的信用信息采集能力。 

1.4.2信用信息记录 

任务要求涵盖物流供应链上所有的受众:即货主、物流商、物流中介、物流中心、信用机构、物流行业协会、行业主管部门等。做到信用信息记录的真实、及时、全面,需要百分之百的可靠性,百分之百的互联通性。实时响应,永久、完全存储任何相关的信息等,实现物流主体行为信息比对、抽取、审核处理。分阶段逐步提高应用数量等级,从单个孤立应用逐渐过渡到大规模的海量应用。 

1.4.3信用信息使用 

有效的使用信用信息可以使所有市场主体的信用信息能够及时连接并且覆盖全社会,使那些只从事一次性博弈的市场交易主体就不再有生存的空间。“打一枪换一个地方”的策略也将失灵,每一个交易主体都被迫进行重复博弈。而在重复博弈中,诚信显然是最优策略。 

对信用信息的使用者而言,即时信息的重要性要远远高于历史的信息;对于需要即时信用信息的主体而言,过时的信息实际上就是信息垃圾。那么,要如何确保信用信息的客观公证、完整、独完、真实、可靠。这就是引入第三方评估机构的原因,要求其对信用信息的传播和报道不受任何外来力量的支配和左右,同时保证其生存和发展与所传播信息的内容无关。 

2 电子商务物流的信用体系建设的任务 

2.1构建信息共享机制 

从对原始信用信息的收集,到进行筛选、甄别、匹配、核验、加工整理、保存形成“信用数据”,再到后续对数据的不断更新和维护,这一过程是一个紧密相连、不可分割的整体。如果只研究“原始数据”的收集,不仅会使研究思路缺乏连贯性,也会限制整个研究的实际意义。体系建设的任务之一就是设计出信用信息的共享机制,使信用评估机构、企业、政府以某种准入方式快速进入,使其方便获取并完成信用信息自定义查询、统计分析、管理决策服务以及公共服务的功能。 

2.2解决信息不对称问题 

由于交易者根据自身需要搜集信息、分析信息的成本较高,效率却比较低。于是在社会分工的进程中逐步出现了专门从事信用信息征集和处理的第三方征信。第三方征信更加专业、更加具有规模效应,为从事信用交易的各方带来了多方面的好处,也对信用行为的规范起到了重要的促进作用。 

2.3形成交易反馈机制 

市场中的交易主体往往需要先了解对方的信用能力和以往交易中的信用记录。因此,使用者所得到的关于双方的信用信息则决定是否与对方进行交易。如果交易得以实现,那么本次交易中双方守信或失信的记录就成为新的信息汇入信用信息源中。如果不进行交易,那么它对于对方信用信息的请求将有可能成为对方信用信息集合中的一部分内容而保存在有关的数据库中。信息使用者这种对信用信息的使用和反馈是信用信息传播中的重要环节,它关系到交易主体对未来的预期。正是因为有这样的反馈机制,才使得交易者收到足够的警戒,同时一旦失信,就会被记录,并影响到下次交易机会。由此我们看到,信用信息使用者在作为信宿的同时,也是信息的反馈者甚至是产生者。 

2.4展开数据挖掘 

开展信用信息的数据挖掘工作,就是力图找到有效方法自动地分析信用信息数据、自动地对数据分类、自动地对数据汇总、自动地发现和描述数据中的趋势、自动地标记异常。 

数据挖掘是对数据库中的大量业务数据进行抽取、转换、分析和其他模型化的处理,从中提取辅助决策的关键性数据的分析方法。数据挖掘的目标是通过对现有数据的深入分析、归纳总结出事情间的内部规律和关系,以指导对事物的认知和管理。 

3 结束语 

完善的物流信用体系为物流行业高速、稳定、持续发展提供保障,是社会经济体系的重要组成部分。电子商务物流领域的信用体系建设还处于刚刚起步阶段,还处于一种探索阶段。 

建立在电子封、智能锁和周转箱等物流装备基础上,具有与具体设备无关的公共标准的,能支持异构数据源,跨地理区域,网络化的自动数据收集,汇总处理的信用信息平台,实现“低端”和“高端”的连接,全程监测物流供应链上所有的交易和交接细节,为电子商务物流领域的信用信息采集、传递和共享创造条件。为全社会信用体系建设做好基础储备。 

参考文献 

篇9

关键词:盲道;以人为本;RFID

ABSTRACT:This paper discusses the current use situation of the blind road, and gives a series improvement way combined with the use of new materials.

KEY WORDS:blind road; new material, human-oriented,RFID

“以人为本”让肢体残疾者和视觉残疾者参与分享社会生活体现了社会对残疾者的关爱,也是社会文明的一种体现,近年来城市建设的快速发展使道路断面型式日益丰富,但设计的不规范,材料的浪费,盲道的占用,在很大程度上影响了盲道使用。因此了解盲道的使用现状,因地制宜合理的安排盲道的使用和设计,引进一系列的新型的材料和盲道系统,更好的为视觉残障者服务。

1.视觉残障者现状

我国是世界3大盲人高发区之一,约有盲人500~900万,年均失明人数约45万人[1],即几乎每分钟便会出现一例新盲人,而低视力总人数约为盲人的3倍。

视力残疾人因各种原因导致双眼视力障碍或视野缩小,而视觉残障并不是单一指没有视觉能力,看不清,没有色彩辨别感也归类为视觉残障。盲人很难像健全人那样自由行走和参加社会活动。采取各种措施对视力残疾人进行治疗、训练和辅助,尽量补偿、 提高其丧失或削弱的功能。定向行走作为视力残疾康复的重要手段,是视力残疾个体最基本的需要之一,而如何在定向行走训练的基础上使用一种方式而解决视觉残障的多样性,进而为盲人的出行提供方便。

2.盲道不合理性现状

2.1盲道规划布局不合理

盲道的普及应和城市的发展状况同步,在一些城市发展落后地区或者是中等发展城市,城市的规划和领导者一味追求形式上的先进性和文明程度联系在一起,并没有进行实际调研和考察。盲道是帮助盲人行走的但是在一些人烟稀少的地区,或者人车混道的狭小街道设置一系列的行进盲道,就非常不合理,因为盲人一般不会到人流量很多的地方活动。在这么一个以低碳生活为主导的城市生活中,作为一个科学的城市道路规划者,在进行道路规划的时候应根据地区发展程度和盲人活动的主要区域有节奏有目的有计划的合理规划,这样在以后的城市规划发展进程中才能合理的进行更新换代以实现城市资源的合理配置。

2.2盲道设计不合理性

盲道要高出地面5MM,虽然不是很高但是也对于普通民众的出行带来很多的不便,例如穿高跟鞋的女士,跑闹的小孩,行动不便的老人,对于婴儿车和轮椅的行驶也带了来了非常不舒适的感觉。

盲道的材质有以下几种:预制混凝土盲道砖:花岗岩、大理石盲道板:陶瓷类盲道板:橡胶塑料类盲道板:金属类(主要是不锈钢)盲道型材;高分子材料类(聚氯乙烯等)盲道型材。但在实际中盲道材料的价格决定了材料的使用,因此大部分的盲道采用的和普通道路是一样的材料,只是在表面进行了盲道形式的切割。纹理上盲道和普通路面无法区别,并没有给盲人带来实质性的帮助。色彩上,质感上盲道的设计并没有根据盲人的不同需要进行区分,很难给盲人带来方便。现行使用较多的花岗岩、大理石盲道板的质感在恶劣天气时同样也会滑倒;色彩上中黄色的盲道在日晒雨淋后出现较大磨损和掉色。

2.3盲道被违规占用

公众无障碍意识淡薄:社会公众无障碍意识淡薄,整个城市并没有形成保护盲道,方便残疾人的氛围。一些经营单位、个人随意损坏、占用无障碍设施。街道上行走的路人和小商小贩们无故占用盲道。同时缺乏对公众的教导,一些学生放学之后有意走在盲道上并以此为乐,但他们并不知道这样可能带来的后果。

维护和管理工作薄弱使盲道的使用效率低下:目前,武汉市几乎所有的人行道上都铺设了盲道,但是其维护和管理工作还是存在一些问题,许多盲道被一些小商小贩的经营摊点、电话亭等占用,盲道无法发挥其正常作用,致使盲道成了一种形同虚设的设施.而且部分盲道在出现损坏后不能够及时维修,降低了盲道的使用效率,同时给残疾人的出行带来极大的不便。雨雪天气过后的盲道清扫不及时常常不易于盲人行走。

3.盲道改进的建议

3.1加强宣传和教育

盲道的建设和使用虽然已经有一段时间但是如何使用和保护盲道,在人们的认识中还是非常的不足希望通过媒体报道和学校教育让民众认识了解盲道并知道这对于残障人士的重要行,让大家学会保护盲道关心残障人士,这才能从根本提高城市文明程度。另一方面制定一系列的法规制度,整治设计和建设以及使用的不规范合理行为,对于乱占,破坏盲道给予一定的警告和处分,对于盲道进行定时定岗检查和修理,充分提高盲道是使用频率和效率。

3.2全方位立体环境的设计

自然环境对方向辨认的影响也很大,如天气、路面状况等对盲人走向的影响也不容忽视。晴天时,各种声音听得较清楚,而阴天时,特别是刮风下雨时。各种声音变得暗哑了,较难辨认。关于路面,一般来讲干燥的路面较易辨认环境;泥泞的地面不易辨认;覆盖地面的雪如已冰硬,较易辨认环境,地面刚被软雪盖住,最难辨认。

视觉:在《城市道路和建筑物无障碍设计规范》中规定盲道采用中黄色。由于路段的不同应该使用不同的颜色,这样不仅好区分,而且还能起到美观的作用,更能起到提醒动车司机的作用。准盲道为深黄色,但由于环境的光照条件变化等原因,在不同区域、不同时间盲道的颜色会有较大的变化.此外盲道虽然有固定的纹理模式,但是随着观测角度的不同,图像中的纹理模式也会有较大变化.

嗅觉:在一些特殊位置,使用一种气味散发装置,让盲人通过嗅觉判断环境的位置,并且可以使用智能手段控制气味散发的强度,时间和范围,同时舒适健康气味的散发还可以增加环境的趣味性,美化环境。例如,公园出入口,图书馆出入口,街道十字路口,商业广场等等,装置的设置都能有效的帮助盲人进行空间位置识别,同时也能给普通人带来另一番感受。

触觉:在相当一部分人心目中,细腻光滑是高档的象征。而这些词汇都大大降低了盲人定向行走的安全系数,而我们看到的页岩烧结盲道砖,其表面却都是毛面的,有孔、粗糙。据专业人士介绍,光面烧结砖的抗滑性通过测试远远强于其他路面材料[2]。平日里,走在粗糙路面上,盲人们感到的是舒适,下雪天,雪附着在砖面上,毛面有效地增加了砖面的摩擦力,增强了砖面的抗滑性,这样,盲人们走在盲道砖上,安全系数将大大增加。

听觉:语音识别信息设计是对盲人最有效的辅助手段收益人群还包括听力残疾者和老年退化性耳聋者感受外界信息的重要辅助设施或工具,不同的环境、不同的时间应设置不同音频或不同分贝的语音装置。例如,医院、公园、街道、马路等等,其语音识别装置就各不相同。

3.3RFID的盲道识别系统

目前 RFID 技术发展迅猛,为设计识别系统提供了方便。RFID 是一种非接触式的自动识别技术[3]。它通过射频信号自动识别目标对象并获取相关数据,识别工作无须人工干预,可工作于各种恶劣环境。RFID 技术可识别高速运动物体并可同时识别多个标签或者识别卡,操作快捷方便。对于盲人出行安全和便捷有提供了有力的保障。

随着无线通信和RFID自动识别技术在各个应用领域中的不断发展,设计出一种可行而便携的盲道识别设备已经成为可能。国外发达国家在上世纪末就已经意识到并开发出了部分识别设备。意大利目前已经利用RFID技术设计出一种盲道识别设备,该识别系统可以方便的给盲人提供精确的 GPS 位置。西班牙研究人员为盲人和视障者研制出一种可随身携带的指路仪器,帮助他们在繁华都市中判定方向,并且配有为通信系统配音的声音合成器和输入信息的盲文键盘[4]。在我国某些大中城市也开始在公交车站试点使用这种盲道系统,随着科技的发展RFID盲道系统一定会在城市中普及和应用。相信RFID盲道系统科技的普及在一定时间内会很快实现,那么城市设计者就需要在现行的盲道系统设计下考虑新形式的盲道识别系统递进和过渡过程,这样才不会造成设计和材料的浪费并更快程度的为盲人提供更大的便捷和帮助。

4.结论

对盲道改进的构想现在也还是一个初级研究阶段,还有很多需要继续思考研究的地方;但现有盲道的缺点却是显而易见的,其不完整的设计观念及缺少人文关怀的特性也值得考虑。另一方面也要注意设计创新和科技创新,研究开发新型的盲道系统,打造全方位的无障碍城市的。由于种种原因,盲道的改进和研发现在还没有得到重视,但应注意到,盲道的改进是势在必行的,希望能引起更多的人注意。

参考文献:

[1]国务院人口普查办公室.中国2000年人口普查资料[M].北京:中国统计出版社,2002.

[2]沈毅秀 郑州冠威建材科技有限责任公司 砖瓦世界 BRICK & TILE WORLD 2008(5) d.g.省略/Periodical_jcgyxx200805005.aspx

[3]周晓光等. 射频识别(RFID)系统设计、仿真与应用[M].人民邮电出版社, 2008

[4]王小伟. 基于RFID的盲道识别系统设计.硕士学位论文[J].成都理工大学,2009

篇10

[关键词]中文分词 分词算法 歧义消除 未登录词 分词系统

[分类号]G354

中文分词是文本分类、信息检索、信息过滤、文献自动标引、摘要自动生成等中文信息处理中的关键技术及难点。经过广大学者共同努力,过去2D多年中文分词取得可喜进步,黄昌宁、赵海…在四方面总结了取得的成绩。笔者利用CNKI全文期刊数据库,以“中文and分词”、“汉语and分词”、“自动and分词”等为检索条件,检索时段为1987年1月1日~2010年9月1l日,进行篇名检索,经筛选分别得到相关研究论文214、191、165篇,通过文献归纳总结出该领域研究现状、研究内容、研究热点与难点,并展望其发展。

1 中文分词基础理论研究

中文分词理论研究可归结为:三种主要分词算法及组合算法研究、中文分词歧义消除、未登录词识别与分词与词性标注评测研究。

1.1 分词算法研究

衡量分词算法优劣标准是分词速度与精度,各种算法围绕精度与速度展开。目前分词算法很多,大致可归纳为:词典分词方法、理解分词方法、统计分词方法、组合分词算法。

1.1.1 词典分词方法

・算法。词典分词方法按照一定策略将待分析汉字串与词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功,该方法需要确定三个要素:词典、扫描方向、匹配原则。比较成熟的几种词典分词方法有:正向最大匹配法、逆向最大匹配法、双向最大匹配法、最少切分等。实际分词系统,都是把词典分词作为一种初分手段,再通过各种其他的语言信息进一步提高切分的准确率。

词典分词方法包含两个核心内容:分词算法与词典结构,算法设计可从以下几方面展开:①字典结构改进;②改进扫描方式;③将词典中的可按由长到短递减顺序逐字搜索整个待处理材料,一直到分出全部词为止。

・词典结构。同典结构是词典分词算法关键技术,直接影响分词算法的性能。三个因素影响词典性能:①词查询速度;②词典空间利用率;③词典维护性能。Hash表是设计词典结构常用方式,先对GB2312~1980中的汉字排序(即建立Hash表),然后将其后继词(包括词的属性等信息)放在相应的词库表中。

孙茂松等设计并实验考察了三种典型的分词词典机制:整词二分、TRIE索引树及逐字二分,着重比较它们的时间、空间效率。姚兴山提出首字Hash表、词次字Hash表、词次字结构、词3字Hash表、词3字结构、词4字Hash表、词4字结构、词索引表和词典正文的词典结构,该结构提高查询速度,但增大存储开销。陈桂林等介绍了一种高效的中文电子词表数据结构,它支持首字Hash和标准的二分查找,且不限词条长度,并给出利用近邻匹配方法来查找多字词,提高了分词效率。目前文献看,围绕词典结构提高分词性能的主流思想是设计Hash表,表数目随结构不同而不同,数目越多,空间开销越大,但查询速度也相应提高,具体设计需要在时间与空间之间权衡。

1.1.2 理解分词方法 基本思想是分词同时进行句法、语义分析;利用句法信息和语义信息来处理歧义现象,理解分词方法需要使用大量语言知识和信息。

・人工智能技术。人工智能技术主要包括专家系统、神经网络和生成一测试法三种。分词专家系统能充分利用词法知识、句法知识、语义知识和语用知识进行逻辑推理,实现对歧义字段的有效切分。何克抗等深入分析了歧义切分字段产生的根源和性质,把歧义字段从性质上划分为四类,并给出消除每一类歧义切分字段的有效方法。王彩荣设计了一个分词专家系统的框架:将自动分词过程看作是基于知识的逻辑推理过程,用知识推理与语法分析替代传统的“词典匹配分词+歧义校正的过程。”神经网络摸拟人脑神经元工作机理设计,将分词知识所分散隐式的方法存入神经网内部,通过自学习和训练修改内部权值,以达到正确的分词结果。林亚平、尹锋利等用BP神经网络设计了一个分词系统,进行大量仿真实验,取得不错分词效果。

采用神经网络与专家系统的人工智能分词算法与其他方法相比具有如下特点:①知识的处理机制为动态演化过程;②字词或抽象概念与输入方式对应,切分方式与输出模型对应;③能较好地适应不断变化的语言现象,包括结构的自组织和词语的自学习;④新知识的增加对系统处理速度影响不大,这与一般机械匹配式分词方法有很大区别;⑤有助于利用句法信息和语义信息来处理歧义现象,提高理解分词的效果。作为智能分词技术的一种探讨,将神经网络与专家系统思想引入中文分词,是一种有益尝试,为后续智能自动分词技术取得更多进展打下良好基础。

黄祥喜提出“生成一测试”法,通过词典的动态化、分词知识的分布化、分词系统和句法语义系统的协同工作等手段实现词链的有效切分和汉语句子切分与理解的并行。该方法具有通用性,实现容易,分词和理解能力强。

由于汉语语言知识的笼统、复杂性,难以将各种语言信息组织成机器可直接读取的形式,因此目前基于理解的分词系统还处在试验阶段。

・统计模型技术。苏菲等提出基于规则统计模型的消歧方法和识别未登录词的词加权算法,通过词频统计、加权技术与正向逆向最大匹配进行消歧与未登录词识别。张茂元等提出基于马尔可夫链的语境中文切分理论,进而提出一种语境中文分词方法,该方法建立在词法和句法基础上,从语境角度分析歧义字段,提高分词准确率。

1.1.3 统计分词方法 统计方法思想基础是:词是稳定的汉字的组合,在上下文中汉字与汉字相邻共现的概率能够较好地反映成同的可信度。因此对语料中相邻共现的汉字的组合频度进行统计,计算他们的统计信息并作为分词的依据。常用统计量有如词频、互信息、t-测试差,相关分词模型有最大概率分词模型、最大熵分词模型、N-Gram元分词模型、有向图模型等。孙茂松等提出了一种利用句内相邻字之间的互信息及t-测试差这两个统计量解决汉语自动分词中交集型歧义切分字段的方法,并进一步提出将两者线性霍加的新的统计量md,并引入“峰”和“谷”的概念,设计了一种无词表的自动分词算法。王思力等提出一种利用双字耦合度和t-测试差解决中文分词中交叉歧义的方法。孙晓、黄德根提出基于最长次长匹配的方法建立汉语切分路径有向图,将汉语自动分词转换为在有向图中选择正确的切分路径。

三种主流方法各有优缺点,其具体比较见表1。

1.1.4 组合方法 单个方法有优点,但也存在不足,

实际分词算法设计时需要组合几种方法,利用各自优点,克服不足,以更好解决分词难题。

・字典与统计组合。翟凤文等提出了一种字典与统计相结合的分词方法,首先利用字典分同方法进行第一步处理,然后利用统计方法处理第一步所产生的歧义问题和未登录词问题。该算法通过改进字典的存储结构,提高了字典匹配的速度;通过统计和规则相结合提高交集型歧义切分的准确率,并且一定条件下解决了语境中高频未登录词问题。

・分词与词性标注组合。词性标注是指对库内语篇中所有的单词根据其语法作用加注词性标记。将分词和词类标注结合起来,利用丰富的词类信息对分词决策提供帮助,并且在标注过程中又反过来对分词结果进行检验、调整,从而极大地提高切分的准确率。白拴虎将自动分词和基于隐马尔可夫链的词性自动标注技术结合起来,利用人工标注语料库中提取出的词性二元统计规律来消解切分歧义。佟晓筠等设计N-最短路径自动分词和词性自动标注一体化处理的模型,在分词阶段召回N个最佳结果作为候选集,最终的结果会在未登录词识别和同性标注之后,从这N个最有潜力的候选结果中选优得到。姜涛等对Kit提出基于实例的中文分词一词性标注模型,通过理论上定性分析和实验证明得出如下优点:①对于训练语料相关的文本(即与训练语料相同、相似或同领域的文本),EBST系统的分词一词性标注结果具有极高的准确率;②EBST系统的分词一词性标注结果与训练语料中的分词一词性标注具有很好的一致性。

1.2 歧义消除研究

1.2.1 歧义类型 歧义是指同一个字符串存在不止一种切分形式。歧义字段分为交集型歧义字段(交叉歧义)、组合型歧义字段(覆盖歧义)两种。据统计交叉歧义字段占到了总歧义字段的86%,所以解决交叉歧义字段是分词要解决的重点与难点。

1.2.2 消歧方法 目前解决歧义消除的典型方法有:

・穷举法。找出待分析字串所有可能的词,该方法简单,但时间开销大,实用性不强。多数时候采用双向匹配算法,正向匹配结果与逆向匹配结果一致,分词正确,否则分词有歧义。

・联想一回溯法。李国臣等提出联想一回溯法,先将待切分的汉字符号串序列依特征词词库分割为若干子串,每个子串或为词或为词群(几个词组合而成的线性序列),然后利用实词词库和规则库再将词群细分为词。分词时,利用了一定语法知识。联想和回溯机制同时作用于分割和细分两个阶段,旨在有效解决歧义组合结构的切分问题。

・词性标注。白拴虎利用马尔可夫链的词性标注技术结合分词算法消解切分歧义,其他学者也有类似成果出现。

・EM(Expectation Maximization)法。王伟等提出基于EM思想,每个句子所对应的所有(或一定范围内)的分词结果构成训练集,通过这个训练集和初始的语言模型可以估计出一个新的语言模型,最终的语言模型通过多次迭代而得到。EM是极大似然原则下的建模方法,存在过度拟合问题。

・短语匹配与语义规则法。姚继伟、赵东范在短语结构文法的基础上,提出一种基于局部单一短语匹配和语义规则相结合的消歧方法。通过增加短语问的右嵌套规则和采用有限自动机的实现方式,解决了短语规则中存在冗余项的问题,提高了短语匹配效率和歧义消除类型的针对性。

1.3 未登录词研究

1.3.1 未登录词类型 未登录词大致包含两大类:①新涌现的通用词或专业术语等;②专有名词,如中国人名、外国译名、地名、机构名(泛指机关、团体和其他企事业单位)等。未登录词识别指正确识别未在词典中出现的词,未登录词出现极大影响了分词的精度,如何解决未登录词识别问题成为分词准确性的一大难题。

1.3.2 未登录词识别 识别第一类未登录词一般是先根据某种算法自动生成一张候选词表(无监督的机器学习策略),再人工筛选出其中的新词并补充到词表中。该方法需要大规模语料库支持。第二种常用办法是:首先依据从各类专有名词库中总结出的统计知识(如姓氏用字及其频度)和人工归纳出的专有名词的某些结构规则,在输入句子中猜测可能成为专有名词的汉字串并给出其置信度,之后利用对该类专有名词有标识意义的紧邻上下文信息如称谓,以及全局统计量和局部统计量参见下文,进行进一步鉴定。

归纳起来,未登录词解决方案有两大类:专用方法与通用方法。专用方法主要针对特定领域的未登录词如中文人名、中文地名、中文机构名等识别,此类方法主要基于专有词库与规则展开。通用方法则重在解决所有类别的未登录词识别问题,前面列举的机械分词、理解分词、统计分词方法就是一种通用方法。

・专有名词库。对中文人名、地名、机构名等分别建立词库,该方法需要搜集特定资源并制定特定算法,信息集成难度大。

・启发式规则。通过前后缀的修饰词发现人名等未登录词。如“先生张三”,前面“先生”就是一个特定的修饰词,一般后面紧接着是人名。郑家恒将中文姓氏用字进行归类,并利用分类信息建立规则以识别“小张”、“老李”之类的人名,并且有效地区分出“张”“李”等字的量词用法。

・通用解决方案。不针对特定的未登录词设计算法,适用于各种类型的未登录词。前述三种主流分词及组合算法则属于通用解决方案。另外,吕雅娟等对中同人名、中国地名、外国译名进行整体识别为目标,采用分解处理策略降低了整体处理难度,并使用动态规划方法实现了最佳路径的搜索,较好地解决了未登录词之间的冲突问题。秦文、苑春法提出了决策树的未登录词识别方法,适用各种未登录词识别。

1.4 分词与词性标注评测

各种算法优劣需要在真实文本上以较大规模、客观、定量的方式进行公开公正评测,它是推动中文信息处理研究的重要手段。杨尔弘等介绍了2003年“863中文与接口技术”汉语自动分词与词性标注一体化评测内容、评测方法、测试试题的选择与产生、测试指标以及测试结果,各种测试结果以精确率、召回率、F值度量,并对参评系统的切分和标注错误进行了总结。

2 分词系统研究

中文分词系统是利用计算机对中文文本进行词语自动识别的系统。一个高效的、性能优良的中文分词系统应该具备几个基本要素:分词精度、分词速度、系统可维护性、通用性、适应性。基于分词系统特点,将分词系统研究分为早期自动分词系统与现代分词系统研究两部分。

2.1 早期自动分词系统

20世纪80年代初有学者开始研究自动分词系统,陆续有一些实用性系统出现。典型的有:CDWS分词系统、汉语自动分词系统-NEWS L321、书面汉语自动分词专家系统等。由于受硬件条件及分词技术影响,早期分词实用系统在分词速度与精度上还不够理想,实用性不高。但这些实用分词系统的出现为后续分词系统设计打下了良好基础。

2.2 现代分词系统

2.2.1 中国科学院计算所汉语词法分析系统 ICT-CLAS ICTCLAS(Institute of Computing Technology.Chinese Lexical Analysis System)是中国科学院计算技术研究所研制,主要功能包括中文分词,词性标注,命名实体识别,新词识别;支持用户同典,繁体中文,GBK、UTF-8、UTF-7、UNICODE等多种编码格式。目前ICTCLAS3.0分词速度单机为996KB/s,分词精度为98.45%,AP[不超过200KB,各种渊典数据压缩后不到3M。

2.2.2 海量智能分词研究版 海量智能分词系统较好地解决了分词领域中的两大技术难题:歧义切分和新词的识别,分词准确率达到99.6%,分同效率为2000万字/分钟。其中组合歧义的处理一直是分词领域的难点中的难点,海量分词系统能对绝大多数的组合歧义进行正确的切分。在新词的识别上,针对不同类型采用不同识别算法,其中包括对人名、音译词、机构团体名称、数量词等新同的识别,其准确率比较高。

由于计算机硬件技术的大幅提升,分词技术的逐步成熟,现在分词系统在歧义消除、未登录词识别方面取得较大进展,分词速度与精度明显提高,实际性越来越强,为中文信息处理带来极大方便。