神经网络综述范文

导语：如何才能写好一篇神经网络综述，这就需要搜集整理更多的资料和文献，欢迎阅读由公务员之家整理的十篇范文，供你借鉴。

神经网络综述

篇1

关键词：神经网络；VC维；数据挖掘

中图分类号：TP183文献标识码：A文章编号：1009-3044(2008)30-0710-02

A Review of the Research and Development of the Artificial Neural Nets

WANG Hui

(Xinjiang Petroleum Institute,Urumqi 830000,China)

Abstract: This paper reviews the history and the current situation of the theory of neural nets. It discusses two aspects: the Vapnik-Chervonenkis dimension calculation and the data mining in neural nets. It also touches upon such research areas as calculation theory, methods and application of neural nets.

Key words: neural nets;Vapnik-Chervonenkis dimension;Data Mining

1 引言

本世纪初，科学家们就一直探究大脑构筑函数和思维运行机理。特别是近二十年来。对大脑有关的感觉器官的仿生做了不少工作，人脑含有数亿个神经元，并以特殊的复杂形式组成在一起，它能够在计算某些问题（如难以用数学描述或非确定性问题等）时，比目前最快的计算机还要快许多倍。大脑的信号传导速度要比电子元件的信号传导要慢百万倍，然而，大脑的信息处理速度比电子元件的处理速度快许多倍，因此科学家推测大脑的信息处理方式和思维方式是非常复杂的，是一个复杂并行信息处理系统。1943年McCulloch和Pitts结合了神经生理学和数理逻辑的研究描述了一个神经网络的逻辑演算。他们的神经元模型假定遵循一种所谓“有或无”(all-or-none)规则。如果如此简单的神经元数目足够多和适当设置突触连接并且同步操作，McCulloch和Pitts证明这样构成的网络原则上可以计算任何可计算的函数，这标志着神经网络学科的诞生。

2 发展历史及现状

2.1 人工神经网络理论的形成

早在40年代初，神经解剖学、神经生理学、心理学以及人脑神经元的电生理的研究等都富有成果。其中，神经生物学家McCulloch提倡数字化具有特别意义。他与青年数学家Pitts合作[1]，从人脑信息处理观点出发，采用数理模型的方法研究了脑细胞的动作和结构及其生物神经元的一些基本生理特性，他们提出了第一个神经计算模型，即神经元的阈值元件模型，简称MP模型，他们主要贡献在于结点的并行计算能力很强，为计算神经行为的某此方面提供了可能性，从而开创了神经网络的研究。50年代初，神经网络理论具备了初步模拟实验的条件。Rochester，Holland与IBM公司的研究人员合作，他们通过网络吸取经验来调节强度，以这种方式模拟Hebb的学习规则，在IBM701计算机上运行，取得了成功，几乎有大脑的处理风格。但最大规模的模拟神经网络也只有1000个神经元，而每个神经元又只有16个结合点。再往下做试验，便受到计算机的限制。人工智能的另一个主要创始人Minsky于1954年对神经系统如何能够学习进行了研究，并把这种想法写入他的博士论文中，后来他对Rosenblatt建立的感知器(Perceptron)的学习模型作了深入分析。

2.2 第一阶段的研究与发展

1958年计算机科学家Rosenblatt基于MP模型，增加了学习机制，推广了MP模型。他证明了两层感知器能够将输入分为两类，假如这两种类型是线性并可分，也就是一个超平面能将输入空间分割，其感知器收敛定理：输入和输出层之间的权重的调节正比于计算输出值与期望输出之差。他提出的感知器模型，首次把神经网络理论付诸工程实现。1960年Widrow和Hoff提出了自适应线性元件ADACINE网络模型，是一种连续取值的线性网络，主要用于自适应系统。他们研究了一定条件下输入为线性可分问题，期望响应与计算响应的误差可能搜索到全局最小值，网络经过训练抵消通信中的回波和噪声，它还可应用在天气预报方面。这是第一个对实际问题起作用的神经网络。可以说，他们对分段线性网络的训练有一定作用，是自适应控制的理论基础。Widrow等人在70年代，以此为基础扩充了ADALINE的学习能力，80年代他们得到了一种多层学习算法。

Holland于1960年在基因遗传算法及选择问题的数学方法分析和基本理论的研究中，建立了遗传算法理论。遗传算法是一种借鉴生物界自然选择和自然遗传机制的高度并行、随机、自适应搜索算法，从而开拓了神经网络理论的一个新的研究方向。1976年Grossberg提出自适应共振理论(ART)，这是感知器较完善的模型，即superrised学习方式。本质上说，仍是一种unsuperrised学习方式。随后，他与Carpenter一起研究ART网络，它有两种结构ART1和ART2，能够识别或分类任意多个复杂的二元输入图像，其学习过程有自组织和自稳定的特征，一般认为它是一种先进的学习模型。另外还有Werbos提出的BP理论以及提出的反向传播原理；Fukushima 提出了视觉图象识别的Neocognitron模型这些研究成果坚定的神经网络理论的继续研究。

2.3 第二次研究的阶段

Hopfield于1982年至1986年提出了神经网络集体运算功能的理论框架，随后，引起许多学者研究Hopfield 网络的热潮，对它作改进、提高、补充、变形等，至今仍在进行，推动了神经网络的发展。1983年Kirkpatrick等人先认识到模拟退火算法可应用于NP完全组合优化问题的求解。这种思想最早是由Metropolis等人在1953年提出的，即固体热平衡问题，通过模拟高温物体退火过程的方法，来找全局最优或近似全局最优，并给出了算法的接受准则。这是一种很有效的近似算法。1984年Hinton等人提出了Boltzmann机模型，借用统计物理学中的概念和方法，引入了模拟退火方法，可用于设计分类和学习算法方面，并首次表明多层网络是可训练的。Sejnowski于1986年对它进行了改进，提出了高阶Boltzmann机和快速退火等。

1986年Rumelhart和McClelland 合著的Parallel Distributed Processing: Exploratio n in the Microstructures of Cognition两卷书出版，对神经网络的进展起了极大的推动作用。它展示了PDP研究集团的最高水平，包括了物理学、数学、分子生物学、神经科学、心理学和计算机科学等许多相关学科的著名学者从不同研究方向或领域取得的成果。他们建立了并行分布处理理论，主要致力于认知的微观研究。尤其是，Rumelhart提出了多层网络Back-Propagation法或称Error Propagation法，这就是后来著名的BP算法。

2.4 新发展阶段

90年代以来，人们较多地关注非线性系统的控制问题，通过神经网络方法来解决这类问题已取得了突出的成果，它是一个重要的研究领域。1990年Narendra和Parthasarathy提出了一种推广的动态神经网络系统及其连接权的学习算法，它可表示非线性特性，增强了鲁棒性。他们给出了一种新的辨识与控制方案，以multilayer网络与recarrent网络统一的模型描述非线性动态系统，并提出了动态BP 参数在线调节方法。尤其是进化计算的概念在1992年形成，促进了这一理论的发展。1993年诞生了国际性杂志Evolutionary Computation。近几年它成为一个热点研究领域。1993年Yip和Pao提出了一种带区域指引的进化模拟退火算法，他们将进化策略引入区域指引，它经过选优过程，最终达到求解问题的目的。

从上述各个阶段发展轨迹来看，神经网络理论有更强的数学性质和生物学特征，尤其是神经科学、心理学和认识科学等方面提出一些重大问题，是向神经网络理论研究的新挑战，因而也是它发展的最大机会。90年代神经网络理论日益变得更加外向，注视着自身与科学技术之间的相互作用，不断产生具有重要意义的概念和方法，并形成良好的工具。

3 神经网络的发展趋势

3.1 神经网络VC维计算

神经计算技术已经在很多领域得到了成功的应用，但由于缺少一个统一的理论框架，经验性成分相当高。最近十年里，很多研究者都力图在一个统一的框架下来考虑学习与泛化的问题。PAC(Probably Approximately Correct)学习模型就是这样一个框架。作为PAC学习的核心以及学习系统学习能力的度量，VC维(Vapnik-Chervonenkis dimension)在确定神经网络的容量(capacity)、泛化能力(generalization)、训练集规模等的关系上有重要作用。如果可以计算出神经网络的VC维，则我们可以估计出要训练该网络所需的训练集规模；反之，在给定一个训练集以及最大近似误差时，可以确定所需要的网络结构。

Anthony将VC维定义为：设F为一个从n维向量集X到{0, 1}的函数族，则F的VC维为X的子集E的最大元素数，其中E满足：对于任意S?哿E，总存在函数fs ∈F，使得当x ∈ S时fs(x) =1，x?埸S但x∈E时fs(x) =0。

VC维可作为函数族F复杂度的度量，它是一个自然数，其值有可能为无穷大，它表示无论以何种组合方式出现均可被函数族F正确划分为两类的向量个数的最大值。对于实函数族，可定义相应的指示函数族，该指示函数族的VC维即为原实函数族的VC维。

3.2 基于神经网络的数据挖掘

1996年，Fayyad、Piatetsky-Shapiro和Smyth对KDD(Knowledge Discovery from Databases)和数据挖掘的关系进行了阐述。但是，随着该领域研究的发展，研究者们目前趋向于认为KDD和数据挖掘具有相同的含义，即认为数据挖掘就是从大型数据库的数据中提取人们感兴趣的知识。

数据挖掘的困难主要存在于三个方面：首先，巨量数据集的性质往往非常复杂，非线性、时序性与噪音普遍存在；其次，数据分析的目标具有多样性，而复杂目标无论在表述还是在处理上均与领域知识有关；第三，在复杂目标下，对巨量数据集的分析，目前还没有现成的且满足可计算条件的一般性理论与方法。在早期工作中，研究者们主要是将符号型机器学习方法与数据库技术相结合，但由于真实世界的数据关系相当复杂，非线性程度相当高，而且普遍存在着噪音数据，因此这些方法在很多场合都不适用。如果能将神经计算技术用于数据挖掘，将可望借助神经网络的非线性处理能力和容噪能力，较好地解决这一问题。

4 结束语

经过半个多世纪的研究，神经计算目前已成为一门日趋成熟，应用面日趋广泛的学科。本文对神经计算的研究现状和发展趋势进行了综述，主要介绍了神经网络VC维计算、基于神经网络的数据挖掘领域的相关研究成果。需要指出的是，除了上述内容之外，神经计算中还有很多值得深入研究的重要领域，例如：与符号学习相结合的混合学习方法的研究；脉冲神经网络(Pulsed Neural Networks)的研究;循环神经网络(Recurrent Neural Networks)的研究等；神经网络与遗传算法、人工生命的结合；支持向量机(Support Vector Machine)的研究；神经网络的并行、硬件实现；容错神经网络的研究。

参考文献:

[1] McCulloch W S, Pitts W. A Logical Calculus of the Ideas Immanent in Nervous Activity, Bulletin of Mathematical Biophysics, 1943.

[2] N.维纳著，郝季仁译，控制论，科学出版，1985.

[3] Von Neumann J. The General and Logical Theory of Automata, Cerebral Mechanisms in Behavior; The Hixon Sympsium, 1951.

[4] Hebb D O. The Organization of Behavior, New York:Wiley, 1949.

[5] 陈世福，陈兆乾. 人工智能与知识工程[M]. 南京: 南京大学出版社，1998.

[6] Simon Haykin.神经网络原理[M].机械工业出版社（第二版），2004.

篇2

【关键词】极限学习机故障诊断神经网络

引言

随着设备复杂化程度的提高，对故障诊断的快速性和准确性提出了更高的要求。将神经网络应用于故障诊断中已成为一个非常活跃的研究领域。利用神经网络强大的分类能力，进行故障模式的分类与学习，诊断出故障。

Huang在前人研究的基础上提出了一种称为极限学习机（Extreme Learning Machine，ELM）的学习方法，在保留计算精度的同时可以大幅度的缩减训练的时间。将ELM运用到设备故障诊断中，极大提高了诊断的快速性和准确性。

一、极限学习机研究现状

ELM自2004年提出就一直受到学者的极大兴趣。我们从ELM的理论和应用两方面进行阐述。

1.1 ELM的理论

对于传统ELM算法，网络结构、激活函数类型以及隐层神经元的选择对其泛化性能都有重要的影响。为了提高计算效率，使得ELM适用于更多应用领域，研究者提出了许多ELM扩展算法。

1.2 ELM的应用

研究人员已尝试利用ELM方法解决现实中各种模式分类问题。随着ELM自身理论的进一步发展和完善，在人脸识别、文本分类、医疗诊断等领域中应用广泛。

二、故障诊断技术研究现状

故障诊断技术是由于建立监控系统的需要而发展起来的。其发展至今经历了3个阶段。新的诊断技术带来了领域内算法的革新，设备精密程度的提高也对诊断实时性提出了更高的要求。如何保证故障的快速准确诊断成了诊断技术发展重要内容。

基于神经网络的故障诊断运用广泛，然而传统的神经网络学习方法存在许多问题。与传统的神经网络相比，极限学习机方法通过随机选取输入权值及隐层单元的偏置值，可以产生唯一的最优解，并具有参数易于选择以及泛化能力好等特点，在众多领域有着广泛应用。

三、基于极限学习机的故障诊断方法研究

3.1基于ELM的故障诊断流程

（1）数据预处理。按照选取的特征向量和故障类型对故障样本进行预处理，并将处理后的样本按比例分为训练样本集和测试样本集。

（2）ELM的学习算法主要有以下3个步骤：确定隐含层神经元个数；随机设定输入层与隐含层间的连接权值和隐含层神经元的偏置；选择隐含层神经元激活函数，进而计算隐含层输出矩阵计算输出层权值。

（3）用训练好的ELM模型对测试样本集进行分类，并输出分类结果。

3.2基于改进ELM的故障诊断

针对极限学习机神经网络初始权阈值对算法性能的影响问题，提出融合遗传算法（GA）与粒子群算法（PSO）的GA-PSO算法，用于优化ELM神经网络初始权阈值。该算法将群组一分为二，分别采用GA和PSO算法，再将优秀个体进行合并，改善了PSO算法全局搜索能力，同时增强GA算法的局部搜索效能。

篇3

随着计算机网络、信息技术、自动化技术的进步，极大的改变了我们的生活。人工神经网络技术是一种全新的控制技术，通过互联网进行动态模拟，从而建立一种新的控制互联网的系统。经过十几年的发展，人工神经网络技术研究取得了巨大的进步，已经广泛应用在社会各个领域，使现代计算机中的难题得到了解决。本文主要从人工神经网络技术的概念出发，探讨了它在现代社会领域的具体应用。

【关键词】人工神经网络信息技术发展趋势

人工神经网络技术在处理实际问题主要包括两个过程，一个是学习训练过程，另外一个是记忆联想过程。近年来随着人工网络技术的发展，人工神经网络技术在信号处理、图像处理、智能识别等领域已经取得了巨大的改变，为人们研究各类科学问题提供了一种新的方法和手段，使人们在交通运输、人工智能、军事、信息领域的工作更加便捷，近年来随着AI的l展，人工神经网络技术得到了快速的发展阶段。

1 人工神经网络技术

人工神经网络技术也称ANN，是随着上个世纪八十年代人工智能发展兴起的一个研究热点，它的主要工作原理对人脑神经网络进行抽象处理，并仿造人脑神经网络建立简单的模型，按照不同的连接方式组成一个完整的网络，因此学术界也直接将它成为神经网络。神经网络其实就是一种运算模型，它是通过大量的节点――神经元连接起来的，其中不同的节点所代表的输出函数也不同，也就是所谓的激励函数；当有两个节点连接起来时称之为通过该连接信号的加权值，也称为权重，这就相当人脑神经网络记忆。人工神经网络技术是采用并行分布式系统，这种工作机理与传统的信息处理技术和人工智能技术完全不同，是一种全新的技术，它克服了传统基于逻辑符号的人工智能处理非结构信息化和直觉方面的缺陷，具有实时学习、自适应性和自组织性等特点。

2 人工神经网络技术应用分析

随着人工神经网络技术的发展，它在模式识别、知识工程、信号处理、专家系统、机器人控制等方面的应用较广。

2.1 生物信号的检测分析

目前大部分医学检测设备都是通过连续波形得到相关数据，从而根据所得数据对病情进行诊断。人工神经网络技术就是应用了这样的方式将多个神经元组合起来构成，解决了生物医学信号检测方面的难题，其适应性和独立性强，分布贮藏功能多。在生物医学领域该技术主要应用于对心电信号、听觉诱发电位信号、医学图像、肌电荷胃肠等信号的处理、识别和分析。

2.2 医学专家系统

传统的医院专家系统是直接将专家的经验、学历、临床诊断方面取得的成绩等存储在计算机中，构建独立的医学知识库，通过逻辑推理进行诊断的一种方式。进入到二十一世纪，医院需要存储的医学知识越来越多，每天产生新的病况和知识，过去的一些专家系统显然已经无法适应医院的发展需求，因此医院的效率很低。而人工神经网络技术的出现为医院专家系统的构建提出了新的发展方向，通过人工神经网络技术，系统能够自主学习、自己组织、自行推理。因此在医学专家系统中该网络技术应用面较广。麻醉医学、重症医学中生理变量分析和评估较多，目前临床上一些还没有确切证据或者尚未发现的关系与现象，通过人工神经网络便能有效地解决。

2.3 市场价格预测

在经济活动中，传统统计方法受到一些因素的制约，无法对价格变动做出准确的预测，因此难免在预测的时候出现失误的现象。人工神经网络技术能够处理那些不完整的、规律不明显、模糊不确定的数据，并作出有效地预测，因此人工神经网络技术具有传统统计方法无法比拟的优势。例如人工神经网络技术可以通过分析居民人均收入、贷款利率和城市化发展水平，从而组建一个完整的预测模型，准确预测出商品的价格变动情况。

2.4 风险评价

在从事某一项特定的活动时，由于社会上一些不确定因素，可能造成当事人经济上或者其他方面的损失。因此在进行某一项活动时，对活动进行有效的预测和评估，避免风险。人工神经网络技术可以根据风险的实际来源，构筑一套信用风险模型结构和风险评估系数，从而提出有效地解决方案。通过信用风险模型分析弥补主观预测方面的不足，从而达到避免风险的目的。

3 人工神经网络技术未来发展

人工神经网络克服了传统人工智能对语言识别、模式、非结构化信息处理的缺陷，因此在模式识别、神经专家系统、智能控制、信息处理和天气预测等领域广泛应用。随着科学技术的进步，AI的快速发展，AI与遗传算法、模糊系统等方面结合，形成了计算智能，很多企业和国家开始大规模研发AI，人工神经网络正在模拟人类认知的方向发展，目前市场已经有很多不少人工智能产品面世。

4 结语

通过上述研究分析，人工神经网络技术已经取得了相应的发展，但还存在很多不足：应用范围狭窄、预测精度低、通用模型缺乏创新等，因此需要我们在此基础上不断寻找新的突破点，加强对生物神经元系统的研究和探索，进一步挖掘其潜在的价值，将人工神经网络技术应用在更多领域中，为社会创造更大的财富。

参考文献

[1]周文婷，孟琪.运动员赛前心理调控的新策略――基于人工神经网络技术的比赛场地声景预测（综述）[J].哈尔滨体育学院学报，2015，33（03）：15-21.

[2]张红兰.人工神经网络技术的应用现状分析[J].中国新通信，2014（02）：76-76.

[3]张广军.人工神经网络技术在光电检测中的应用[J].北京航空航天大学学报，2001，27（05）：564-568.

篇4

关键词：智能交通；预测；短时交通信息

中图分类号：U491文献标识码：A0

引言

智能交通（ITS）是将人工智能技术、自动控制技术、计算机技术、先进的信息通信技术及传感器技术等有效的集成，并应用于整个地面交通管理系统而建立的一种大范围、全方位发挥作用的综合交通运输管理系统，包括先进交通管理系统（ATMS）、先进的驾驶员信息系统（ATIS）、先进公共运输系统（APTS）、出行指导系统等[2,3]。

短期交通信息预测是对城市交通系统或高速公路系统中某条道路或某个交通网络在未来一段时间内（时间跨度通常不超过15分钟）交通流等信息的变化情况进行预测，其结果可以用于制订和实施交通管理，对交通流进行调节，实现路径诱导，也可以直接送到先进的交通信息系统和先进的交通管理系统中，为出行者提供实时有效的信息，以更好地进行路径选择，缩短出行时间，减少交通拥挤。目前，短期交通信息预测的研究越来越受到重视，已经成为智能交通领域的重点研究内容之一[3]。

本文对短时交通信息的几种主要预测方法进行了介绍，重点分析了时间序列、神经网络、非参数回归、支持向量机等几种预测方法的优缺点、应用场合，并对当前研究中的问题和未来发展趋势作了介绍。

1短时交通信息预测方法分类

短期交通信息的预测包括对交通流三大参数，即交通流量、车流速度和密度预测，以及对行程时间等其他信息的预测。从20世纪50年代中期开始，国内外的研究人员对交通系统的短时交通信息的预测方法进行了广泛的研究，从早期的历史平均法、指数平滑法、谱分析方法、时间序列分析，到近十几年发展起来的神经网络方法、小波分析方法、混沌预测、支持向量机、动态交通分配等预测方法，应用于智能交通领域的短时预测方法有几十种[10]。根据各种预测方法本身的性质和研究问题的角度不同，常见的预测方法可以分为两大类：一类是基于数据驱动的预测方法，结合统计经验进行分析，如神经网络、支持向量机等方法；另一类是基于机理的预测方法，即以交通理论的为基础，从交通工程上的供求关系角度进行分析，如动态交通分配法（DTA，Dynamic traffic assignment）[2][12]。常见的预测方法具体分类如图1所示。

交通流是一个时变过程，不同的空间位置环境其状态特征差异大，各种预测方法也都有各自的优缺点和相应的适用场合，因此对各种环境条件下的交通信息预测应当是一个综合运用各种方法相互补充的过程。一个成功的交通流预测过程应能正确反映被测过程及其环境变化并及时调整模型结构，使预测具有适应性。

图1 短时交通信息预测方法分类

2短时交通信息主要预测方法

2.1时间序列模型

时间序列分析主要指采用参数模型对观测到的有序随机数据进行分析和处理的一种数据处理方法。其预测原理是将预测对象随时间变化形成的数据序列看成一个随机时间序列，该序列的未来发展变化与对象历史变化存在依赖性和延续性，包括自回归模型（AR，Auto-Regressive）、滑动平均模型（MA，Moving Average）、自回归综合滑动平均模型（ARIMA，Auto-Regressive Integrated Moving Average）等[1]。其中单变量ARIMA是典型的时间序列方法，适用于短时交通信息预测，它实际上是用二项式差分消除了非平稳时序中的多项式趋向，从系统角度分析，就是分离出了系统中相同的一阶环节，从而可以按照平稳时序建模。ARIMA适用于稳定的交通流。但是时间序列方法的缺点是：1）交通状况变化时由于计算量大，该算法具有预测延迟的特点，且算法本身依赖于大量不间断的数据，若实际中数据遗失则预测精度变低，算法的鲁棒性差；2）模型是通过研究交通流过去的变化规律来外推或预测其未来值，只利用了历史数据，没有考虑其他影响因素，如相邻路段、天气变化影响等，所以交通状态急剧变化时，预测结果与实际情况差别很大；3）模型参数的求解一般是离线进行的，并且在预测过程中的模型参数是固定的，不能移植，不能很好的适应不确定性强的短时交通流动态预测要求[5][13]。与单变量ARIMA相似，多变量时间序列预测也得到了广泛研究，包括多变量时间序列模型包括向量ARIMA、空间时间ARIMA等，这些模型主要考虑交通网络中多个节点交通流之间的相互联系，一定程度上更能反映交通流的本质特征，但由于模型过于复杂，在实际中很难实现。

2.2神经网络模型

神经网络是一种并行的、分布式的智能信息处理方法，具有非线性映射和联想记忆功能，非常适合解决强非线性、时变系统的预测问题。利用神经网络对环境变化的较强的自适应学习能力和较好的抗干扰能力，可以克服传统交通信息预测方法的局限性，所以在智能交通系统得到了广泛的应用。目前，在交通信息预测方向的神经网络预测研究主要分为三个层次[18]：

1）将某一类神经网络方法直接用于短时交通信息预测的方法有：例如BP神经网络、RBF神经网络、时滞神经网络等；

2）将两种或多种神经网络相结合的混合预测模型：例如神经网络集成方法；

3）将神经网络与其他方法结合，进行综合预测的方法：例如模糊神经网络、粗神经网络、以及小波神经网络等。粗神经网络建立在粗神经元基础上，基于粗糙集理论和近似概念建立的粗神经元可以看作由两个存在重叠的常规神经元组成。粗神经网络中的常规神经元对应于确定性变量，如交通流量密度、速度以及行程时间，粗神经元用于描述不确定性变量或变量波动情况，如偶发事故、天气原因引起的交通流参数波动[3]。小波神经网络是在小波分析基础上提出的前馈网络，与传统神经网络的区别是隐含层节点激励函数不是Sigmoid函数而是小波函数。小波神经网络原理是：交通流在不同时间尺度上具有自相似性和多尺度特征，低频部分反映的是总体变化趋势，高频部分是随机性和不稳定性的表现，因此可以利用小波分析方法将交通信息中的高频部分和低频部分预测。

不过，将神经网络用于实际交通系统预测的难点是神经网络的训练时间较长，普适性差，交通状态变化时难以在线调整，不适用于大规模网络。

2.3非参数回归

非参数回归是利用模式匹配算法，找到一组与输入数据相对应的数据或相似的数据来预测[8]，对应关系不需要精确的函数表达式，而是一个近似的关系。在每次模式匹配算法中，随着输入数据模式变化，这个近似的关系也会有变化，从而达到动态预测的目的[18]。非参数回归方法本质上是一种数据驱动的智能方法，认为系统所有因素之间的内在联系都蕴含在历史数据中，从大量的历史数据样本中找到所需的匹配数据，依赖匹配数据预测。

利用非参数回归进行短时交通流预测的原理是：对于固定的道路状况，车流的上下游因果关系是具有重复性的，同时这种因果关系也是随着时间变化的，由于交通流的时变性和非线性，寻找这种动态的具体映射关系是不现实的，采用基于数据驱动的非参数回归方法是一种较好的解决方法[21]。文[20]对非参数回归方法在短时交通预测中的可行性进行了分析。文[8]利用反馈机制对系统变量和输入变量进行动态调节，提高了非参数回归方法的预测精度，并通过北京市路网的交通流预报实例证明了这种方法的有效性。

非参数回归方法的优点是：1）不需要先验和大量的参数识别，不必确定任何模型参数，只需要足够的历史数据，寻找历史数据中与当前点相似的近邻，并用这些近邻预测下一时段的流量；2）应对突发事件能力强，预测准确性和误差分布较好算法原理清晰，鲁棒性好，尤其适用于交通状态不稳定时的系统预测。非参数回归方法的缺点是：存储的历史数据较多时查找近似点的效率就会降低，影响预测速度，另外交通环境变化时导致状态和流量的对应关系发生变化，需要更新数据库信息[18,19]。

2.4混沌预测

交通系统是一个复杂的大系统，它表现出来的非线性动力学性质之一就是混沌现象。实际上，在一个较短的时间段内（例如10分钟），每条道路的车流量、路口总体流量和交通控制网络流量的变化具有丰富的内部层次有序结构，有很强的规律可寻，是一种介于随机和确定性之间的现象，即混沌。具体来说，车辆间的非线性跟驰和交通系统的状态参数的变化都存在混沌现象。

基于混沌理论的进行交通信息短时预测主要以混沌理论、分形理论、耗散理论、协同理论、自组织理论等为基础，利用混沌理论中的相空间重构、奇怪吸引子、分形方法等建立预测模型[18]。研究可分为两个方面：基于交通流理论模型的混沌研究和基于实测交通流数据的混沌研究。混沌时间序列预测方法有：全域预测、局域预测、加权零阶局域预测、加权一阶局域预测、基于最大Lyapunov 指数的预测、自适应预测等方法。文[28]分析了短时交通流的非线性特性及其对预测的影响，并讨论了两个方面的问题，即交通流随着观测时间尺度不同时混沌和分形特征的变化情况及对交通流预测的影响。文[17]对交通混沌研究的现状进行了分析和展望。

从理论上利用混沌理论对非线性和不确定性很强的交通流进行预测是非常合适的，所以这种方法将有很好的应用前景。不过目前交通混沌预测的研究中也有许多问题需要解决，例如：1）短时交通信息的混沌预测对实时性要求高，因此需要研究快速判别混沌方法，解决样本数据和实时性之间的矛盾；2）应用混沌解释一些原来解释不了的交通问题相对容易，而应用混沌解决实际交通问题非常困难。即混沌预测的实用化方法还是一个难题。

2.5支持向量机

支持向量机（SVM）是机器学习的一个重要分支，也是模式识别、统计学习等领域研究的热点。SVM在智能交通领域的应用主要包括车辆检测、交通状况识别等，目前SVM越来越多的被应用在时间序列分析上，即支持向量回归（SVR，Support vector regression），具体包括有-支持向量回归机、-支持向量回归机和最小二乘支持向量回归机（LS-SVM，Least square SVM）等[4][24]。利用SVR预测短时交通信息包括交通流量预测和行程时间预测两个方面。

基于支持向量回归的交通信息预测思想在于：首先选择一个非线性映射把样本向量从原空间映射到高维特征空间，在此高维特征空间构造最优决策函数，利用结构最小化原则，同时引入损失函数，并利用原空间的核函数取代高维特征空间的内积运算。支持向量回归可以解决神经网络的一些固有缺点，在解决小样本、非线性和高维模式识别问题中表现出许多特有的优势[25]。与基于神经网络的预测方法相比，SVR的预测精度高，预测结果一般好于神经网络[11][14]。文[9]基于支持向量机对行程时间进行短时预测，并与BP神经网络的方法进行了对比，实验结果表明对于小样本和高维的数据集，SVM在行程时间预测中的效果较好, 误差较BP神经网络的方法小。文[22]利用在线支持向量机（OSVR，Online SVR）进行短时交通流预测，与BP神经网络预测相比，预测的精度、收敛时间、泛化能力都有提高。文[27]利用LS-SVM对行程时间指标（TTI，Travel time index）进行预测，LS-SVM与SVM区别是LS-SVM采用一组线性方程训练，SVM采用的是二次规划方法，所以LS-SVM的优点是快速收敛，精度更高，计算量小，预测性能更好。

但是基于支持向量机的预测方法缺点是训练算法速度慢，预测的实时性还难以保证，另外对核函数及其参数以及损失函数的选择也没有确定方法。

2.6 组合预测方法

由于短时交通信息预测的随机性和不确定性，单一的预测方法很难取得好的预测效果，各种预测方法都存在不同程度的缺点和相应的适用范围，如果将各种方法有机的结合起来，则可能会取得更好的效果，这也是组合预测方法的出发点。组合预测方法是指将两种或两种以上的预测方法在中间预测过程结合或者将最终的预测结果融合[7][18]。现在已有的组合模型包括：数学模型与智能方法的结合、时域方法与频域方法的结合等。如表1所示。

表1组合预测方法分类

组合模型作用

数学模型

时域方法智能信息处理方法

（模糊、神经网络、灰色模型等）数据分类

频域方法（傅立叶变换、小波模型等）数据分解、消噪

常用的一类组合模型是利用模糊方法、神经网络、灰色模型等智能信息处理方法对短时交通流的数据聚类，然后对每一组聚类数据用线性或非线性方法预测。文[26]利用组合方法进行交通流预测，目的是将不同模型的数据和知识结合起来，最大化的利用有用信息，将MA、ES、ARMA作为神经网络的输入，实验结果表明组合方法比单一预测方法精度更高。文[23]利用模糊神经网络进行城市交通流预测，提出了一种模糊神经模型（FNM）预测城市路网的交通流，首先利用模糊方法对输入数据进行划分，再利用神经网络建立输入输出关系，并在线滚动优化训练FNM，根据实际交通条件，通过模型系数自适应变化，提高预测能力。利用智能信息处理方法对交通信息进行分类可以减少预测时间，但是很难对不同的交通条件给出确切的定义，而且聚类处理可能破坏时间序列的内在机理，失去交通流原有的动态信息[12]。

另一类组合模型是用频域方法对数据先分解，再对分解后的数据再预测，典型的是基于小波分解的预测模型。通过小波分析，可以将信号逐层分解到不同的频率层次上，分解后的信号的平稳性比原始信号好的多，利用小波变化将交通流序列分解为多个分量，对个信号分量分别进行预测，可以极大的提高预测准确性。例如文[15] 提出基于小波分析与神经网络的交通流短时预测方法，把多维输入进行小波降维分解，预测由多个子网络独立完成，实验结果表明，该方法比典型的神经网络预测准确度更高。文[16]提出基于小波包和LS-SVM的交通流短时组合预测方法。小波分析的另一个应用是对交通原始数据进行消噪处理，文[6]将小波分析方法和ARIMA相结合，取得了更好的预测效果。文[23]利用离散小波变换（DWT）去除交通数据中的噪声后进行交通流量预测。DWT的多分辨率分析（MRA，Multi-resolution analysis）可以在保留交通流量快变特性的同时，消除噪声信息利用小波消噪，提高预测精度。缺点是每次分解信号样本减少一半，存在信息丢失，影响模型重构。

3结束语

通过智能交通中短时交通预测主要方法的归纳、分析、比较，可以看出无论是传统的时间序列预测方法还是神经网络、小波分析、支持向量机等智能预测方法都存在各自的适用范围和优缺点。交通流本质上时空函数，即从时间上看，短时交通流信息可以作为时间序列处理，同时，交通流也具有空间上的相关性，上下游的路段之间存在必然的因果联系，所以如何在现有预测方法的基础上融入更多的交通流的时空信息将是一个值得研究的方向，另外将其他工程、金融等领域的预测方法借鉴到智能交通领域，并将各种预测方法有效融合在一起，处理短时交通信息预测中的不确定性和随机性，提高预测的精度和可靠性，并保证实时性也是一个需要继续探索的方向。

参考文献（References）

[1]杨叔子.时间序列分析的工程应用（第二版）[M].武汉：华中科技大学出版社,2007.

[2]朱顺应,王红等.交通流参数及交通事件动态预测方法[M].南京：东南大学出版社,2010.

[3]许伦辉,付惠.交通信息智能预测理论与方法[M].北京:科学出版社,2009.

[4]陆海亭,张宁等.短时交通流预测方法研究进展[J].交通运输工程与信息学报.2009, 7(4):84-91.

[5]贺国光,李宇等.基于数学模型的短时交通流预测方法探讨[J]. 系统工程理论与实践.2000(12):51-56.

[6]窦慧丽,刘好德等.基于小波分析和ARIMA模型的交通流预测方法[J].同济大学学报（自然科学版）.2009, 37(4):486-494.

[7]张益,陈淑燕等.短时交通量时间序列智能复合预测方法概述[J].公路交通科技.2006, 23(8):139-142.

[8]张晓利,陆化普.非参数回归方法在短时交通流预测中的应用[J].清华大学学报（自然科学版）.2009, 49(9):1471-1475.

[9]姚智胜,邵春福等.支持向量机在路段行程时间预测中的应用研究[J].公路交通科技.2007, 24(9):96-99.

[10]刘静,关伟.交通流预测方法综述[J].公路交通科技.2004, 21(3):81-85.

[11]徐启华,杨瑞.支持向量机在交通流量实时预测中的应用[J].公路交通科技.2005, 22(12):131-134.

[12]王正武, 黄中祥.短时交通流预测模型的分析与评价[J].系统工程.2003, 21(6):97-100.

[13]韩超, 宋苏等.基于ARIMA 模型的短时交通流实时自适应预测[J].2004, 16(7):1530-1533.

[14]杨兆升,王媛等.基于支持向量机方法的短时交通流量预测方法[J].吉林大学学报（工学版）,2006,36(6): 881-884.

[15]张晓利.基于小波分析与神经网络的交通流短时预测方法[J].信息与控制.2007, 36(4):467-470.

[16]姚智胜,邵春福等.基于小波包和最小二乘支持向量机的短时交通流组合预测方法研究[J].中国管理科学.2007, 15(1):64-69.

[17]王东山,贺国光等.交通混沌研究综述与展望[J].土木工程学报.2003, 36(1):68-73.

[18]王进,史其信.短时交通流预测模型综述[J].智能交通.2005, 1(6):93-98.

[19]李振龙,张利国等.基于非参数回归的短时交通流预测研究综述[J].交通运输工程与信息学报.2008, 6(4):34-39.

篇5

关键词：运动目标检测光流法神经网络

中图分类号：TP242 文献标识码：A 文章编号：1007-9416（2016）11-0084-01

1 前言

机器人在未知环境中运动时，检测出环境中的动态目标非常重要，它能为机器人提供更加详尽的信息与策略。而腿式机器人要比轮式机器人具有更多的优点，但是腿式机器人行动时相对稳定性差，使得图像背景变化的模式和规律更加复杂，对于检测环境中的运动物体带来了更大的挑战。本文提供了一种方法，使足式机器人能在较高速度下准确的检测环境中物体的移动。该方法首先不对图像进行预处理，减少了信息计算量；其次在神经网络的输出中加入了实质性的后期处理步骤；最后对得到的差异信息进行重构，从而识别出动态目标。本文提供的方法对于一个以最高速度10CM/S自由行走的机器人来说是有效的。

2 外部运动检测方法

图1描述的是我们使用的算法。首先，我们需要计算图像中的光流，将得到的向量场作为神经网络的输入，同时根据从三个加速度传感器获得的机器人当前步态循环中的位置信息作为神经网络的另一个输入。根据以上两方面信息输出下一幅图像的预期光流信息。机器人对接收到的下一幅图像进行光流计算并且和神经网络的预期进行比较。用后期处理算法寻找两幅图像中不一致区域的不连续处，从而判断在图像中是否发现移动的物体。

我们用自己搭建的电子狗机器人平台获得光流的训练和测试序列，并且作为一系列图形文件传输到个人计算机上进行光流计算，计算出来的光流场重新储存到硬盘中用于后来预期光流的产生和与其进行比较。

利用获得的最新的光流场的图像和机器人的加速度及在整个步态中的位置，神经网络能有效的获得下一个光流场的图像。经过和获得的光流场对比，我们就能看到图像中哪一部分存在着没有预见的运动。我们用已有的光流场序列来训练这个网络，得到不同速度下的神经网络预测器。

通过比较预期的和真实获得的光流场，我们能获得向量场。捕捉向量场中每个元素的梯度我们将获得一个相同大小的矩阵，称之为差异场。如果场景中由外部移动的物体，那么在差异场中就会出现急剧的不连续，通过在每个差异场中运行边缘检测算法就会检测出来。

最后利用边缘检测进行后期处理，首先通过找到它的最大像素点，将和最大像素点差距大的像素点赋值为0，其他赋值为1，可以获得一个二进制版本的差异场，接下来用一个常规的边缘检测算法对二进制差异场进行分析，获得动态目标的形状。

3 实验及结果

我们用自主搭建的电子狗机器人获得实验图像，电子狗的四肢和头部都有3个自由度。它的头部有一个CMOS的摄像头，1秒钟能大约能采集25幅图像。机器人尝试识别出白色背景下运动的2-3个黄色不规则目标，我们设定机器人的运动速度为10CM/S。在光流计算前，图像也会从全色转化成灰度级。

机器人获得的图像和光流场由35列，27行组成。低分辨率的图像能使用一个简单的神经网络进行处理，并且使光流场计算的运行时间减少。在神经网络训练中用到了循环架构，网络有120个单位的隐藏层。网络通过数据回溯的方法进行训练，训练的数据来自于机器人在空场地的10次行进，每次行进大约由80幅连续的图片组成。

多次实验证明，利用训练好的神经网络预测器，系统能正确的标定出图像中包含大部分运动的小块，大约95%的动态图像块均被正确的标注。

4 结语

本文提出了一种快速移动四足机器人检测外部动态目标的方法。通过对神经网络进行训练，系统不仅能快速准确的识别出环境中的动态目标，同时系统计算量也大幅减少。实验证明系统具有较高的可靠性。

参考文献

[1]屠大维，江济良.改进的光流运动图像分析方法及其应用[J].光学精密工程，2011（05）.

[2]朱克忠.基于光流法对移动目标的视频检测与应用研究[D].合肥工业大学，2007.

[3]邵文坤，黄爱民，韦庆.动态场景下的运动目标跟踪方法研究[J].计算机仿真，2006（05）.

篇6

关键词：神经网络入侵检测；自动变速率；随机优化算子

中图分类号：TP18 文献标识码：A 文章编号：1009-3044（2014）03-0614-03

随着互联网应用的发展，更现显了网络安全的重要性。入侵检测技术在安全防护中是一种主动防护技术，能及时地检测各种恶意入侵，并在网络系统受到危害时进行响应，因此在为安全防御体系中入侵检测系统占有重要的地位。但是在现实的应用中，入侵检测系统没有充分发挥其作用。这是因为，不断变化的入侵方式要求入侵检测模型必须具有分析大量数据的能力。无论这些数据是不完全的，是非结构化的，或者是含有噪音的。而且，有些攻击是由处于不同网络位置上的多个攻击者协作进行的，这就要求入侵检测模型又必须具备处理来自非线性数据源的大量数据的能力。神经网络具有联想记忆能力、自学习能力和模糊运算的能力。因此将神经网络应用入侵检测中，它不仅可以识别出曾见过的入侵，还可以识别出未曾见过的入侵。该文首先介绍了一种改进的神经网络算法，然后分析了该算法在入侵检测中的应用，并给出试验仿真结果。

1 BP神经网络与入侵检测

1.1 BP神经网络的特点与不足

BP神经网络是神经网络模型中应用最广泛一种。它基于成熟的BP算法，主要有以下几个特点：1）它能够实现自组织、自学习，根据给定的输入输出样本自动调整它的网络参数来模拟输入输出之间的非线性关系。2）在存储上采用分布式存储，所有的信息分布存储在每一个神经元中。3）它还可以实现并行处理，下一层的每个神经元可以根据接收到的上一层信息同时独立地计算。这些特点使其很适合应用于入侵检测技术，满足入侵检测的适应性、可靠性、安全性和高效性的要求。

但是传统的BP算法也存在着以下几个方面的不足：1）局部极小；2）学习算法收敛速度慢；3）隐含层节点选取缺乏理论；4）加入新的样本会影响已经学完的样本；5）每次输入样本特征的数目必须确定且相同。

1.2 入侵检测技术

通过对系统数据的分析，当发现有非授权的网络访问和攻击行为时，采取报警、切断入侵线路等措施来维护网络安全，这被就是入侵检测技术。采用此技术设计的系统称为入侵检测系统。根据采用的技术来说入侵检测系统应具有以下几个特性：1）监视用户及系统活动；2）分析用户及系统活动；3）异常行为模式分析；4）识别已知的进攻活动模式并反映报警；5）系统构造和弱点的审计，操作系统的审计跟踪管理；6）评估重要的系统和数据文件的完整性，并识别用户违反安全策略的行为。

目前最常用的攻击手段有：拒绝服务、探测、非授权访问和非授权获得超级用户权限攻击。而且这些攻击手段在实际中还有很大的变异，因此给入侵检测带来了一定的难度。BP神经网络的自组织自学习能力，使得经过训练后的BP神经网络对以前观察到的入侵检测行为模式进行归纳总结，除了可以识别出已经观察到的攻击，还可以识别出由已知攻击变异出的新的攻击，甚至是全新的攻击。

2.3 改进的神经网络算法

人工神经网络在模式识别、非线性处理、信号检测等领域应用非常多，这是由于人工神经网络具有的良好的自适应和自组织性，高度的非线性特性以及大规模并行处理和分布式信息存储能力的特性。BP神经网络算法实质上是非线性优化问题的梯度算法，该算法在收敛性问题上存在限制与不足。即该算法学习的结果不能保证一定收敛到均方误差的全局最小点，也有可能落入局部极小点，使算法不收敛，导致陷入错误的工作模式。因此本文选择了改进的神经网络，改进主要有以下几点：

2）自动变速率学习法

传统的BP算法是以梯度为基础，采用LMS学习问题的最陡下降法，学习步长是一个固定不变的较小值，不利于网络的收敛。因此，选择了基于梯度方向来自动调节学习速率的方法。利用梯度确定学习的方向，由速率决定在梯度方向上学习的步长。因此，如果相邻两次的梯度方向相同则说明在该方向是有利收敛的方向，如果相邻两次的梯度方向相反则说明此处存在不稳定。因此，可以利用两次相对梯度变化来确定学习步长，当两次梯度方向相同时则增大学习步长，加快在该方向上的学习速度；而如果两次梯度方向相反那么减小学习步长，加快整个网络的收敛速度。这种方法的自适应速率调节公式如下：

2）引入遗忘因子

本文所采用的自适应变速率学习法是依据相邻两次梯度变化来确定学习步长的算法，但单纯的学习速率的变化还不能即完全地既保证收敛速度，又不至于引起振荡。因此考虑变相的学习速率的学习。即在权值的调节量上再加一项正比于前几次加权的量。权值调节量为：

我们将[τ]称为遗忘因子。遗忘因子项的引入就是对学习过程中等效的对学习速率进行微调的效果。遗忘因子起到了缓冲平滑的作用，使得调节向着底部的平均方向变化。

3）随机优化算子

虽然采用自动变速率学习法，并引入遗忘因子的神经网络算法可以对学习速率进行微调，但是仍存在着BP神经网络的限制与不足因此引入随机优化算子。也就是当网络的权值误差迭代一定的次数后，仍没有明显的收敛，或者系统误差函数的梯度连续几次发生改变，这说明网络进入了一个比较疲乏的状态，需要借助外界的推动力来激活网络。当发现上述的两种情况时，就产生与权值维数相同的随机数，并将随机数与权值直接相加，然后判断系统误差的变化。如果误差没有降低，那么就再继续产生随机数来修改权值，直到误差减少，再从新的权值开始继续BP算法。随机优化算子可以令搜索方向随机变化，从而摆脱局部极小点。

4）改进算法与传统算法比较

以200个训练样本为例，分别采用改进的BP神经网络和经典BP神经网络的方法进行学习、训练。两种算法的误差收敛对比曲线如图1所示。

3 采用改进算法的入侵检测仿真实验

入侵检测系统进行测试和评估需要标准的、可重现的并包含入侵的大量数据。本仿真实验选取DARPA数据集网络连接数据集作为实验数据。然后，对这些数据选三组特征值进行实验，并给出实验结果。

3.1 数据源的选取

该实验的数据采用DARPA 1988入侵检测评估数据库的数据。该数据有大量的连接数据记录。每个一记录代表一次网络连接，且每个记录均有41个特征值，其中各个特征的含义不同，大致可分为三类：1）表示网络连接内容特征；2）表示网络连接基本特征；3）表示网络连接流量特征。

模拟的入侵主要有以下四种类型：DOS 、 R2L、U2R、Probing，考虑到设计的实用性分别对三类特征值用神经网络分别进行训练和识别。实验选取了13000组数据进行仿真实验，其中3000组用于训练神经网络，10000组用于系统测试。

3.2 仿真实验结果

对三类特征组的训练集数据应用改进神经网络分别训练出三个神经网络，表示网络连接内容特征的神经网络，表示网络连接基本特征的神经网络以及表示网络连接流量的特征的神经网络在训练成功时的迭代步数分别为7056，386，3030。然后再对测试集数据进行测试，结果如下：

1）表示网络连接内容特征组，利用改进神经网络进行检测识别，结果如表1所示。

2）表示网络连接基本特征组，利用改进神经网络进行检测识别，结果如表2所示。

3）网络连接流量特征组，利用改进神经网络进行检测识别，结果如表3所示：

从表中数据可以看出对常见的四种攻击，不同的特征分组在改进神经网络的作用下检测各有优势。

4 结论

论文采用自动变速率学习法，利用遗忘因子进行微调，同时引入随机优化算子对BP神经网络进行了改进。改进神经网络的收敛速度比经典BP神经网络更快，同时稳定性也较好。并将该算法应用于入侵检测实验，实验结果显示改进后的算法具有较好的识别攻击的能力。

参考文献：

[1] 肖道举，毛辉.BP神经网络在入侵检测中的应用[J].华中科技大学学报，2003（5）.

[2] 汪洁.基于神经网路的入侵检测系统的设计与实现[J].计算机应用与软件，2013（5）.

篇7

关键词：强化学习；神经网络；马尔科夫决策过程；算法；应用

中图分类号：TP18 文献标识码：A 文章编号：1009-3044（2012）28-6782-05

在机器学习领域，大致可以将学习分为监督学习、非监督学习和强化学习三大类。强化学习以其在线学习能力和具有无导师制的自适应能力，因此被认为设计智能Agent的核心技术之一。从20世纪80年代末开始，随着数学基础日益发展的支持，应用范围不断扩大，强化学习也就成为目前机器学习的研究热点之一。在研究过程中，随着各种方法、技术和算法大量应用于强化学习中，其缺陷和问题也就日渐显现出来，寻找一种更好的方式和算法来促进强化学习的发展和广泛应用，是研究人员探讨和研究的重点。因此，神经网络及其算法以其独特的泛化能力和存储能力成为众多研究人员重视的研究对象。

在此之前，已有大量研究者通过神经网络的特性来加强强化学习的效果及应用。张涛[2]等人利用将Q学习算法和神经网络中的BP网络、S激活函数相结合，加上神经网络的泛化能力，不仅解决了倒立摆系统的一系列问题，而且还进一步提高了强化学习理论在实际控制系统的应用。林联明在神经网络的基础研究Sarsa强化算法，提出用BP网络队列保存SAPs，解决由于过大而带来的Q值表示问题[3]。强化学习理论在机器控制研究中也应用广泛。段勇在基于行为的移动机器人控制方法基础上，将模糊神经网络与强化学习理论相结合，构成模糊强化系统，解决了连续状态空间和动作空间的强化学习问题和复杂环境中的机器人导航问题[4]。由此可见，将神经网络与强化学习相结合，已经是现今强化学习研究的重点方向，也已经取得了颇丰的成果。但是，如何将神经网络和强化学习理论更好的融合，选择何种算法及模型，如何减少计算量和加快学习算法收敛速度，以此来推动强化学习理论研究更向前发展，解决更多的实际应用问题，这些依然还是待解决的研究课题之一。下面，根据本人对强化学习的研究，朋友给予的指导以及参照前人的研究成果，对基于神经网络的强化学习作个基本概述。

1 强化学习

强化学习（reinforcement），又称再励学习或评价学习，它是重要的机器学习方法之一，在机器人控制、制造过程控制、任务调配及游戏中有着广泛的应用。

1.1 定义

所谓强化学习就是智能Agent从环境状态到行为映射的学习，并通过不断试错的方法选择最优行为策略，以使动作从环境中获得的累积奖赏值最大。

强化学习状态值函数有三个基本表达式，如下：

这三个状态的值函数或状态—动作对函数的值函数是用来表达目标函数，该目标函数是从长期的观点确定什么是最优的动作。其中[γ]为折扣因子，[rt]是agent从环境状态[st]到[st+1]转移后所接受到的奖赏值，其值可以为正，负或零。其中式（1）为无限折扣模型，即agent需要考虑未来h（[h∞]）步的奖赏，且在值函数以某种形式进行累积；式（2）为有限模型，也就是说agent只考虑未来h步的奖赏和。式（3）为平均奖赏模型，agent考虑其长期平均的奖赏值。最优策略可以由（4）式确定

1.2 基本原理与一般结构

强化学习就是能够和环境进行交互的智能Agent，通过怎样的学习选择能够达到其目标的最优动作。通俗的说，在Agent与环境进行交互的过程中，每个行为动作都会获得特定的奖赏值。如果Agent的某个行为策略导致环境正的奖赏值（强化信号），那么Agent以后产生这个行为策略的趋势就会加强。Agent的目标就是对每个离散的状态发现最优策略以期望的折扣奖赏和最大。

在上述定义中描述了强化学习的三个状态值或函数动作对函数来表达目标函数，可以求得最优策略（根据（4）式）。但是由于环境具有不确定性[5]，因此在策略[π]的作用下，状态[st]的值也可以写为

强化学习把学习看作试探评价过程，可用图1描述。强化学习选择一个动作作用于环境，环境受到作用后其状态会发生变化，从一个状态转换到另一个状态，同时产生一个强化信号反馈给Agent，即奖惩值。Agent接受到奖惩值和环境状态变化，进行学习更新，并根据奖惩值和环境当前状态选择下一个动作，选择的原则是使受到正强化（奖）的概率增大。选择的动作不仅影响立即强化值，而且影响环境下一时刻的状态及最终的强化值。

2 神经网络

2.1 神经网络概述

神经网络是指模拟人类大脑的神经系统的结构与功能，运用大量的处理部件，采用人工方式构造的一种网络系统。神经网络是一种非线性动力学系统，并且具有以分布式存储和并行协同处理的特点，其理论突破了传统的、串行处理的数字计算机的局限。尽管单个神经元的结构和功能比较简单，但是千千万万个神经元构成的神经网络系统所能表现的行为却是丰富多彩的。

单个神经元的模型如图2所示。

人工神经元模型由一组连接，一个加法器，一个激活函数组成。连接强度可由各连接上的值表示，权值为正表示激活，权值为负表示抑制；加法器用于求输入信号对神经元的相应突触加权之和。激活函数用于限制神经元输出振幅。

神经元还可以用如下公式表示

激活函数主要有阈值函数、分段线性函数、非线性转移函数三种主要形式。

一般来说，神经网络在系统中的工作方式是：接受外界环境的完全或者不完全的状态输入，并通过神经网络进行计算，输出强化系统所需的Q值或V值。人工神经网络是对人脑若干基本特性通过教学方法进行的抽象和模拟，是一种模仿人脑结构及功能的非线性信息处理系统。

2.2 强化学习与神经网络的融合

经过研究发现，神经网络的众多优点，可以满足强化学习研究的需要。首先，由于神经网络模仿人的大脑，采用自适应算法，使得Agent智能系统更能适应环境的变化。此外，神经网络具有较强的容错能力，这样可以根据对象的主要特征来进行较为精确的模式识别。最后，神经网络又有自学习，自组织能力和归纳能力的特点，不仅增强了Agent对不确定环境的处理能力，而且保证了强化学习算法的收敛性。神经网络也有无导师学习机制，正好适用于强化学习。

强化学习和神经网络的融合重点在于如何运用神经网络多重特性，能够快速高效地促进Agent智能系统经历强化学习后，选择一条最优行为策略来满足目标需求。强化学习的环境是不确定的，无法通过正例、反例告知采取何种行为。Agent必须通过不断试错才能找到最优行为策略。但是在此过程中，会遇到许多问题，比如输出连续的动作空间问题，但可利用神经网络的泛化特征，实现了输出在一定范围内的连续动作空间值[2]。所以，简单的讲，将神经网络和强化学习相融合，主要是利用神经网络强大的存储能力和函数估计能力。目前，在函数估计强化学习研究上，神经网络是研究热点之一。

3 马尔科夫决策过程

本文主要论述马尔科夫型环境下的强化学习，可以通过马尔科夫决策过程进行建模。下面给出其形式定义：

基本的POMDP由四个元组成：。S是指一个环境状态集，可以是有限的，可列的或者任意非空集；A为Agent行为集合，用A（s）表示在状态s处可用的决策集；奖赏函数R（s，a）：[A×S]->Real；T：[A×S]->PD（S）；T（s，a，s'）为Agent在状态s采用a动作使环境状态转移到s'的概率。

一个有限的马尔科夫决策过程有5元组成：；前四个元与上述是一致的，V为准则函数或者目标函数[3]，常用准则函数有期望折扣总报酬、期望总报酬和平均报酬等并且可以是状态值函数或状态-动作对值函数。

马尔科夫决策过程的本质是：当前的状态转变为另一个状态的概率和奖赏值只取决于当前的状态和选择的动作，与过去的动作和状态无关。所以，在马尔科夫环境下，已知状态转移概率函数T和奖赏函数R，可以借助于动态规划技术求解最优行为策略。

4 改进的强化学习算法

到目前为止，强化学习领域提出的强化学习算法层出不穷，如Sutton提出的TD算法[6]，Watkins提出的Q-Learning算法[7]，Rummery和Niranjan于1994提出的Sarsa算法[8]，以及Dyna-Q学习算法[9]等。致力于这方面研究的研究人员，都在极力寻找一种既能保证收敛性，又能提高收敛速度的新型学习算法。本文主要在基于神经网络的特性，研究并提出改进的强化学习算法。

4.1 基于模糊神经网络的Q（[λ]）学习算法

Q学习算法是强化学习领域重要的学习算法之一[7，10]，它利用函数Q（x，a）来表达与状态相对应的各个动作的评估。Q学习算法的基本内容为：

（1）任意初始化一个Q（x，a）

（2）初始化 s

（3）从决策集中随即选择一个动作a

（4）采取动作策略a，观察[r，][s]'的值

（5）计算 [Qs，aQs，a+αr+γmaxa'Qs'，a'-Qs，a]，（11）

（7）重复（2）-（6）步，直到s终结。

式（11）使用下一状态的估计来更新Q函数，称为一步Q学习。将TD（[λ]）的思想引入Q学习过程，形成一种增量式多步Q学习，简称Q（[λ]）学习[11]。步骤与Q算法类似，其计算公式如下：

如果 [s=st，a=at]，则[Qst，at=Qst，at+αtγt+γtetst+at]；（12）

4.2 基于BP神经网络的Sarsa算法

描述如下：（1）H是用于保存最近访问的Q值，当满的时候送至神经网络训练。

如果表H已满，则利用H中的样本对网络进行训练，版本号自动增加1

若网络队列q也已满，则队尾元素出队，把新训练的神经网络入队q；

清空训练集；

该算法的主要贡献是引入神经网络队列保存大量的Q值表，从来降低了保存大量Q值所要花费大量的内存空间，更重要的是解决了单个神经网络“增量式”学习所带来的“遗忘”问题。

5 强化学习应用

由于强化学习在算法和理论方面的研究越来越深入，在大空间、复杂非线性控制，机器人控制、组合优化和调度等领域呈现出良好的学习性能，使得强化学习在人工智能，控制系统，游戏以及优化调度等领域取得了若干的成功应用，而本文主要介绍基于神经网络的强化学习算法在某些领域的应用。

在非线性控制系统方面，张涛等人[2]将BP网络运用于 Q-Learning算法中，成功解决了连续状态空间的倒立摆平衡控制问题和连续状态空间输入、连续动作空间输出的问题，从而提高了强化学习算法的实际应用价值；在机器人控制方面，应用更为广泛，Nelson[13]等人考虑了基于模糊逻辑和强化学习的智能机器人导航问题，并且段勇等人[4]基于该理论，成功地将模糊神经网络和强化学习结合起来，采用残差算法保证函数逼近的快速性和收敛性，有效地解决了复杂环境下机器人导航的问题。在游戏方面，Tesauro采用三层BP神经网络把棋盘上的棋子位置和棋手的获胜概率联系起来，通过训练取得了40盘比赛中只输一盘的好战绩[14]。在优化调度方面，主要包括车间作业调度，电梯调度以及网络路由选择等，Robert Crites等[15]将强化学习和前馈神经网络融合利用，以最终实验结果表明为依据，证明了该算法是目前高层建筑电梯调度算法中最优算法之一。

6 结束语

本文将强化学习和神经网络相融合，介绍利用神经网络强大的存储能力、泛化能力及函数估计能力，可以解决强化学习领域遇到的连续状态和动作输入、输出的问题，学习状态空间过大的问题以及不确定环境处理的问题等。基于此，主要论述了三种神经网络和强化学习的改进算法，它们都综合了神经网络的特性。最后，简单介绍了目前基于神经网络的强化学习应用的成功实例。目前，利用神经网络进行强化学习依然是研究热点课题之一。

参考文献：

[1] 高阳，陈世福，陆鑫. 强化学习研究综述[J].自动化学报，2004，30（1）：86-100.

[2] 张涛，吴汉生.基于神经网络的强化学习算法实现倒立摆控制[J].计算机仿真，2006，23（4）：298-300.

[3] 林联明，王浩，王一雄.基于神经网络的Sarsa强化学习算法[J].计算机技术与发展，2006，16（1）：30-32.

[4] 段勇，徐心如.基于模糊神经网络的强化学习及其在机器人导航中的应用[J].控制与决策，2007，22（5）：525-529.

[5] 刘忠，李海红，刘全.强化学习算法研究[J].计算机工程与设计，2008，29（22）：5805-5809.

[6] Sutton R S.Learning to predict by the methods of temporal differences.Machine Learning，1988，3：9-44.

[7] Watkins P.Dayan.Q-Learning.Machine Learning，1992，8（3）：279-292.

[8] Rummery G，Niranjan M. On-line Q-Learning using connectionist systems. Technical Report CUED/F-INFENG/TR 166，Cambridge University Engineering Department，1994.

[9] Sutton R S，Barto A G， Williams R. Reinforcement Learning is direct adaptive optional control.IEEE Control Systems Manazine，1991，12（2）：19-22.

[10] Sutton R S， Barto A G. Reinforcement Learning： An introduction[M].Cambridge：MIT Press ，1998.

[11] Peng J ， Dayan P. Q-learning [J]. Machine Learning，1992，8（3）：279-292.

[12] Kelley H J ， Cliff E M， Lutze F H. Pursuit/evasion in orbit[J]. J of the Astronautical Sciences， 1981， 29（3）：277-288.

[13] NELSON H C， YUNG. An intelligent mobile vehicle navigator based on fuzzy logic and reinforcement learning [J].IEEE Trans on Systems， Man and Cybernetics， Part B： Cybernetics，1999，29（2）：314-321.

篇8

>> 网络交易信用风险的防范分析我国网络购物的信用风险研究基于复杂网络的信用风险传染模型研究基于神经网络的信用风险预警研究信用风险分析方法的发展网上交易信用风险评价研究：基于网上拍卖的卖方视角银行间市场交易系统的信用风险模块设计研究网络银行个人客户信用风险评价研究网络借贷信用风险管理体系研究综述信用风险研究分析基于BP神经网络的农户小额信贷信用风险评估研究基于模糊神经网络的企业信用风险评估模型研究基于BP神经网络的商业银行信用风险评估模型研究网络借贷平台信用风险的测度和控制研究基于P2P网络借贷的信用风险管控研究商业银行信用风险评价方法研究基于信用风险与ABC分类方法分析的应收账款研究基于 Fisher判别方法的信用风险评估实证研究信用风险评估中的财务分析方法信用风险的变革常见问题解答当前所在位置：.

[2]倪翠云.我国网络购物的信用风险研究[J].中国集体经济，2011（6）：61-62.

[3]于鸣燕.人工神经网络在金融领域信用风险评估中的应用[D].南京理工大学，硕士论文，2007-06.

[4]冯炜.消费者网络购物信任影响因素的实证研究[D].浙江大学，博士论文，2010-06.

[5]洪琼.C2C交易模式下诚信问题的研究[D].安徽理工大学，硕士论文，2009-06.

[6]周艳美，李伟华.改进模糊层次分析法及其对任务方案的评价[J].计算机工程与应用，2008（5）：212-214.

[7]刘巧玲，张金城.在线拍卖信用行为的博弈分析[J].商业研究，2007（8）：211-214.

篇9

关键词：神经网络；预测；剩余油气；模式识别；训练

中图分类号：TP18 文献标识码：A 文章编号：1009-3044（2015）09-0200-02

Abstract： The paper is aimed at the problem of traditional exploration methods can not predict the remaining oil and gas accurately， the methods of fuzzy theory and self-organizing map are approached. It takes the advantage of Fuzzy neural network system converging faster and higher prediction accuracy， as well as the unsupervised competitive learning mechanism of self-organizing map， it achieves the goal of predicting the remaining oil and gas. The method of neural network improve the precision of remaining oil and gas， it obtains better effect of prediction.

Key words： neural network； predict； remaining oil and gas； pattern recognition； train

石油是国家经济发展的命脉，油气勘探开发则是石油工业的基础，在国民经济的地位举足轻重。随着地震勘探理论方法日趋成熟，我国各大油气田勘探程度相继提高，油气田已经被大幅度开采。然而我国的石油平均采收率并不高，约为30%多一点，还有近70%的油气并未采收，传统的油气勘探方法已经不能满足增加石油的采收率。当前我国各大油田的地质勘探工作已经进入中后期，迫切需要一些新的方法研究方法和技术，对油气田剩余油气的分布和变化趋势做出预测，以便在寻找新的勘探开发领域，同时也能继续对老油气田进行挖掘，从而提高油气产量。

近些年来，随着神经网络技术[1]的日趋成熟，基于模式识别的各类方法技术，如统计模式识别、神经网络、模糊判别等技术和理论在剩余油气预测方面都得到了较多的应用，也取得了较好的结果。其中模糊理论具有很强的表达能力并且容易被人理解，神经网络的自适应学习能力很强。由于模糊理论和人工神经网络各自的优点，常常被单独或者是组合起来运用到实践中，本文主要介绍神经网络的方法运用于预测剩余油气的工作中。

1 模糊理论

1.1 发展历程

1965年美国加州大学伯里克分校的扎德教授首先创立了模糊集合的数学理论，随后P.N.Marions也开始从事相关研究，于1966年发表了一份关于模糊逻辑的研究报告。1974年扎德教授作了模糊推理的研究报告，同年英国的E.H.Mamdanl运用模糊逻辑和模糊推理首次实现了蒸汽机的实验性控制，从此模糊理论的雏形形成了，随后模糊理论[2]掀起了一波热潮。

1.2 在剩余油气预测中的应用

在预测剩余油气[3]的实践中，首先对地震资料做初步的特征提取，然后将提取的样本用模糊理论的聚类方法进行训练，对训练样本进行几类。每类都有各自对应的神经网络，用专属于每类的样本依次训练各自对应的神经网络。具体步骤如下：

1）流体属性的提取

流体属性数据是三维数据，属性的提取方法依赖于具体的物理问题与数据网格的划分。三维数据场属性边界的提取所采用的方法是求出网格点的梯度，特征区域一般是梯度模值较大的区域。对于均匀的三维网格，估计其梯度的方法可采用三维差分。为得到网格点上的梯度值，简单的方法是利用前、后、左、右、上、下六个邻近点的场值进行简单的差分估计。在计算流体力学问题中，采用的网格大都是结构化网格，为计算网格点上的梯度，需将网格变换为均匀规则正交网格。设三维网格交换为[x=T1（ξ，η，?）]，[y=T2（ξ，η，?）]，[z=T3（ξ，η，?）]，在点（m，n，p），其场值梯度在两种网格上的关系式为：

[?f?ξ?f?η?f??=?f?x?f?y?f?z?x?ξ?x?η?x???y?ξ?y?η?y???z?ξ?z?η?z??]

2）模糊系统处理流体属性

确定输入输出的学习样本[（αK，βK，γk）]，k为样本个数。利用模糊聚类的方法将输入样本分成N类，N类样本对应N条神经网络。利用各自的样本训练各自的神经网络，选择合适的学习样本，系统经过多次样本训练和样本学习之后，优化出一部分识别精度高的样本，优选的样本到达能辨别精度后，将该样本输出，这样就可以被识别了。

2 自组织神经网络

2.1 结构与工作过程

自组织神经网络是上世纪80年代芬兰Helsink大学的Kohonen在Willshaw与Von der Malsberg在的工作上，结合对自然界中的生物神经系统的理解，创建Kohonen模型，又称Kohonen网络。自组织神经网络[4]的特征映射是基于生物的大脑神经系统，模拟它的自组织特征映射机制，在样本训练中有很强大学习能力，在组织学习中不需要监控，是一种无监督竞争式学习的前馈网络。自组织神经网络通过学习，从而提取某组数据中的某种重要特征或内在规律，按离散时间的方式进行分类。网络可以把任意高维的输入作为输入神经元，映射到低维空间得到输出神经元，并且使得输入神经元内部的某些相似性质表现为几何上邻近的特征映射，这就是人们常说的降维处理。这样输出神经元会聚集成一个输出层，输出层就可以绘制成一维或二维离散几何图形，并且其拓扑结构保持不变。此分类反映了样本集之间的本质区别，大幅度降低了一致性准则中的人为因素。

如图1所示，SOM网络是一种比较简单的双层网络，由若干输入神经元和输出神经元组成。输入层与输出层各神经元之间实现了全部互相直接或间接的连接方式，每个输出神经元可通过可变连接权与所有输入神经元相连，且输出神经元间存在局部相互连接。每个连接都具有对应的连接权值，用于表示该连接的强度。各个神经元的连接权值均具有一定的分布，每个输入神经元与输出神经元之间的联系通过连接权来传达。输出层的神经元之间实行侧向连接，相邻的神经元相互激励，距离较远的神经元则相互抑制，然而超过了一定的距离的神经元又具有较弱的激励作用，最后剩下的一个神经元或一组神经元，则反映该类样本的属性。

2.2 预测剩余油气的步骤

1）根据勘探数据体提取流体属性[5]，并对其进行预处理。

2）优选出所要了解的流体属性，对其进行降维压缩，将压缩集作为模式识别的输入，以统计的油气储层参数作为输出来训练组组织神经网络。

3）利用模式识别[6]参数和降维压缩集对储层的油气进行预测，从而得到如今的剩余油气的分布。

3 结束语

本文针对传统油气勘探的方法难以满足预测油气田剩余油的难题，着重介绍了模糊理论和自组织神经网络的方法，这两种神经网络的方法各有优势。其中模糊神经网络的系统训练和学习速度快，收敛较快，预测的精度高。自组织神经网络的竞争模式起到了快速优选的作用，神经元之间的协作模式在某种意义上则缩短了整个流程的工作时间。总而言之，神经网络的技术与方法在预测油气田的剩余油气的实践中取得了不错的成果。

参考文献：

[1] 汪镭，周国兴，吴启迪.人工神经网络理论在控制领域中的应用综述[J].同济大学学报：自然科学版，2001，03：357-361.

[2] 王晓军，杨海峰，邱志平，等.基于测量数据的不确定性结构分析的模糊理论[J].北京航空航天大学学报，2010，08：887-891.

[3] 熊艳，包吉山，肖慈.模糊神经网络预测储层及油气[J].石油地球物理勘探，2000，02：222-227.

[4] 易荣庆，李文辉，王铎.基于自组织神经网络的特征识别[J].吉林大学学报：工学版，2009，01：148-153.

篇10

关键词：油；水分；爆裂法；小波变换；神经网络

中图分类号：TE622.1 文献标识码：A

0 前言

在机械设备的油管理中，水分含量是一个非常重要的指标，且机械设备在运行时，由于水封的失效或损坏,热交换器的腐蚀或损坏,潮湿空气的原因，水侵入油系统是不可避免的［1］。油含水超标将会导致油膜失效、油系统部件的腐蚀和锈蚀、油乳化、添加剂失效等严重后果［2］。目前，常见的油水分测量方法有卡尔―费休法、蒸馏法、重量法、介电常数法、微波衰减法、华特斯摩试纸法和爆裂法等，其中卡尔―费休法、蒸馏法和重量法属于实验室分析方法，介电常数法和微波衰减法可用于现场测量，但影响因素较多，不能有效地进行油水分含量的判断，而华特斯摩试纸法和爆裂法属于定性的判断方法。本文以爆裂法为基础，对其进行半定量研究，着重研究了如何判断油中的水分含量是否超标的方法。

BP神经网络是自20世纪80年展起来的一种新的模式识别方法，它以其良好的非线性映射特性和自适应、自学习能力在模式识别、函数逼近和分类、数据压缩等领域得以应用，并取得了一定的研究成果。文中基于油水分定性实验的爆裂声信号，构造了相应的BP网络目标识别模型，仿真实验结果表明，该方法对于半定量的确定油中水分含量是可行的，为现场测量油中水分含量提供了新的思路和方法，具有一定的理论价值和实际意义。

1 基本原理

1.1 油水分定性实验法

将盛有试样的试管垂直地插入热油浴中，仔细观察试管及试样若干分钟，直至试样温度达到150 ℃为止。如试样中有水分时，即发生泡沫，可以听到噼啪的爆裂响声，甚至试管会发生震动或颤动，高出浴面的油层会变成浑浊［3］。

1.2 小波变换及能量分布特征提取

若ψ(t)∈L2(R)且满足容许性条件

1.3 BP神经网络模型及算法

BP神经网络(Back propagation Neural Network，简称BP网络)也称误差反向传播神经网络，它是由[HJ]非线性变换单元组成的前馈网络。BP神经网络是人工神经网络中应用最广的一种神经网络。BP神经网络的拓扑结构如图1所示。这种网络的特点是：①一般由输入层、输出层和隐层3部分组成，隐层可以为一层或多层。根据Kolmogorov定理，1个3层的BP网络足以完成任意的n维到m维的映射，即一般只需1个隐层就够了；②输入信号从输入层节点，依次传过各隐层节点，最后传到输出层节点，每一层节点的输出仅影响下一层节点的输出。在确定了BP网络的结构后，利用输入输出样本集对其进行训练，也即对网络的权值和偏差进行学习和调整，以使网络实现对给定输入输出关系的映射，并使其具有泛化（Generalization )功能。对于样本集合:输入xi(Rm)和输出yi(Rn)，可以认为存在某一映射g，使g(xi)=yi,i=1, 2,…，P。现要求出一映射f,使得在某种意义下(通常是最小二乘意义下)，f是g的最佳逼近［5］。

BP算法包括信息的正向传播和误差的反向传播，不断修正权值和误差，使网络输出层实际输出与期望输出的误差平方和达到最小。由于这种算法采用非线性规划中的最速下降法，按误差函数的负梯度方向修改权系数，因此存在学习效率低，收敛速度慢；易陷于局部极小状态；网络的泛化及适应能力较差等缺点。为了解决这些问题，出现了很多BP改进算法，文中采用附加动量项的方法。

2 油水分测量研究

2.1 爆裂实验

2.1.1 仪器和材料

仪器：声传感器，PULSE系统，PC机，电炉和50 mL烧杯。

材料：CD 40油。

2.1.2 实验内容

该实验采用丹麦PULSE系统和Microphone 4189A21型传感器采集含水油爆裂实验中的声信号。在实验过程中，每次取5 mL试样置于烧杯中，用电炉加热。PULSE系统分析带宽设为0～25.6 kHz，频谱线数设为1600。根据GB/T 7607-1995柴油机油换油指标，当油中水分含量大于0.2%时需要对油进行更换。因此，在实验中，分别选取4组浓度小于0.2%的含水油（浓度分别为0.068%、0.093%、0.13%和0.17%）和3组浓度大于0.2%的含水油（浓度分别为0.25%、0.30%和0.50%）作为实验对象。

2.2 油水分测量研究

含微量水分的油是典型的油包水型分子基团,油是连续相,水是分散相，由于油的沸点比水高,受热后水总是先达到沸点而蒸发或沸腾。当油滴中的压力超过油的表面张力及环境压力之和时,水蒸气将冲破油膜的阻力使油滴发生爆炸,发出爆裂声，同时形成更细小的油滴,这就是微爆效应［6］。另外，微爆发生的强弱与油的品种及含水量有关［7］。因此，文中利用二进小波变换来提取尺度空间上的能量分布作为BP神经网络的输入特征向量。基于小波变换和BP神经网络的油水分测量研究过程如图2。

2.2.1 能量分布特征提取

首先，对每个浓度的试样采集10组数据，共70组数据，选40组作为训练样本，其中浓度0.068%、0.093%、0.13%和0.17%的各5组，浓度0.25%和0.30%的各7组，浓度0.50%的6组，其余30组作为测试样本，其中0.068%、0.093%、0.13%和0.17%的各5组，浓度0.25%和0.30%的各3组，浓度0.50%的4组。对这70组数据进行6层小波分解，采用db4小波，计算各个高频分量的能量，这样每个能量特征向量的维数就是6，总共有40组训练样本和30组测试样本。图3～图5分别为浓度为0.069%的含水油（合格）加热时发生微爆效应所采集到的原始信号以及6层小波分解后得到的近似信号和细节信号。

2.2.2 BP神经网络分类器的实现

根据Kolmogorov定理，采用一个N×2N+1×M的3层BP网络作为状态分类器。其中，N表示输入特征向量的分量数，M表示输出状态类别总数。由此可得，该BP网络结构为：输入层有6个神经元，中间层有13个神经元，输出层有2个神经元，用（0,0）表示合格，（1,0）表示不合格，中间层神经元的传递函数为S型正切函数，输出层神经元的传递函数为S型对数函数。然后，利用训练样本对该BP神经网络进行训练，经过2432次训练后，网络的均方误差落在所设定的0.00001以内。训练曲线如图6。

最后，利用训练好的BP神经网络，把30个测试样本输入到神经网络，根据BP神经网络的实际输出对油含水量是否合格进行判断，结果如表1。

观察BP神经网络输出结果可以发现，根据BP神经网络输出结果判断的油含水量与实际结果完全一致，表明该BP神经网络分类器可以准确的判断油中含水量是否合格。

3 结论

文中基于小波变换和BP神经网络理论，构造了一个BP神经网络分类器，并成功地应用于油中水分含量的判断。实验结果表明：该方法能有效地进行油含水量合格与否的判断，从而为研究油水分含量的测量提供了新的思路和方法。

另外，文中在实验时只选取了7种浓度的溶液，且溶液的浓度差别相对较大。因此，溶液的浓度相差较小时是否可以用该方法进行有效的判断以及是否可以对分类结果进行更具体的分类将是下一步研究的重点。

参考文献：

［1］李廷朝，程素萍.油聚结脱水技术［J］.液压与气动，2003（1）：41-42.

［2］郭洪波,张志强,于达仁，等.透平油微水含量在线检测方法研究综述［J］.汽轮机技术，2001，43（2）：65-67.

［3］ SH/T 0257-92 油水分定性实验法［S］.

［4］郑海波，陈心昭，李志远，等.小波神经网络故障诊断系统的设计与应用［J］.农业机械学报，2002，33（1）：73-76.

［5］焦李成.神经网络系统理论［M］.西安:西安电子科技大学出版社，1996.

［6］ Wang C H,Law C K. Micro-Explosion of Fuel Droplets UnderHigh Pressure［J］. Combust Flame,1985(59)：53-62.

篇1

篇2

篇3

篇4

篇5

篇6

篇7

篇8

篇9

篇10

免责声明

AI创作文章

热门标签

相关文章

相关期刊

中国神经肿瘤

现代神经疾病

中国神经免疫学和神经病...

国际神经病学神经外科学

精品范文

学术顾问