神经网络的运用范文
时间:2024-03-28 18:14:37
导语:如何才能写好一篇神经网络的运用,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
关键词:瓷砖表面缺陷;布尔神经网络;瓷砖检测
中图分类号:TP274 文献标识码:A 文章编号:1009-2374(2013)30-0031-02
过去的神经网络没有解释能力,其不能很好地观测物体内部机理构造,而本文所论述的布尔神经网络是在过去神经网络上的一种升级,它将原始数据按照某种规则进行了编码,然后利用编码后得到的数据信息来重新驱动网络,其各个节点具备有效的物理意义。当前瓷砖表面的缺陷依据瓷砖不规则性及颜色可分为几种,按照缺陷所对应的类型可选择使用不同的滤波器来进行检测,因为缺陷瓷砖表面通常存在不规则形,所以滤波器在使用过程中有着极大的局限性,针对缺陷本身来说,虽然不同的瓷砖产品有着一定的差异,但是同种瓷砖又基本保持不变。而布尔神经网络其可在大范围内有效控制检测的精度及速度,并具有智能型,因此对它的研究将具备极为重要的现实意义。
1 布尔神经网络应用背景
随着社会经济的不断发展,客户对各类型产品表面的质量要求越来越苛刻,表面质量已经成为了直接决定产品价格及各个企业之间竞争的重要指标,另外,过去的人工目视检测方法存在很多的缺陷及不足,如无法适应高速机组,对细小表面缺陷的检测效率极低,并且如果长期进行检测,检测人员易出现视觉疲劳而无法长时间有效地进行整个材料表面的检测。总之,传统的检测已经无法满足现代化生产的需要。在这种背景下,新的检测方法必然出现,而其中布尔神经网络的应用就是其中的一种有效的检测手段。
2 广义的布尔神经网络
过去的BP网络在分类上属于一种分层网络,其各个节点域下一层节点在连接时通常是完全均匀的,而这种均匀直接连接在图像感知时通常会致使网络感知能力受到限制,但是广义的布尔神经网络是通过研究过去的前向神经网络的优点及缺陷之后升级而来。如果单独从数据驱动方面来讲,布尔神经网络也可叫做前向传播网络。在该网络中其各个权重和神经网络只能取值两个,分别为{-1,1}、{0,1},其阈值也被限定为整数。
但是在具体进行运算阶段通常是使用二进乘法、整数加法、比较操作法等几种方法,因此与传统的方法相比较其运算速度得到了提高,另外,这种网络在训练阶段因为不存在反向传播过程,所以其不需要反复迭代,这使得其运算速度又得到了进一步提高。
设总数是K的训练样本为ak,当,根据样本ak,可计算对应的权值wk=2ak-1,由于ak的取值范围在[0、1],因此,其第k节点的阈值表达式为:
在该式中rk表示神经网络第k节点的吸引域,在该吸引域中心是该神经网络的权重矢量中心wk,而在对样本进行具体检测时通常应用的方法为汉明距离测量法,如果测试样本在进入某节点吸引域,那么对应的节点则被激活,其值显示为1。
2.1 布尔神经网络检测流程
布尔神经网络是一种三层网络,如图1所示,其第一层通常设置为输入层,在进行检测过程中在该层输入标本模式数据,在分类过程则输入采样样本数据信息,其第二层通常是以C个节点所组成,其各个节点都与输入点相互连接,各个节点均有三个相同的参数,即权重、阈值及吸引域,这些参数必须要由训练算法来求算,第三层包括两个节点,分别是接受节点与拒绝节点,接受节点的阈值为1,和各个种类的节点相互连接的阈值也是1,拒绝的节点的阈值则为θ,其和第二层的连接权重则为-1,当种类层中出现多个节点是1的时候,那么接收点将被激活,与之相反当所有的种类节点显示为0时,那么拒绝节点将被激活,说明该次输入为奇异点,也叫做缺陷点,进而完成对缺陷的检测。
2.2 布尔神经网络的连续特征值
以上所述的布尔神经网络需要输入的驱动数据是二进制数,但在实际运用过程通常是连续值,因此必须要对该网络所对应的连续特征值进行研究,首先要对连续值做好编码,将这些数据信息转化为和其完全对应的二进制数,而其具体的网络结构图如图2所示,该处通常利用温度计进行编码,在实际操作过程中使用一连串的1来对连续值进行对应表示。因为其存在对应关系,因此该串1的长度和连续量的值一般为正比关系,在具体进行编码过程中,由于要对一些特征值进行归一化数,导致同类型的特征值在差异方面出现了更大的变化。
2.2.1 编码算法。(1)对所有的特征值进行归一化,让其值的分布区间在[0,1],即以其最大值除去其所有的同种特征值。(2)选定一个有效的正整数,称编码为阶次,使用该阶次与所得归一化特征值相乘,再加上0.5,并和其最为靠近的整数相互替换,最后将特征值变为正整数,使其分布区间为[1,阶次+1]。(3)将相互替换得到的整数变为二进制数,如果所得二进制数的阶次为5,则第4的编码为111100。
2.2.2 训练计算。首先将训练获取的数据及信息逐一离散化、归一化,其次构建好网络,依据一定的规律在训练过程中有序的增减种类节点,接着对特征节点所对应的阈值依据二进制布尔神经网络的训练方式来求算,通常情况下训练节点的权重是1,而其阈值和所对应连接特征数其对应的权重及阈值均是1。
2.2.3 分类计算。(1)对输入的样本信息进行归一化并进行编码转换。(2)假设拒绝节点显示为1,那么根据第四步进行。(3)种类节点的阈值必须加1。(4)如果拒绝节点显示为1,则根据第五步或者根据第三步进行。(5)种类层其节点在进行计算时必须要减1,另外需要读取的种类节点也是1,并且在进行检测时确定其所属的种类。(6)将各种类层所对应节点的阈值减去2,并进行再次分类。
3 分层进行检测
在具体利用布尔神经网络检测瓷砖表面缺陷过程中,除了必要的将网络分类中权重及阈值除去外,还要求对神经节点的各个吸引域做好对应的控制,但是其对一些较大的吸引域做出的结果往往很是粗糙,这致使虚警出现的概率大大地增加,另外也会导致漏警出现的概率增加。在进行分层检测时,对于存在差异的分辨率要求适应不同的吸引域,对一些较低分辨率要求采用较大的吸引域,随着进行逐层检验还需要缓慢减小吸引域,最终使得检验精度得到有效提高,因为对下层的检验是在上层检验结果出现之后才进行的,所以排除了吸引域,因此使得检验精度得到不断提高。从图像显示来说,图像结构包含K个层次,其中不同的层次在组合过程中其分辨率存在差异,最底层是由最初的输入图像,而在塔形k+1层则是下层元素在该基础的一种简单变换,另外第k层的元素比k+1层要多,这就呈现了一种塔形结构,因此对输入客体来讲,其叙述的准确性相对K层来说较为粗糙,最后顶层所具有的的元素应该
最少。
4 布尔神经网络方法的运用方向
一般来说瓷砖表面出现的缺陷主要为刮痕、裂纹、斑点及针孔,其中针孔缺陷在进行检测时通常是根据其的反射性质,并通过线型CCD来完成检测的,而本文所述的检测手段仅对瓷砖表面的刮痕、裂纹及斑点进行检测,由于瓷砖本身的大小及形状有着极大的不确定性,所以使用本文所述的方法进行瓷砖的缺陷检测比传统滤波器检测效果
更好。
5 结语
本文主要阐述了对瓷砖表面缺陷检测过程中布尔神经网络技术的一些简单运用,其具体分为两个阶段,即训练阶段与检测阶段,为了测试检测的正确性,通常是将同一块砖的无缺陷部位来作为检测的训练样本,而将其中的缺陷部分进行检测,工作时充分利用以下三个参数:方差、能量、均值,在数字化过程中要求取阶次N=10,这样可直接获取[1,11]位所对应的二进表达,因为使用了温度进行编码,所以整个过程一定要以值的大小来做基础参考,从实验结果来看,利用本文所述的方法来检测,对缺陷的检出率得到了有效提高。
参考文献
[1] 戴哲敏,许增朴,于德敏,王永强.计算机视觉在
瓷砖表面颜色匀度分析中的应用[J].中国陶瓷工业,
2002,(4).
[2] 吴平川,路同浚,王炎.机器视觉与钢板表面缺陷的
无损检测[J].无损检测,2000,(1).
[3] 赵海洋,冯心海,薛钧义,江显异.基于机器视觉的
瓷砖表面质量分析与检测[J].西安建筑科技大学学报
(自然科学版),2000,(1).
[4] 罗玮,彭复员,柳健.彩色瓷砖的自动分类系统[J].
篇2
一般而言,计算机网路安全管理指的是计算机在连接网络后进行信息的交换、浏览以及下载的过程中,对信息安全进行有效的管理,防止信息被他人窃取或者破坏。随着信息时代的到来,越来越多的人对计算机产生了很强的依赖,从儿童到老年人,计算机的影响无处不在,随着计算机的普及,人们在使用计算机的过程中对其安全性就有了顾忌。对于计算机网络,只要连接互联网,随时都存在被攻击的可能,相对而言,没有任何计算机是绝对的安全或者是不受到任何的攻击。运用计算机网络技术进行攻击或者盗取个人信息或者是企业信息的事件凡乎每年都会发生,计算机网络存在严重的安全隐患。所以,要及时的认识以及了解计算机网络面临的安全隐患,积极的采取相应的措施加强对计算机网络安全的管理
2神经网络在计算机网络安全管理应用的现状
2.1对神经网络在计算机安全管理运用中的重视程度不够。计算机网络安全是因特网发展的最基础的目的,但与此同时近乎所有的计算机网络在开创以及不断的发展过程中都趋向于实用以及便利,相反却在一定程度卜没有重视对计算机的安全管理,更没有将神经网络技术运用到计算机的安全管理中,进而对计算机网络的安全管理留下了严重的隐患。另外,神经网络在计算机网络安全管理中主要是对计算机的网络安全进行评估,然而由于不重视对神经网络在计算机网络安全管理中的运用,使得没有建立良好的计算机网络安全评价标准体系。
2.2对神经网络在计算机网络安全评价模型的设计和实际运用不够合理。一般来说,神经网络在计算机网络安全管理中主要是对计算机网络安全进行一定的评估,在对其进行评估的过程中,就需要设计一定的计算机网络安全评价模型,主要包含刊浦俞入层、输出层以及隐含层的设计;但是,目前神经网络在计算机网络安全管理中对于评价模型的设计还没有将这三方面有效的联系起来、除此之外,对神经网络在计算机网络安全管理的实际运用中,不能科学、合理的实现计算机网络安全管理评价模型运用,不注重对评价模型的学习以及不关注对评价模型进行有效的验证。
3加强神经网络在计算机网络安全管理中的应用采取的措施
3.1神经网络在计算机网络安全管理中要科学、合理的设计网络安全评价模型。神经网络在计算机网络安全管理中要科学。合理的设计网络安全评价模型,以便更好的实现计算机网络安全、高效的运行。为此,计算机网络安全评价模型需要进行一下设计:首先是对输入层的设计,一般来说,神经网络在计算机网络安全管理运用中,对于输入层考虑的是神经元的节点数以及评价指标的数量,尽可能的使这两者数量保持一致。其次是对隐含层的设计,对于隐含层的设计需要注意的是若某个连续函数在任意的闭区间中,可以通过在隐含层里的神经网络来靠近,大多数情况下,神经网络通常运用的是单隐含层。最后是输出层的设计,神经网络的输出层设计主要是获得计算机网络安全管理评价的最终结果,例如可以设置计算机网络安全管理评价的输出层节点数为2,那么相应的输出结果(l,)l指的是非常安全、(o,)l指的是较不安全、(,l山指的是基本安全以及(,0切指的是非常的不安全。
3.2神经网络在计算机网络安全管理运用中要对评价模型进行有效的验证。需要注意的是,神经网络在计算机网络安全管理运用中要对评价模型进行有效的验证,一般体现在一下几方面:首先是要关注评价模型的实现,为了实现神经网络在计算机网络安全管理中的良好运用,就要依据客户满意的评价模型,运用计算机网络技术创建设置含有输入层、隐含层以及输出层的神经网络模型,然后再对网络安全进行检验。其次是要注意对评价模型的学习,在对计算机网络安全进行评价之前,需要对神经网络进行标准化的处理,才能尽可能的减少对计算机网络安全管理评价中的误差。最后要注意对评价模型进行验证,当神经网络经过标准化处理以及在计l章机网络安全评价之后,就需要刊输出的结果进行一定的验证,以便确定神经网络对计算机网络安全的评价输出结果是否与期望的评价结果相一致,进一步验证神经网络在计算机网络安全管理中安全评价模型的准确与否。
3.3重视神经网络在计算机网络安全管理运用以及建立健全安全评价标准体系。神经网络在计算机网络安全管理运用中主要的任务是对计算机网络的安全进行一定的评价,并且将评价的结果准确、及时的反馈给用户,所以就应该对其在计算机网络安全管理中的应用引起高度的重视,为此就应该建立健全计算机网络安全管理的评价标准体系。一方面是评价指标的建立,计算机网络安全管理是复杂的过程,同时影响计算机网络安全的因素比较多。因此,建立科学、合理以及有效的计算机网络安全管理评价标准,对于神经网络高效的开展评价工作有很大的关联。另一方面是刊评价标准的准确化,影响计算机网络安全管理的因素非常的多,就应该对各种评价标准进行细化,以达到评价的准确。
4结束语
篇3
关键词 人工神经网路 林分材种出材率 BP算法
引言
林分材种出材率是林分调查工作的重要指标,它可以进一步评价森林木材资源的经济价值,而研究森林木材,又可以合理正确的经营森林资源,达到人与自然和谐相处的目的。林分林种出材率就是原木材积于立木材积之比,我国现行的森林采伐限额制度、查处乱砍滥伐林木案件、制订林业发展规划、计划和编制森林经营方案、预测和计算、开展森林资源资产评估等等,都需掌握积蓄量和材种的出材率的指标。我国已经不断学习借鉴前苏联的先进技术编制自己的材种出材率表了,随着我国天然林保护工程的全面实施和林业分类经营的逐步推行,人工商品林比例的不断提高,我国森林结构和性质也有所变化,所以传统的统计学以难以解决很多问题,运用人工神经网络在林业生成与运用则是一个不二之选的方法,对林业的发展也有很大的理论价值和推广意义。
人工神经网络(Artificial Neural Network-ANN),简称“神经网络”,是由大量处理单元过极其丰富和完善的互联组成的非线性、自适应信息处理系统。它的提出是基于现代神经科学研究成果上,以模拟大脑神经网络处理、记忆信息的方式进行信息处理。涉及学科较多,较为广泛。
1 研究内容和方法
平均树高,平均胸径,林种年龄,立地质量,积蓄量,保留密度等等因素都会影响林分材种出材率,而林分林种出材率具有非线性和非确定性的因素,一般采用统计分析方法进行预测采样,需要大量的林木样本元素,模型涉及的许多参数无法或很难有较高的精确度。
人工神经网络(Artificial Neural Network)具有非线性,非局限性,自适应,自组织,自学习的特征,相较于传统的统计学方法,不同之处在于它的容错性和储存量,通过单元之间的相互作用,相互连接能模拟大脑的局限性。ANN的独到之处,也使得人们注意了ANN,并且广泛的应用于各种学科之中,如心理学,逻辑学,数学模型,遗传算法,语音识别,智能控制等等。当然,运用人工神经网络对林分林种出材率进行预测也同样具有很好的效果与实现。
研究主要完成,通过对数据的采样和分析处理,对神经网路预测模型的结构,参数进行优化,再应用到林分材种出材率的预测中。以c++程序设计为设计平台,运用人工神经网络中的BP算法,分析各隐含层神经元的数量,训练的次数,隐含层函数,样本数量,进行优化建立林分材种出材率的预测模型。
1.1BP人工神经网络
BP(Back-Propagation Network)神经网络是一种以误差逆传播算法(BP)训练的多层前馈网络,目前应用较为广泛的神经网络模型之一。BP神经网络能学习和存贮多个输入-输出模式映射关系,而且无需事前对这种映射关系的数学方程进行描述。它通过不断反向传播来调整神经网络的权值和阈值,使神经网络的误差平方和最小。BP神经网络模型拓扑结构由三层组成分别是输入层(input)、隐层(hidelaver)和输出层(output layer)。
BP人工神经网络主要以标准BP算法为主,而标准BP算法有存在许多问题,由于是非线性梯度优化算法,就会存在局部极小值问题,使得精确度受限;算法迭代系数过多,使得学习率降低,收敛速度降低;网络对初始化的值存在发散和麻痹;隐节点不确定性的选取。所以引进了几种BP算法:动量BP算法、学习速率可变的BP算法和LM算法(Levenberg-Marquardt)。动量BP算法以上一次修正结果来影响本次的修正,动量因子越大,梯度的动量就越大。学习效率可变的BP算法怎是力求算法的稳定,减小误差。为了在近似二阶训练速率进行修正时避免计算HeSSian矩阵,选择LM算法。所以为了神经网络计算的速度与精确度,所以运用不同的优化算法来改善BP网络中的局部极小值问题,提高收敛速度和避免了抖动性。
2 基于BP人工神经网络和林分材种出材率预测模型的建立
分析了大量的材种出材率的相关资料后,均有非线性的特征,对于模型的建立和预测,传统的识别系统在研究和实践中有很大的问题,而采用人工神经网络,不仅其特征是非线性,而且人工神经网络具有较为稳定的优越性,所以,对于林分材种出材率的预测和建立采用BP人工神经网络。
2.1建模工具
研究采用c++程序设计对数值的计算和预测,对模型进行编译和实现。c++语言是受到非常广泛应用的计算机编程语言,它支持过程化程序设计,面向对象程序设计等等程序设计风格。c++是一门独立的语言,在学习时,可以结合c语言的知识来学习,而c++又不依赖于c语言,所以我们可以不学c语言而直接学习C++。
用c++来模拟BP网络是相对较好的程序设计语言,以面向对象程序设计来设计和实现林分材种出材率的BP算法,直观而简洁。
2.2BP神经网络结构的确定
对于使用BP算法,关键在于隐含层层数和各层节点数。而神经元的输入输出又影响着隐含层层数,而对于BP万罗中的输入输出层是确定的,重点就在于隐含层层数,增加隐含层数可以提高网络的处理能力,是的训练复杂化,样本数目增加,收敛速度变慢等,而隐含层的节点数越多,可以提到其精确度。
研究过程中,多层隐含层会将训练复杂化,所以我们往往选择三层就够了,即一个输入层,一个隐含层,一个输出层的基本单层BP网络结构。最后确定以下四个神经元:平均树高、平均胸径、林种年龄、每公顷积蓄量作为输入单元。输出单元为林分材种出材率。
结论
以BP神经网络建立林分材种出材率的网络模型,使得出材率的精确度提高。根据样本的选取和整理,算法的优化,避免了异常数据和算法的不安全性对神经网络的学习影响,提高了网络的繁华能力,利用数据归一化节约了网络资源,学习负担减轻,避免了训练过程中的抖动与麻痹状态。岁模型的总体分析,减少神经元个数的输入,权值减少,极大的提高了网络训练中的收敛速度,也使得网络的稳定性和容错性提高。
篇4
关键词:回归神经网络;时间序列;数据预测;归一化方法
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)07-1508-03
在工业、气象、金融、地理、医药、交通、环境等领域,都存在大量需要进行分析与处理的数据信息,在对这些数据信息进行挖掘分析的过程中,为了能提高分析效能与提高分析性能,在进行数据分析初期阶段需要对原始数据进行预处理,将原始数据值通过某种算法转化为所需分布范围数据,即数据标准化处理。
利用神经网络模型来进时间序列数据趋势预测是一个已经开展了很长时间研究的热门话题,这方面也有了许多研究成果。Connor[1]等运用非线性自回归平均移动预测模型来进行时间序列问题鲁棒预测,cheung[2]等运用神经网络模型对未来的金融数据进行预测,Wang[3]等设计出一种基于回归神经网络的多维并行预测模型,文献[4] 采用基于自回归神经网络进行多维动态预测。在运用神经网络预测模型进行趋势预测时,需要对时间序列数据进行缺失值及数据标准化处理,下文运用多维动态预测模型对几种常见的数据归一化方法进行分析。
1 回归神经网络预测模型
图一为基于回归神经网络的多维动态预测模型[5]。网络模型分为输入层、分配层、隐层与输出层四层;隐层为具有延迟一步功能的反馈单元,作用函数为Sigmoid函数,输出层作用函数为线性累加函数。
2 数据归一化方法
数据归一化方法很多,用的较多的有线性归一化与非线性归一化两种方法。线性归一化方法主要运用极值或则均值通过线性运算公式对原始数据进行运算,将数据转换为[-1,1]区间内的数值;非线性归一化方法主要运用一些非线性行数对原始数据进行运算,将数据转换为一定分布范围数据。
从实验结果来看,初始数据的归一化处理方法对自回归神经网络预测模型的预测性能有明显的影响,线性归一化方法中最大值运算法要优于最大最小值法;非线性归一化方法中,对数运算法优于反正切运算法,总体来看,运用最大值运算法对初始数据进行归一化标准化处理适合于自回归神经网络预测模型。
4 结论
通过运用基于自回归神经网络的动态预测模型来分析几种常见数据归一化方法对模型预测性能的影响,结果表明,数据归一化方法的选择会对自回归神经网络预测模型性能有明显影响;对于自回归神经网络预测模型,运用最大值运算法来进行数据归一化处理要优于其它几种常见方法。
参考文献:
[1] Connor J T,Martin R. D,Atlas L E.Recurrent neural networks and robust time series prediction[J].In IEEE Trans. on neural networks,1994(5):240–254.
[2] Cheung Y M,Leung W M,Xu L.A RPCL-CLP architeeture for finaneial time series forecasting[C].Proceedings of IEEE International Conference on Neural Network,1995,2:829-832.
篇5
本文作者:仇阿根、熊利荣、赵阳阳 单位:中国测绘科学研究院、武汉大学资源与环境科学学院、华中农业大学工学院
花生仁的外衣完整性检测是一种模式识别。根据影响花生仁外衣完整性的颜色特征参数,对花生仁外衣完整性进行识别。在神经网络运用领域里,算法的确定无法用一个完全标准,主要是靠经验来选择的。基于以上原因,花生仁外衣完整性检测神经网络的设计算法选择BP算法[9],该算法能实现输入与输出之间的非线性映射,对于样本数量有限的情况也同样适用。一个典型的BP网络结构如图3所示。BP神经网络通常具有多个隐含层。本文中,隐层神经元采用Sigmoid型传递函数,输出层采用logsig型传递函数。花生仁的外衣完整性检测是一种模式识别。根据影响花生仁外衣完整性的颜色特征参数,对花生仁外衣完整性进行识别。在神经网络运用领域里算法的确定无法用一个完全标准的算法确定,主要是靠经验来选择的。基于以上原因,花生仁外衣完整性检测神经网络的设计算法选择BP算法。一个典型的BP网络结构(如图3所示)通常具有一个或多个隐层。其中,隐层神经元通常采用Sigmoid型传递函数,而输出层神经元则采用logsig型传递函数。
BP识别系统是以BP神经网络分类器[10]为核心的系统,系统设计如图4所示。BP神经网络分类器由一个BP网络训练子系统生成得到,图像由CCD摄像头获得后,由图像采集卡数字化输入计算机,提取特征区域获得颜色特征参数,这些参数输入BP网络即可得到分类结果。影响花生完整性的颜色特征参数为H,I和S,因此输入层节点数等于3;网络的输出有两种情况,即完好与破损,因此输出层有2个节点;对应于完整和破损这两种判断结果,分别用2位二进制编码为10和01。隐含层的节点数的确定非常重要,数目过少,网络将不能建立正确的判断界,使网络训练不出来或不能识别以前没有的样本,且容错性差;而节点数目过多,学习时间长,使网络的泛化能力降低。本文通过多次反复训练网络,确定隐含层节点数目为40。本研究采用Matlab软件及其神经网络工具箱来实现网络建模。在神经网络工具箱中,对神经网络的名称、类型、结构和训练函数等参数进行设置,如表1所示。
建立了BP神经网络并对网络进行初始化后,就可对网络进行训练了。将训练步数设为500步,将训练目标误差goal参数设置为0.01,结果如图5所示。图5中,横坐标表示本网络的预置训练步数,纵向坐标表示本网络的预置训练误差,水平横线表示期望的目标误差,误差变化曲线如图5所示。由图5可知,当网络训练到170步时,网络误差已经达到期望的目标值0.01,训练即可停止。
本文采用BP神经网络与计算机视觉技术相结合的手段,建立了一个花生外衣完整性判别系统。实验证明,判别准确率达到87.1%。此系统很容易推广在其他农产品的检测中,只需要改变输入和输出样本数据,重新训练一下BP网络,即可投入使用。因此,将BP神经网络运用到农产品的品质检测过程中,具有巨大的潜力和广阔的应用前景。但必须指出的是,此方法高效可行,整个训练过程只用了6s,且本研究建立在静态实验环境下,生产效率依然很低。如果要将此实验结果运用生产实际,必须设计出配套的硬件分级设备,这将是后续研究的重点。
篇6
黑科技?神经网络是个什么鬼
说到神经网络,很多朋友都会认为这是一个高大上的概念。从生物学角度来说,人类复杂的神经系统是由数目繁多的神经元组合而成,它们互相联结形成神经网络,经过对信息的分析和综合,再通过运动神经发出控制信息,从而实现各种精密活动,如识别各种物体、学习各种知识、完成各种逻辑判断等。
随着人工智能技术的发展,科学家开发出人工神经网络,它的构成原理和功能特点等方面更加接近人脑。它不是按给定的程序一步一步地执行运算,而是能够自身适应环境、总结规律、完成某种运算、识别或过程控制。比如多伦多大学的Krizhevsky等人构造了一个超大型卷积神经网络,有9层,共65万个神经。第一层神经元只能识别颜色和简单纹理,但是第五层的一些神经元可以识别出花、圆形屋顶、键盘、乌、黑眼圈等更为抽象丰富的物体(图1)。因此神经网络实际上是基于人工智能技术而形成的一种和人类神经网络相似的网络系统。
媲美Photoshop 神经网络磨皮技术背后
如上所述,现在神经网络技术发展已经非常迅猛,而且运用在各个领域。神经网络磨皮则是指该技术在照片识别和美化方面的运用。那么它是怎样实现对照片的美化?在Photoshop中磨皮操作是用户先选中人脸区域,然后再使用Photoshop内置的方法实现磨皮。神经网络磨皮原理类似,只不过这些操作是自动完成的。
首先是对照片人脸识别。要实现对照片的美容就必须先精确识别人脸,由于人脸有五官这个显著特征,因此神经网络磨皮技术只要通过机器对一定数量的人脸照片进行识别、读取,然后就可以精确识别人脸。它的原理和常见的人脸识别技术类似(图2)。
其次则是美化。在完成人脸识别后就需要对美化操作进行机器学习,以磨皮为例。因为人脸的每个年龄阶段皮肤性质是不同的,为了达到更真实的磨皮效果,神经网络磨皮是实现用户“回到”幼年或者“穿越”到老年脸部皮肤的效果。研究人员将年龄段分类为0~18岁、19~29岁、30~39岁、40~49岁、50~59岁和60岁以上这几个阶段(图3)。
然后准备两个深度学习机器同时工作。两个机器一个用来生成人脸,一个用来鉴别人脸。而且两个机器会通过分析人脸图像,提前学习到各年龄段人脸大概是什么样子的。在每个年龄分组里,研究人员让机器学习超过5000张标记过年龄的人脸图像。通过大量的照片学习后,机器就可以学会每个年龄分组内的标签,它可以准确知道每个人不同年龄阶段的脸部特征。这样无论你是要磨皮为年轻时的皮肤光滑、圆润状态,还是要变为50岁以后皱褶、粗糙的皮肤,神经磨皮都可以轻松帮助你实现。
当然学习有个通病,就是在合成过程中,机器可能会丧失掉图片原有的识别资料(1D)。为了解决这个问题,上述介绍中的人脸鉴别机器就发挥功效了。它通过查看这个照片的识别资料是不是唯一的,如果不是的话照片则会被拒绝输出。研究人员让机器合成10000张从数据库中抽取出来的人像,这些照片之前从未用来训练机器。然后他们用开发的软件程序来检测训练前后的两张照片是否为同一个人,测试结果显示有80%经训练的照片都被认为和原照片是同一个人(而作为对比,用其他方法加工照片,平均测试结果只有50%)。举个简单例子,如果40岁的用户将自己磨皮为20岁的样子,如果软件程序来检测训练前后的两张照片为同一个人,那么就输出磨皮效果,从而让用户可以轻松磨皮到20岁的状态。这样经过训练的神经磨皮算法可以很真实地实现人脸的磨皮。
神经网络 不H仅是磨皮
篇7
关键词 人工;神经网络;机器学习方法
中图分类号Q1 文献标识码A 文章编号 1674-6708(2011)40-0111-02
0 引言
机器学习方法经常被应用到解决医学和生物信息学的问题。在这个报告中我列举了一些把机器学习方法应用到生物信息学领域的实例。比如:组建多重神经网络,运用该神经网络对4种不同形势的肿瘤患者进行分类。
1 介绍
人工神经网络属于机器学习领域。关于人工神经网络的概念最早提出于1940年代。后来在1980年代后被推广应用,尤其是在医学领域。
其中一个非常有用的用途是对疾病进行分类,达到诊断的目的,或者对基因表达进行分类。在这类神经网络里面,k点最近邻居算法是最常被采用的算法。
人工神经网络的优点是:不需要人们蛆关注神经网络里面的细节信息;人工神经网络可以很容易地被重新训练来应对不同地分类数据。人工神经网络可以用来解决有监督学习和无监督学习,比如:自组织特征映射(self-organized feature map)就可以用来解决无监督学习的问题。
它的不足之处在于:人工神经网络往往需要大量的训练数据,而这些训练数据往往不是很容易获得。人工神经网络可以被看作是一个黑盒,它的细节隐藏在点点之间的权值里面。这些权值的意义是人类无法理解的。同时,人工神经网络需要被仔细的训练以避免过拟合的情况出现。我们常常需也要降低高维数据的维度。下面,我将分析介绍人工神经网络的具体应用。
人工神经网络的结构如图1所示:
X1 ,X2 ,X3是该神经网络的输入值,w0 ,w1 ,w2 ,w3 是该神经网络的输入结点到内部节点的路径权值,每个神经元的激活函数是如上图右侧所示的函数图像。
这个函数被称作为sigmoid函数,表达式如下:
多重神经网络通常有3层,事实上,3层神经网络以能进行很好的分类效果。这三个层包括输入层,隐藏层,输出层。在每个神经元内部我们可以选择sigmoid激活函数或其他种类的激活函数。
如图2所示:
单个神经元仅能提供线性的分割面,所以多层神经网络可以提供非线性的分类函数(即:若干个线性分割面的复杂组合)。这并不意味着4层神经网络就一定比3层神经网络能一共更好的分类效果,因为层数越多,需要的训练集就越庞大,得到的效果也不会提高。
既然有训练问题,就会涉及到训练算法。较为早的和著名的训练算法是delta 规则。它于20世纪60年代被提出。它的原理是计算理论输出值和世纪输出值的均方差。tp 为理论输出值,yp为实际输出值,表示为:
训练的开始阶段,我们通常设定一个随机选取值,令该值等于:
该公式里,α是学习速率,学习速率越大,学习的过程就越快,完成学习的时间短。但如果学习的速率过大,可能导致网络的理想权值在合理结果的附近游摆而永远无法获得理想的权值。
神经网络被训练好了以后,它就被用到解决目标问题。原始的数据集可以被分为两部分:一部分用来训练,一部分用来测试。
有时候神经网络会把训练数据集里面的噪音点的特征纳入自己的权值表达里,从而该神经网络无法真正体现该点集的真实特征。我们把这种情况叫做过拟合。过拟合是由于网络比待估函数复杂造成的。比如一个可以同3层网络解决的问题,我们用4层网络或者由更多神经元的三层网络去解决该问题,就容易造成过拟合。为了更好的明确训练时所采用的神经网络的隐藏层的层数,Livingstone 和 Manalack 提出了如下计算公式:
D = m*o/w
该公式里m是训练样本的数目,o是该网络的输出值,w是网络权值的数目,D就是隐藏层的数目。
得到了隐藏层的数目之后,我们可以以这个数目创建神经网络,边训练边削减,直到我们获得一个一半化的网络。对于没有隐藏网络层或只有一个隐藏网络层的神经网络,我们需要先确定它要解决的问题是否是线性的。
适当的训练方案是能也可以使网络的复杂性和数据的复杂性得到合适的匹配。一个合适的训练方案应该是如下步骤:首先选择一个很大的网络并且把它的每个权值都设到一个很小的值上。通过训练,这些权值可以逐渐游摆到一个合理的值。
由于初始数据集通常要被分为训练集和测试集。在医学领域,我们能获得的数据集往往很小,比如某种病的病人数目不会很大。所以我门需要采用交叉验证的技巧来是较小的数据集在被分为训练集和测试集之后能较好的训练神经网络。
篇8
[关键词] Spiking神经网络 学习模型 股市预测
一、引言
随着经济的增长,对于股市的预测将变得越来越重要,也成为经济理论研究中的一个重要课题。股票市场的变化有很多因素,是一个复杂的非线性系统,而人工神经网络能够从大量复杂的数据中找到数据间的内在联系,具有良好的自我学习和抗干扰能力,在股票预测领域中取得了显著的效果。本文应用一种更接近于生物神经系统的Spiking神经网络,采用基于粒子群算法的学习模型,构建了沪市上证综合指数的学习预测模型,并用实际数据进行了分析实验。
二、Spiking神经网络及其学习模型
Spike神经元模型是更接近生物神经元的一个数学模型,由Spike神经元构成的人工神经网络称为Spiking神经网络。在Spiking神经网络中,一个Spike神经元在t时刻接收来自于父突触神经元的多个post-synaptic potential(PSP)信号,不断改变自己的膜电压。当它的膜电压超过阈值时,产生一个spike,并通过突触连接向外发送PSP信号。用于描述PSP信号的spike响应函数定义为:
三、上证综合指数的预测
沪市上证综合指数是上海证券交易所编制的,以上海证券交易所挂牌上市的全部股票为计算范围,以发行量为权数综合,上证综指反映了上海证券交易市场的总体走势,所以对上证综指的预测具有重要的意义。文中选取了2006年6月~2007年7月共286个工作日的沪市上证综合指数作为研究的原始数据,利用滑动窗口技术,通过前6天收盘时的上证指数来预测第7天收盘时的上证指数。
我们构建了具有6个输入神经元、4个隐含层神经元和1个输出节点的前向全连接Spiking神经网络,并利用以上的Spiking神经网络学习模型进行测试。选取了原始数据中的前276个数据构成神经网络的训练集,后10个数据用于测试。在实验前,我们对原始数据进行归一化的处理转换为[0,1]之间的值。把归一化后的前6天收盘时的上证指数分别作为6个输入神经元的spike时间加入到Spiking神经网络中进行学习和计算,获得神经网络输出节点的spike时间,该时间对应于第7天的收盘指数。按本文式(3)计算获得Spiking神经网络的学习误差,通过粒子群算法不断调整神经网络的参数使误差最小化。获得了最优的Spiking神经网络后,用测试集的数据对其性能进行了测试。经Spiking神经网络学习预测后的上证指数变化如图。
结果表明,与传统BP算法相比,基于粒子群算法的Spiking神经网络具有较快的运算速度和逼近性能, 同时可以克服SpikeProp算法陷入局部最优解和对权值有约束的缺点,可以较好地处理股票类非线性数据的学习和预测。
四、结论
股票市场的不确定因素太多,是一个复杂的非线性系统,而神经网络具有自我学习的能力,能很好地解决不明确环境中的非线性应用问题。Spiking神经网络作为一种新型的动态的神经网络,其利用动态的spike时间进行信息编码和计算的特点与股票市场中动态的时间序列相吻合。文中对应用Spiking神经网络预测国内股票市场做了初步的探讨,获得了较好的拟合效果。进一步改进原始数据的处理方式,提高Spiking神经网络的自适应能力,将能得到更好的预测效果。
参考文献:
[1]Sander M:Bohte, Spiking Neural Networks [D].ISBN 90-6734-167-3, 2003
[2]Gerstner W, Kistler W. Spiking Neuron Models: Single Neurons, Populations, Plasticity [M]. Cambridge University Press, 2002
[3]韩文蕾王万诚:概率神经网络预测股票市场的涨跌[J].计算机应用与软件,2005,22(11):133~135
篇9
关键词:强化学习;神经网络;马尔科夫决策过程;算法;应用
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2012)28-6782-05
在机器学习领域,大致可以将学习分为监督学习、非监督学习和强化学习三大类。强化学习以其在线学习能力和具有无导师制的自适应能力,因此被认为设计智能Agent的核心技术之一。从20世纪80年代末开始,随着数学基础日益发展的支持,应用范围不断扩大,强化学习也就成为目前机器学习的研究热点之一。在研究过程中,随着各种方法、技术和算法大量应用于强化学习中,其缺陷和问题也就日渐显现出来,寻找一种更好的方式和算法来促进强化学习的发展和广泛应用,是研究人员探讨和研究的重点。因此,神经网络及其算法以其独特的泛化能力和存储能力成为众多研究人员重视的研究对象。
在此之前,已有大量研究者通过神经网络的特性来加强强化学习的效果及应用。张涛[2]等人利用将Q学习算法和神经网络中的BP网络、S激活函数相结合,加上神经网络的泛化能力,不仅解决了倒立摆系统的一系列问题,而且还进一步提高了强化学习理论在实际控制系统的应用。林联明在神经网络的基础研究Sarsa强化算法,提出用BP网络队列保存SAPs,解决由于过大而带来的Q值表示问题[3]。强化学习理论在机器控制研究中也应用广泛。段勇在基于行为的移动机器人控制方法基础上,将模糊神经网络与强化学习理论相结合,构成模糊强化系统,解决了连续状态空间和动作空间的强化学习问题和复杂环境中的机器人导航问题[4]。由此可见,将神经网络与强化学习相结合,已经是现今强化学习研究的重点方向,也已经取得了颇丰的成果。但是,如何将神经网络和强化学习理论更好的融合,选择何种算法及模型,如何减少计算量和加快学习算法收敛速度,以此来推动强化学习理论研究更向前发展,解决更多的实际应用问题,这些依然还是待解决的研究课题之一。下面,根据本人对强化学习的研究,朋友给予的指导以及参照前人的研究成果,对基于神经网络的强化学习作个基本概述。
1 强化学习
强化学习(reinforcement),又称再励学习或评价学习,它是重要的机器学习方法之一,在机器人控制、制造过程控制、任务调配及游戏中有着广泛的应用。
1.1 定义
所谓强化学习就是智能Agent从环境状态到行为映射的学习,并通过不断试错的方法选择最优行为策略,以使动作从环境中获得的累积奖赏值最大。
强化学习状态值函数有三个基本表达式,如下:
这三个状态的值函数或状态—动作对函数的值函数是用来表达目标函数,该目标函数是从长期的观点确定什么是最优的动作。其中[γ]为折扣因子,[rt]是agent从环境状态[st]到[st+1]转移后所接受到的奖赏值,其值可以为正,负或零。其中式(1)为无限折扣模型,即agent需要考虑未来h([h∞])步的奖赏,且在值函数以某种形式进行累积;式(2)为有限模型,也就是说agent只考虑未来h步的奖赏和。式(3)为平均奖赏模型,agent考虑其长期平均的奖赏值。最优策略可以由(4)式确定
1.2 基本原理与一般结构
强化学习就是能够和环境进行交互的智能Agent,通过怎样的学习选择能够达到其目标的最优动作。通俗的说,在Agent与环境进行交互的过程中,每个行为动作都会获得特定的奖赏值。如果Agent的某个行为策略导致环境正的奖赏值(强化信号),那么Agent以后产生这个行为策略的趋势就会加强。Agent的目标就是对每个离散的状态发现最优策略以期望的折扣奖赏和最大。
在上述定义中描述了强化学习的三个状态值或函数动作对函数来表达目标函数,可以求得最优策略(根据(4)式)。但是由于环境具有不确定性[5],因此在策略[π]的作用下,状态[st]的值也可以写为
强化学习把学习看作试探评价过程,可用图1描述。强化学习选择一个动作作用于环境,环境受到作用后其状态会发生变化,从一个状态转换到另一个状态,同时产生一个强化信号反馈给Agent,即奖惩值。Agent接受到奖惩值和环境状态变化,进行学习更新,并根据奖惩值和环境当前状态选择下一个动作,选择的原则是使受到正强化(奖)的概率增大。选择的动作不仅影响立即强化值,而且影响环境下一时刻的状态及最终的强化值。
2 神经网络
2.1 神经网络概述
神经网络是指模拟人类大脑的神经系统的结构与功能,运用大量的处理部件,采用人工方式构造的一种网络系统。神经网络是一种非线性动力学系统,并且具有以分布式存储和并行协同处理的特点,其理论突破了传统的、串行处理的数字计算机的局限。尽管单个神经元的结构和功能比较简单,但是千千万万个神经元构成的神经网络系统所能表现的行为却是丰富多彩的。
单个神经元的模型如图2所示。
人工神经元模型由一组连接,一个加法器,一个激活函数组成。连接强度可由各连接上的值表示,权值为正表示激活,权值为负表示抑制;加法器用于求输入信号对神经元的相应突触加权之和。激活函数用于限制神经元输出振幅。
神经元还可以用如下公式表示
激活函数主要有阈值函数、分段线性函数、非线性转移函数三种主要形式。
一般来说,神经网络在系统中的工作方式是:接受外界环境的完全或者不完全的状态输入,并通过神经网络进行计算,输出强化系统所需的Q值或V值。人工神经网络是对人脑若干基本特性通过教学方法进行的抽象和模拟,是一种模仿人脑结构及功能的非线性信息处理系统。
2.2 强化学习与神经网络的融合
经过研究发现,神经网络的众多优点,可以满足强化学习研究的需要。首先,由于神经网络模仿人的大脑,采用自适应算法,使得Agent智能系统更能适应环境的变化。此外,神经网络具有较强的容错能力,这样可以根据对象的主要特征来进行较为精确的模式识别。最后,神经网络又有自学习,自组织能力和归纳能力的特点,不仅增强了Agent对不确定环境的处理能力,而且保证了强化学习算法的收敛性。神经网络也有无导师学习机制,正好适用于强化学习。
强化学习和神经网络的融合重点在于如何运用神经网络多重特性,能够快速高效地促进Agent智能系统经历强化学习后,选择一条最优行为策略来满足目标需求。强化学习的环境是不确定的,无法通过正例、反例告知采取何种行为。Agent必须通过不断试错才能找到最优行为策略。但是在此过程中,会遇到许多问题,比如输出连续的动作空间问题,但可利用神经网络的泛化特征,实现了输出在一定范围内的连续动作空间值[2]。所以,简单的讲,将神经网络和强化学习相融合,主要是利用神经网络强大的存储能力和函数估计能力。目前,在函数估计强化学习研究上,神经网络是研究热点之一。
3 马尔科夫决策过程
本文主要论述马尔科夫型环境下的强化学习,可以通过马尔科夫决策过程进行建模。下面给出其形式定义:
基本的POMDP由四个元组成:。S是指一个环境状态集,可以是有限的,可列的或者任意非空集;A为Agent行为集合,用A(s)表示在状态s处可用的决策集;奖赏函数R(s,a):[A×S]->Real;T:[A×S]->PD(S);T(s,a,s')为Agent在状态s采用a动作使环境状态转移到s'的概率。
一个有限的马尔科夫决策过程有5元组成:;前四个元与上述是一致的,V为准则函数或者目标函数[3],常用准则函数有期望折扣总报酬、期望总报酬和平均报酬等并且可以是状态值函数或状态-动作对值函数。
马尔科夫决策过程的本质是:当前的状态转变为另一个状态的概率和奖赏值只取决于当前的状态和选择的动作,与过去的动作和状态无关。所以,在马尔科夫环境下,已知状态转移概率函数T和奖赏函数R,可以借助于动态规划技术求解最优行为策略。
4 改进的强化学习算法
到目前为止,强化学习领域提出的强化学习算法层出不穷,如Sutton提出的TD算法[6],Watkins提出的Q-Learning算法[7],Rummery和Niranjan于1994提出的Sarsa算法[8],以及Dyna-Q学习算法[9]等。致力于这方面研究的研究人员,都在极力寻找一种既能保证收敛性,又能提高收敛速度的新型学习算法。本文主要在基于神经网络的特性,研究并提出改进的强化学习算法。
4.1 基于模糊神经网络的Q([λ])学习算法
Q学习算法是强化学习领域重要的学习算法之一[7,10],它利用函数Q(x,a)来表达与状态相对应的各个动作的评估。Q学习算法的基本内容为:
(1)任意初始化一个Q(x,a)
(2)初始化 s
(3)从决策集中随即选择一个动作a
(4)采取动作策略a,观察[r,][s]'的值
(5)计算 [Qs,aQs,a+αr+γmaxa'Qs',a'-Qs,a], (11)
(7)重复(2)-(6)步,直到s终结。
式(11)使用下一状态的估计来更新Q函数,称为一步Q学习。将TD([λ])的思想引入Q学习过程,形成一种增量式多步Q学习,简称Q([λ])学习[11]。步骤与Q算法类似,其计算公式如下:
如果 [s=st,a=at],则[Qst,at=Qst,at+αtγt+γtetst+at]; (12)
4.2 基于BP神经网络的Sarsa算法
描述如下:(1)H是用于保存最近访问的Q值,当满的时候送至神经网络训练。
如果表H已满,则利用H中的样本对网络进行训练,版本号自动增加1
若网络队列q也已满,则队尾元素出队,把新训练的神经网络入队q;
清空训练集;
该算法的主要贡献是引入神经网络队列保存大量的Q值表,从来降低了保存大量Q值所要花费大量的内存空间,更重要的是解决了单个神经网络“增量式”学习所带来的“遗忘”问题。
5 强化学习应用
由于强化学习在算法和理论方面的研究越来越深入,在大空间、复杂非线性控制,机器人控制、组合优化和调度等领域呈现出良好的学习性能,使得强化学习在人工智能,控制系统,游戏以及优化调度等领域取得了若干的成功应用,而本文主要介绍基于神经网络的强化学习算法在某些领域的应用。
在非线性控制系统方面,张涛等人[2]将BP网络运用于 Q-Learning算法中,成功解决了连续状态空间的倒立摆平衡控制问题和连续状态空间输入、连续动作空间输出的问题,从而提高了强化学习算法的实际应用价值;在机器人控制方面,应用更为广泛,Nelson[13]等人考虑了基于模糊逻辑和强化学习的智能机器人导航问题,并且段勇等人[4]基于该理论,成功地将模糊神经网络和强化学习结合起来,采用残差算法保证函数逼近的快速性和收敛性,有效地解决了复杂环境下机器人导航的问题。在游戏方面,Tesauro采用三层BP神经网络把棋盘上的棋子位置和棋手的获胜概率联系起来,通过训练取得了40盘比赛中只输一盘的好战绩[14]。在优化调度方面,主要包括车间作业调度,电梯调度以及网络路由选择等,Robert Crites等[15]将强化学习和前馈神经网络融合利用,以最终实验结果表明为依据,证明了该算法是目前高层建筑电梯调度算法中最优算法之一。
6 结束语
本文将强化学习和神经网络相融合,介绍利用神经网络强大的存储能力、泛化能力及函数估计能力,可以解决强化学习领域遇到的连续状态和动作输入、输出的问题,学习状态空间过大的问题以及不确定环境处理的问题等。基于此,主要论述了三种神经网络和强化学习的改进算法,它们都综合了神经网络的特性。最后,简单介绍了目前基于神经网络的强化学习应用的成功实例。目前,利用神经网络进行强化学习依然是研究热点课题之一。
参考文献:
[1] 高阳,陈世福,陆鑫. 强化学习研究综述[J].自动化学报,2004,30(1):86-100.
[2] 张涛,吴汉生.基于神经网络的强化学习算法实现倒立摆控制[J].计算机仿真,2006,23(4):298-300.
[3] 林联明,王浩,王一雄.基于神经网络的Sarsa强化学习算法[J].计算机技术与发展,2006,16(1):30-32.
[4] 段勇,徐心如.基于模糊神经网络的强化学习及其在机器人导航中的应用[J].控制与决策,2007,22(5):525-529.
[5] 刘忠,李海红,刘全.强化学习算法研究[J].计算机工程与设计,2008,29(22):5805-5809.
[6] Sutton R S.Learning to predict by the methods of temporal differences.Machine Learning,1988,3:9-44.
[7] Watkins P.Dayan.Q-Learning.Machine Learning,1992,8(3):279-292.
[8] Rummery G,Niranjan M. On-line Q-Learning using connectionist systems. Technical Report CUED/F-INFENG/TR 166,Cambridge University Engineering Department,1994.
[9] Sutton R S,Barto A G, Williams R. Reinforcement Learning is direct adaptive optional control.IEEE Control Systems Manazine,1991,12(2):19-22.
[10] Sutton R S, Barto A G. Reinforcement Learning: An introduction[M].Cambridge:MIT Press ,1998.
[11] Peng J , Dayan P. Q-learning [J]. Machine Learning,1992,8(3):279-292.
[12] Kelley H J , Cliff E M, Lutze F H. Pursuit/evasion in orbit[J]. J of the Astronautical Sciences, 1981, 29(3):277-288.
[13] NELSON H C, YUNG. An intelligent mobile vehicle navigator based on fuzzy logic and reinforcement learning [J].IEEE Trans on Systems, Man and Cybernetics, Part B: Cybernetics,1999,29(2):314-321.
篇10
关键词:风速;短期预测;相似数据;小波分析;人工神经网络
1 引言
随着风电场并网运行规模的增大,国内外对于风力发电并网各种课题的研究越来越深入,但关于风电场发电功率预测的研究还达不到令人满意的程度,预测误差一般都在15%以上[1]。
采用的方法通常包括持续法、卡尔曼滤波法、随机时间序列法、神经网络法。其中,人工神经网络法进行风速或风电功率预测应用得最广。文献[2-3]都利用小波―BP神经网络进行建模,但训练样本没有相关性,预测精度偏低。文献[4-5]利用改进的BP神经网络建模,虽然运行时间缩短,但是在数据相关性和数据去噪处理方面欠缺,导致精度不高。因此,本文建立了基于相似数据并结合小波分析的BP神经网络建模。
2 基于相似数据并结合小波分析的BP神经网络建模
2.1 相似数据选择办法
2.3 反向传播(BP)神经网络
2.4 仿真实验建模
3 算法对比分析
从图4可得出,BP神经网络模型的平均相对误差为20.77%,而本模型为10.21%。因此,采用本模型建模得到的相对误差较传统的BP神经网络模型预测精度有很大的提高。
4 结论
针对风力发电中风速预测问题,本文在BP神经网络理论的基础上引入相似数据并结合小波分解进行短期风速预测,得到如下结论:
⑴相似数据的选取增强了数据的相关性,提高了模型预测精度。
⑵小波分解降低了信号的非平稳性,使模型更好地拟合了风速信号的低频和高频特性,可进一步提高算法精度。
⑶通过对算法对比分析,表明本模型较传统BP神经网络模型误差小,充分地说明此方法在工程应用上具有可行性。
[参考文献]
[1]杨秀媛,肖洋,陈树勇.风电场风速和发电功率预测研究[J].中国电机工程学报,2005,25(11):1-5.
[2]师洪涛,杨静玲,丁茂生,王金梅.基于小波―BP神经网络的短期风电功率预测方法[J].电力系统自动化,2011,35(16):44-48.
[3]厉卫娜,苏小林.基于小波- 神经网络的短期风电功率预测研究[J].电力学报,2011,26(6):458-461.
[4]王德明,王莉,张广明.基于遗传BP神经网络的短期风速预测模型[J]. 浙江大学学报(工学版),2012,46(5):837-841.