牛顿法基本原理范文
时间:2023-11-15 17:46:38
导语:如何才能写好一篇牛顿法基本原理,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
【关键词】导数 牛顿迭代法 共轭梯度法
【中图分类号】O241.6 【文献标识码】A 【文章编号】1006-9682(2011)01-0021-03
一、引 言
方程(组)的求解是计算方法中的重要内容,也是当今高性能计算的重要方面。[1]由于方程(组)的特殊性,目前已经发展了许多依赖于导数这一概念的有效方法。[2~4]然而,由于这些方法在形式上具有多样性以及导数在表达方面的特殊性和多样性,让学生在学习的过程中经常感到茫然――即学完这些方法后,对方程(组)的求解显得还是力不从心,理不清楚这些方法之间到底有没有关系,以及如何高效利用这些方法来解决实际问题。
在关于求解方程(组)的教学中我们发现,虽然在讲述牛顿法、弦切法、最速下降法、梯度法、双共轭梯度法等方法的基本原理时,学生是能够顺利理解的,但由于这些方法计算形式差异较大,使得很多同学在理解过程中很难将他们统一到同一个概念下来――虽然我们知道这些方法都基于同一个重要的概念――导数。
下面本文就从导数的定义出发,利用导数的基本含义来论述常见的牛顿法、弦切法、最速下降法、共轭梯度法、双共轭梯度法等迭代法之间的区别和联系;并试图利用导数的概念将这些方法窜联起来,使老师更容易进行教学,让学生也更容易理解这些方法的精要。
为方便叙述,首先引入导数的概念。导数是微积分中的重要概念,其直观含义就是应变量关于自变量的变化率,在一般不太严格的场合可以直接叫变化率。数学中导数定义为:当自变量的增量趋于零时,因变量的增量与自变量的增量之商的极限。其几何意义就是曲线(面)在一点切线(面)的斜率[注1]。
二、迭代法
1.牛顿迭代法
首先回顾求解单个方程的牛顿迭代法。牛顿迭代法又称为牛顿-拉夫逊方法(Newton-Raphson method),它是牛顿在17世纪提出的一种在实数域和复数域上近似求解方程的方法。牛顿迭代法是求方程根的重要方法之一,其最大优点在于在方程f(x)=0的单根附近具有平方收敛,而且该法还可以用来求方程的重根、复根以及非线性方程的解。另外,由于该方法简单高效,因而广泛用于工程计算中。
牛顿迭代法基本思想:牛顿迭代法是借助于对函数f(x)=0作泰勒展开而构造的一种迭代格式。将f(x)=0在初始值x0作泰勒展开:
f(x)=f(x0)+f '(x0)(x-x0)+ (x-x0)2+…。
取展开式的线性部分作为f '(x)=0的近似值,则有:
f(x0)+f '(x0)(x-x0)≈0
在f '(x)≠0的情况下可得下面的迭代函数 ,
利用此迭代格式可由一个初始值计算得到一个新的近似值:
(1)
在迭代法收敛的情况下,由于x1计算的几何含义为在根的附近用x0处的切线
y-f(x0)=f '(x0)(x-x0)
代替原曲线求根――此切线与x轴的交点x1,故其近似程度比x0要好;再作f(x)在(x1,f(x1))处的切线,得交点x2,其近似程度又比x1要好。不断将此过程进行下去,则可逐步逼近方程的根x*。于是有如下的牛顿迭代格式:
,k=1,2…(2)
从上面分析不难看出牛顿迭代法的核心思想:在区域[x0,x0+h]局部“以直代曲”。当f(x)为线性函数时,函数的切线和函数本身在图形上是重合的,此时切线的根自然也是原方程的根,因此只需一步就可以得到其真实根。利用由导数所决定的线型函数(切线方程)在局部对连续函数逼近的有效性,我们不难看出:若牛顿法是收敛的,则其是一个非常高效的方法。
2.牛顿法的改进
在实际应用中,常常根据具体情况对牛顿迭代法作适当的修改而得到修正算法。
第一,当x*为f(x)的m重根时,取下面迭代格式:
,k=1,2… (3)
第二,初值选取有困难时,可改用如下迭代格式,以扩大初值选取范围:
,k=1,2…(4)
其中p称为下山因子,p选取应当满足单调性条件:即xk+1所对应的函数的绝对值应小于xk所对应的函数的绝对值。这样将下山法与牛顿法结合起来使用的方法,称为牛顿下山法。
由于上面这两种方法直接来源于标准的牛顿迭代法(2),他们的思想和原理基本一致,此处不在重述(方法的详细介绍请参见[4~6])。
第三,弦截法。
为了避免计算导数,在牛顿迭代格式(2)中:用差商f[xk
-L,xk]= 代替导数f '(xk),并在给定两个初始值x0和x1的条件下,那么迭代格式可写成如下形式:
xk+L=xk- ,k=1,2…(5)
上式称为弦截法。用弦截法迭代求根,每次只需计算一次函数值,而用牛顿迭代法每次要计算一次函数值和一次导数值。弦截法的几何意义在于利用割线来代替切线。
所以,我们看到弦截法和牛顿迭代法都是线性化方法,在这其中起着关键作用的就是切线和割线这些概念;而在这些概念背后更为基本的概念则是导数,正是导数把这些不同的方法联系起来,只不过这些方法之间的区别在于有些用的是精确的导数,而有些用的是导数的近似值。
上面这四种方法都可以推广到多维情形,不过由于高维情形的导数计算比较复杂,因而限制了其应用。利用导数在求根时的作用(中值定理)还可以导出一些其它高效的方法。[6]
3.最速下降法(梯度法)
梯度在当代文献研究中涉及的方向非常广,各种运用梯度这一概念解决复杂或疑难问题的论文非常多。[5、7]为了将方法的基本原理阐述清楚,又不至于引入太多的函数细节,下面以二元函数来说明最速下降法的基本思想。这里不妨假定被研究的函数具有足够高的光滑性;并且为简单起见,我们假设多元函数的一阶导数是连续的。
为叙述方便,首先引入函数z=f(x,y)在一点P沿某一方向的变化率问题。设l是xOy平面上以P0(x0,y0)为始点的一条射线el=(cosα,cosβ)是与l同方向的单位向量。射线l的参数方程为:
x=x0+tcosα,y=y0+tcosβ(t≥0)
若函数f(x,y)在点P0(x0,y0)可微分,则对于每一点P0(x0,y0)∈D都可确定函数在点(x0,y0)处的方向导数:
=fx(x0,y0)cosα+fy(x0,y0)cosβ
特别地,若α=0,则可确定如下向量:
fx(x0,y0)i+fy(x0,y0)j (6)
该向量称为函数f(x,y)在点P0(x0,y0)的梯度,记作gradf(x0,y0)。沿梯度方向,模|gradf(x0,y0)|取得最大值,也就是说梯度方向是函数在这点导数取得最大值的方向――函数增加最快的方向。
考虑线性方程组:
Ax=b(7)
其中A是给定的n阶对称正定矩阵,b是给定的n维向量,x是待求的n维向量。引入下面的二次泛函:
(x)=xTAx-2bTx(8)
在A对称正定的条件下,求解方程组Ax=b等价于求二次泛函 (x)的极小点。于是,利用(8)式可将线性方程组(7)的求解转化为求二次泛函 (x)的极小点的问题。
求二次函数(8)的极小值,不同于一元函数(一元函数实际求切线和x轴的交点),多元函数在空间一点的导数方向有很多个,因而如何求其中某一平面的与坐标轴的交点成为一个不确定问题。
为解决这个难题,对任意给定一个初始向量x0以及精度eps,需确定一个下降方向p0。由于沿 (x)增加最快的方向是梯度方向,因此负梯度方向应该是 (x)减小最快的方向,于是最简单而直观的做法是选取pk为负梯度方向(其中k=0,1,2,…)。记rk为第k次迭代的负梯度方向。于是有如下算法:
x0∈Rn(9)
r0=b-Ax0;k=0
while|rk|≥eps
k=k+1
αk=
xk=xk-1+αk-1rk-1
rk=b-Axk
end
从上面的算法可以看出:最速下降法的基本原理是在前一步计算的结果xk-1处,取沿这一点下降最快的方向(负梯度rk)作为搜索方向进行迭代。这样的下降方向是局部的,只是在这一点的附近能够保证是下降速度最快,但不是全局的;另一方面,这样一个新的下降方向和原来的下降方向之间也没有什么必然的联系。从几何上看,我们就是在一点的附近用梯度向量所在的某一平面来近似曲面;并且这样的近似只是局部的,不是牛顿法中整体切平面和坐标轴的交点,因而不是全局的。这样一来,最速下降法的收敛性一般不会太高,尤其是在近似解靠近真实解的时候。
4.共轭梯度法
最速下降法从任何一向量x(0)出发,迭代产生的向量序列总是收敛到原方程(7)的解。理论上其收敛速度的快慢则由A的特征值分布所决定。当A的最小特征值和最大特征值相差很大时λ1<<λn最速下降法收敛速度很慢,所以负梯度方向从局部来看是二次函数的最快下降方向,但是从整体来看,却并非最好。然而这种方法却揭示了利用二次函数极小问题求解对称正定矩阵的线性方程组的算法思想。正是在此基础上的进一步改进,形成了著名的共轭梯度法。
共轭梯度法最早由Hestenes和Stiefle提出来,用于解正定系数矩阵的线性方程组。共轭梯度法的基本思想也是将方程组的求解问题转化为二次优化的最下值问题,所以和最速下降法有相同的数学背景。然而共轭梯度法是一个典型的共轭方向法,和最速下降法不同的是:共轭梯度法的每次搜索方向是互相共轭的(类似于相互垂直),而这些搜索方向不仅仅是负梯度方向,还与上一次迭代的搜索方向相组合。从几何上看,共轭梯度法也是在局部用线型平面去近似曲面,但和最速下降法不同在于:共轭梯度法中局部用到的平面,其方向不是简单的梯度最大的方向,而是寻找在和前面已经找到的方向能够共轭,又尽可能下降快的方向,也就是说这些局部的曲面有着某种类似“相互垂直”的特点,所以它是整体上的。
对于对称正定矩阵A,共轭梯度法考虑选择关于A共轭的向量p1,p2,…,代替最速下降法中的负梯度方向。理论上讲,如果该方法是收敛的,则对任意给定的初始点x(0),经有限步就可以得到问题的准确解。
借助向量组Schmidt正交化过程,有如下的共轭梯度算法:[1~2]
x0∈Rn,k=0
r0=b-Ax0,p0=r0
while|rk|≥eps and(pk,Apk)≥eps
αk=(rk,rk)/(Apk,pk)
xk+1=xk+αkpk,rk+1=rk-αk Apk(10)
βk=(rk+1,rk+1)/(rr,rk)
pk+1=rk+1+βk pk
k=k+1
end
其中x0为初始向量,eps为求解精度。
从上面的计算可以看出,共轭梯度法是从不同的方向来找最小值;这样将全局的最小分解成在不同方向上的最小。直观上看,也就是沿不同方向(共轭的方向)来找最小,后一次的查找是在前一次的最小的基础上进行的,因此每次得到的结果会越来越好;并且由于这些方向是共轭的,所以总在有限步内完成。这就像我们在n维超曲面找曲面的最小一样:沿座标轴一个个搜索――当然可以在搜索所有的坐标方向后得到最优的值。
从对导数信息的使用方面来看,共轭梯度法是介于最速下降法与牛顿法之间的一个方法。虽然它仅用到一阶导数,但它既克服了最速下降法收敛慢的缺点,又避免了牛顿法中需要存储和计算Hesse矩阵并求逆的缺点,所以有较高的计算效率。
5.双共轭梯度法
在最速下降法和共轭梯度法中要求矩阵A是对称正定的,但在实际生活中还有大量的矩阵不具备这样的性质――即不是对称正定的。于是为了利用共轭梯度法的思想来解决这类问题,便出现了双共轭梯度法。[6]
双共轭梯度法和共轭梯度法的不同在于将共轭梯度法中的一步共轭性转化为两步的共轭性,从而用两步的共轭性来代替矩阵的非对称性。实际上对于对称矩阵、两次共轭的结果和一次是一致的。从几何上看,其基本原理也是一样,在此不再叙述。
除了上面提到的方法之外,还有很多方法都可以和导数这个概念联系起来,比如常用的广义极小残差法(GMRES)、非线性方程组的牛顿法、Anord、Lanczos等方法,在此不再一一论述。[6]
三、总 结
通过对上面诸多典型迭代法的分析,我们发现在这些纷繁复杂的方法背后,其实都隐含着一个重要的思想,那就是“以直代曲”(线性化)这样一种简单而又有效的方法;在这其中导数起着举足轻重的作用――将方程组求解和多元函数的根联系起来。这样利用导数这个概念,我们将这些重要的方法串联起来、统一起来,从而简化了我们对这些方法的理解和掌握,也方便了学生的学习。
注 释
1 为避免引入不必要的概念(法向量),对于曲面或超曲面,此处的斜率仅仅表示其切平面中的一个向量。
参考文献
1 蔡大用、白峰杉.高等数值分析[M].北京:清华大学出版社,2005
2 戴虹、袁亚湘.非线性共轭梯度法[M].上海:上海科学技术出版社,2000
3 A. Quarteroni, A.Valli, Numerical Approximation of Partial Differential Equations, Springer-Verlag, 1994
4 钟尔杰、黄廷祝.数值分析[M].北京:高等教育出版社,2006
5 William H. Press, Sual A. Teukolsky, etc, Numerical Recipes in C++, Cambridge University Press, 2003
篇2
关键词:相对论
爱因斯坦提出了自经典物理学建立以来出现的一种全新的、关于时空和质能的科学理论—相对论,改变了人们的思维方式和世界观,影响了整个物理学乃至科学的发展。
相对论是上世纪物理学史上最重大的成就之一,其中狭义相对论变革了从牛顿以来形成的时空概念,提出了时间与空间的统一性和相对性,建立了新的时空观。虽然现在大多数人都知道有这一理论,但对它的认识却是千差万别,有的仅局限在对四维时空坐标的认识,而对运动物体的长度收缩、运动的钟“变慢”仍感到惊奇,对相对论中的质量、动量、能量关系的理解还不深入,脑海里留下了许多疑问。本文主要围绕“相对论”展开探讨。
玻恩曾说过,相对论“是人类认识大自然的最伟大的成果,它把哲学的深奥、物理学的直观和数学的技艺令人惊叹地结合在一起”。相对论并非传统理论的重复,而更是一种精确的用数学表述的方法。此方法中,科学的度量是相对的,长度和时间的概念也是相对的,它们离开了物体和观察者便没有意义。相对论揭示了物理世界各事物固有的绝对与相对性,标志着物理学的重大发展,使人们对一些基本物理概念的认识发生了根本改变。
相对论的理论是那样的革命,是那样的迥异于人们的惯常思维,以至于连当时的物理学家对它的理解,就像幼童想了解地球另一面的人为什么不从地球上掉下去那么困难。1905年,爱因斯坦关于狭义相对论的论文墨迹未干,对相对论进行验证的各种实验就开始热火朝天地搞起来了。但即便是现在,它也是现代物理学确认的最好的验证性理论之一。质能公式是狭义相对论最著名的推论,它导致了原子弹的诞生。而广义相对论所预言的引力透镜和黑洞,也相继被引力观测所证实。从质能方程可以看出,数量极少的质量能够释放出令人震惊的巨大能量,太阳有赖于这公式。甚至也可以说,地球上生命的盛哀兴亡都将和这个公式有关。
相对论又分为广义相对论和狭义相对论。狭义相对论是由爱因斯坦在洛仑兹和庞加莱等人的工作基础上创立的时空理论,是对牛顿时空观的拓展和修正。
伽利略曾经指出,运动的船与静止的船上的运动不可区分,也就是说,当你在封闭的船舱里,与外界完全隔绝,那么即使你拥有最发达的头脑,最先进的仪器,也无从感知你的船是匀速运动,还是静止。更无从感知速度的大小,因为没有参考。比如,我们不知道我们整个宇宙的整体运动状态,因为宇宙是封闭的。爱因斯坦将其引用,作为狭义相对论的第一个基本原理:狭义相对性原理。其内容是:惯性系之间完全等价,不可区分。
著名的麦克尔逊--莫雷实验彻底否定了光的以太学说,得出了光与参考系无关的结论。也就是说,无论你站在地上,还是站在飞奔的火车上,测得的光速都是一样的。这就是狭义相对论的第二个基本原理,光速不变原理。
由这两条基本原理可以直接推导出相对论的坐标变换式,速度变换式等所有的狭义相对论内容。比如速度变幻,与传统的法则相矛盾,但实践证明是正确的,比如一辆火车速度是10m/s,一个人在车上相对车的速度也是10m/s,地面上的人看到车上的人的速度不是20m/s,而是(20-10^(-15))m/s左右。在通常情况下,这种相对论效应完全可以忽略,但在接近光速时,这种效应明显增大,比如,火车速度是0.99倍光速,人的速度也是0.99倍光速,那么地面观测者的结论不是1.98倍光速,而是0.999949倍光速。车上的人看到后面的射来的光也没有变慢,对他来说也是光速。
广义相对论是爱因斯坦深入研究引力理论,于1913年提出的引力场的相对论理论。这一理论完全不同于牛顿的引力论,它把引力场归结为物体周围的时空弯曲,把物体受引力作用而运动,归结为物体在弯曲时空中沿短程线的自由运动。
牛顿的万有引力定律认为,一切有质量的物体均相互吸引,这是一种静态的超距作用。在广义相对论中物质产生引力场的规律由爱因斯坦场方程表示,它所反映的引力作用是动态的,以光速来传递的。广义相对论是比牛顿引力论更一般的理论,牛顿引力论只是广义相对论的弱场近似。所谓弱场是指物体在引力场中的引力能远小于固有能,力场中,才显示出两者的差别,这时必须应用广义相对论才能正确处理引力问题。
爱因斯坦一直把广义相对论看作是自己一生中最重要的科学成果,确实,广义相对论比狭义相对论包含了更加深刻的思想,这一全新的引力理论至今仍是一个最美好的引力理论。没有大胆的革新精神和不屈不挠的毅力,没有敏锐的理论直觉能力和坚实的数学基础,是不可能建立起广义相对论的。伟大的科学家汤姆逊曾经把广义相对论称作为人类历史上最伟大的成就之一。
物质在相互作用中作永恒的运动,没有不运动的物质,也没有无物质的运动,由于物质是在相互联系,相互作用中运动的,因此,必须在物质的相互关系中描述运动,而不可能孤立的描述运动。也就是说,运动必须有一个参考物,这个参考物就是参考系。
相对论对物理学的基本贡献,不但在于揭示了某些曾被认为是绝对的物理概念的相对性,更重要的是,在于确定了许多新的物理概念的绝对性,从而大大扩展和加深了人们对自然规律的认识。
篇3
教授流变学相关内容过程中,需要保持一定的广度和深度。同时,也要遵循基本理论和具体实例相结合,宏观性质与微观分析方法相结合的方法,少而精的设置教学内容。根据课程特点,在教学中应重点讲解以下内容:(1)流变学概念,包括变形、流动、弹性、黏性和黏弹性等概念;(2)牛顿和非牛顿流体的性质,主要介绍四种非牛顿流体,并通过与相应的药物剂型讲解相结合的方法对每种非牛顿流体的性质和基本原理进行解析;(3)触变性的应用及影响因素,通过让学生去查阅相关文献和资料,充分了解触变性在某种药物制备和使用过程中所发挥的作用,从而对触变性的概念和作用有较深的认识;(4)流变学在药剂学中的应用,以乳剂、凝胶剂、软膏剂等具体剂型和药物为实例,通过分析其制备和使用过程中流变学的影响和原理,以及药物制剂的流变性质在生产工艺中的影响,充分阐明流变技术在药物制剂的设计和生产过程中的重要意义。在讲课过程中,主要突出后面两部分内容,让学生不仅理解流变学的基本理论,而且对流变学在药剂学中的应用和作用也有充分认识。
二、教学方法
实际教学过程中,应根据不同的教学内容、性质和特点,选择比较合适的教学方法和技巧,以教学质量的改善,以及教学效果和学生学习兴趣的提高。
1.教师和学生是教学过程的主体,如何充分发挥教师在教学中的主导地位,以及学生在教师引导下充分参与整个教学过程,是教改成功的关键。为了提高学生的学习兴趣,提升其在课堂中的参与度,除了需要丰富教学内容之外,还必须重视教师与学生之间的互动。具体的形式可以是提问式、交流式或学生上台讲解,教师点评等多种形式,让学生真正体会到课堂的乐趣,也能避免教师演独角戏的尴尬。如讲到触变性相关内容时,可以提问学生你平时在用药过程中,发现那些药物具有触变性,其原理和作用是什么等。并且鼓励学生积极发言,切实提高教学效果。
2.充分发挥多媒体在教学过程中的特殊功效。所谓多媒体教学,主要是通过结合图像、文字以及动画等各种要素,使教学内容从单调枯燥的文字转化为多种生动的形式,以多种不同的方式和手段对学生的大脑进行必要而适度的刺激,促使学生在课堂学习过程中充分开展探讨、记忆以及思考等活动,使其更易理解所学的相关内容。因此,必须通过图表、动画、模拟等不同的手段将教学内容变得更加生动、有趣、新颖,在突出教学重点的同时又含有学术色彩,做到教学与实际、科研等相结合,从而加深学生对相关教学内容的掌握和理解。
3.将课堂教学与课后资料查阅等作业有机结合。基于有限的教学课时,为使学生能学到更多的知识,除教师摒弃传统的教学板书、采用多媒体等教学形式对理论知识进行教学外,也可充分调动学生的主观能动性,使学生被动接受知识为主动学习。具体可以结合目前与流变学和药物制剂相关的研究论文,适当的选择某一主题,如流变学在纳米凝胶颗粒制备中的原理和作用,叫学生课后查阅资料,进行总结和归纳,并到课堂上进行交流,让学生充分了解该教学内容的发展动态和前言知识。
三、总结与体会
篇4
关键词:格形结构 滤波器设计 自适应算法 MATLAB仿真
中图分类号:TN2 文献标识码:A 文章编号:1007-9416(2014)05-0181-05
1 格型滤波器的基本结构
目前,常用的数字滤波器有无限长单位脉冲响应(IIR)滤波器和有限长单位脉冲响应(FIR)滤波器两种,最简单的IIR数字滤波器结构是直接式结构,其分子和分母的系数直接作为乘法器系数使用。这种结构有很高的灵敏度,因为多项式的根对系数很敏感,所以给定的传输函数的极点和零点对量化的乘法器系数也很敏感。对于归一化滤波器,极点一般较多分布在靠近波段边缘的拐角里。随着靠近的极点数目增大,这种结构的灵敏度会下降。为了避免这个灵敏度问题,可以用一阶项和二阶项的和或者积实现该传输函数,即采用并行结构或级联结构。但对于复杂的小角度极点共轭问题(例如窄波段高强度转换滤波器),即使使用二阶项方法仍需解决高灵敏度问题。由于给定传输函数的分母充分解析,格型数字滤波器有很好的数字特性。
1.1 自适应格型滤波器
1973年,Gay和Markel提出了一种新的系统的结构形式,即Lattice结构(又称格型结构)。如图1所示。为反射系数,为前向预测误差,为后向预测误差,滤波系数隐含在反射系数中。该结构的算法依据是由Norman Levinson于1947年和由Durbin于1960年对Toeplitz矩阵改进的李文逊-杜宾(Levinson-Durbin)算法。格型滤波器最突出的是具有相互正交的模块化结构,反射系数对舍入误差不敏感,以及格型算法对于信号协方差矩阵特征值扩散的相对惰性等特点,使得该结构具有快速收敛和优良的数值特性。特别适用于要求快速收敛和跟踪快速时变信号的应用场合[1]。
1.2 格型滤波器的结构优点
格型滤波器是一种正交滤波器,传输函数的分母充分解析,具有良好的数字量化效应,其频率特性在通带和阻带内都有很低的系数灵敏度。此外,格型滤波器还具有一些利于VLSI实现的性质,例如结构规则、模块化、互连线短等。通过流水线结构算法还可以使格形滤波器实现细粒度的流水线操作,使其更适合于高速实时信号处理和低功耗领域。
随着无线移动通信的迅速普及以及频谱资源的日益紧张,基站处理器需要完成多用户窄波段高强度的转换。对于抽头形式的横向滤波器结构,即使用一阶项和二阶项的并联结构或级联结构仍无法解决信号的高灵敏度问题。采用Levinson和Durbin算法递推出来的格型滤波器对于信号协方差矩阵特征值扩散的相对惰性,使得格型结构的滤波器具有快速收敛和优良数值特性,被认为是解决此类问题的理想滤波器。
当格型滤波器输入信号是平稳随机过程时,滤波器的后向预测误差彼此正交,因而自适应格型滤波器系统优化可以由各组成节的局部优化来完成。模块化的结构还易于采用多通道信号输入实现并行处理。也可以利用去藕后的正交信号分别作为LMS的输入信号运算提高对输入信号的跟踪速度[3]。格型滤波器的重要参数为反射系数,反射系数的稳定意味着滤波器的稳定。所以对格型算法的研究需要重点讨论反射系数,在此基础上设计合适的格型算法来构造自适应去噪滤波器。
2 自适应格型滤波算法
2.1 自适应格型滤波算法
如果将目标函数F视为误差信号e(n)的函数,而误差信号又是x(n),y(n)和d(n)的某个函数,即F=F[e(n)]=F[x(n),d(n),y(n)]。利用这种结构,可以认为一个自适应算法由三个基本要素构成:最小化算法的定义、目标函数形式的定义和误差信号的定义。
(1)对函数F最小化算法的定义:它从本质上影响自适应过程的收敛速度和计算复杂度。在最优化理论中,主要有以下几种方法来定义算法的最小化:
牛顿方法:该方法寻找目标函数的二阶近似的最小值,其参数向量的迭代更新公式为:
其中,是控制算法迭代步长的因子,它决定了参数向量变化的快慢,F[e(n)]的二阶导数矩阵是目标函数的Hessian矩阵,而是目标函数相对于自适应滤波器系数的梯度。
拟牛顿方法:是牛顿方法的简化,它通过递归计算来估计Hessian矩阵的逆矩阵,使目标函数最小化,即:
其中,S(n)是的估计值,使得
通常采用矩阵求逆引理来计算S(n),有时也采用计算有效的估计值来代替梯度向量,如递归最小二乘(Recursive Least Square,RLS)算法。
最陡下降方法(梯度方法):沿着与目标函数梯度向量相反的方向,搜索目标函数的极小值点,其更新方程的形式为:
在以上三种方法中,通常梯度方法更容易实现,牛顿方法达到最小值点的邻域所需的迭代次数更少,在许多情况下,可以将拟牛顿方法作为计算效率较高的梯度方法和能快速收敛的牛顿方法的折中。
对于任意一种最小化方法,收敛因子控制着整个自适应过程的稳定性、收敛速度以及残留误差的某些特征。对这个参数的选择需要知道关于某个特定的自适应问题的充分知识,不存在普遍解,一般通过计算机仿真获得。
(2)目标函数F[e(n)]的定义:目标函数的定义会影响梯度向量和Hessian矩阵的计算复杂度。在以计算复杂度为定义准则下,广泛采用的一些目标函数形式有
均方误差(MSE):;
最小二乘(LS):;
加权最小二乘(WLS):,其中是小于1的常数;
瞬时平方值(ISV):;
由于MSE要求测量统计平均信息,从严格意义上来讲它只是理论值。在实际中这个理想值可以用LS,WLS和ISV三个目标函数来近似。这三个函数的实现复杂度以及收敛特性都不相同。一般而言,ISV表示的是简化了很多的目标函数,实现起来容易,但它存在噪声收敛特性。LS适于在平稳环境中采用,而WLS对于慢变化环境下的应用比较多。
(3)误差信号e(n)的定义:误差信号的选择是确定选用何种自适应算法的首要步骤,因为它不仅影响算法的复杂度、收敛速度和鲁棒性等,而且对于某些自适应滤波情形,还会产生偏解和多个解的现象[6]。
2.2 自适应格型LMS算法
令为滤波器在n时刻的权系数,并且满足
定义瞬时前向、后向残差能量
这一条件保证了m+1阶前向滤波器第m+1个系数在任意时刻n的值都能够满足的条件,从而使得前向滤波器是最小相位的(即物理可实现的)。
与Burg最大墒方法中滤波器系数的估计式
相比较知,若=0.5及w(k)=1,则式(2-6)简化为Burg最大熵方法中滤波器前向、后向预测误差总的平均能量,滤波器系数的最大熵估计由式(2-7)给出。
若引入符号
式中表示m阶前向滤波器第i个系数在n时刻的值,为m阶格型滤波器的残差能量。
上面用递推公式获得滤波器系数的同时,还可得到各阶滤波器的残差能量,当残差能量不再减小时的最小阶数即为LMS格型滤波器的最优阶数。
由上面的分析可以看出,LMS格型自适应滤波器的优点是收敛速度比LMS横向滤波器快得多,而且对数据的舍入误差不敏感,其代价是需要比LMS算法更大的计算量。
2.3 牛顿-LMS算法
本算法是对环境信号二阶统计量进行估计的算法。其目的是为了解决输入信号相关性很高时LMS算法收敛速度慢的问题。一般情况下,牛顿算法能够快速收敛,但对的估计所需计算量很大,而且存在数值不稳定的问题,这导致了基于最陡下降的算法在自适应滤波中应用更广泛。
算法原理
如果牛顿更新公式:
成立,则在k+1时刻均方误差达到最小。理想情况下,梯度向量和矩阵R是已知的,但实际情况却是我们只能得到梯度向量和矩阵R的估计值,收敛因子的作用就是为了避免采用和R的含有噪声的估计值而导致算法发散的问题。
下面直接给出牛顿-MLS算法,详细推导见文献[4]。
对LMS算法进行仿真,对其收敛性进行讨论,程序及结果如下[2]:
所以在输入数据相关的情况下,基本LMS算法与LMS-牛顿算法的收敛性的比较。从(图2)中可以清楚地看出,当输入数据相关时,基本LMS算法的收敛速度将变得很慢,而LMS-牛顿算法能很好地收敛。
3 格型数字滤波器的设计
3.1 格型滤波器设计准则
因为格型滤波器的设计可归结为前向滤波器设计,这里就只讨论前向滤器设计准则。
格型滤波器n时刻的前向残差的Z变换
式中是滤波器输入信号x(n)的相关函数。
理论上,求解式(3-5)可得到m级前向滤波器的系数
然后将这些系数代入式(3-5)就可得到前向残差能量。一般情况下,阶数m越大,前向残差能量越小。
在设计前向滤波器时,当前向残差能量不再明显减小时,最小的阶数m即为格型滤波器的最优阶数。但有一个问题:格型滤波器前后级间是否存在着耦合?文献[5]P218一P221证明了不同级滤波器的后向残差正交,这说明格型滤波器前后级是解耦的,从而可以独立地设计每一级滤波器。
3.2 基于Matlab的格型滤波器仿真
首先在MATLAB上编写梯度自适应格型滤波器的程序,改变步长参数,进行一系列的仿真,对算法迭代步长、滤波器的阶数与收敛速度和滤波精度进行研究,得出最佳步长参数为硬件实现提供参考。
程序如下:
4 结语
本文首先对格型数字滤波器进行简要介绍,并简要分析了格型滤波器的结构优点以及对现实的意义。
本文对格型滤波器算法进行了研究,主要推导了格型结构的自适应算法,讨论、分析了自适应格型LMS算法的原理、牛顿―LMS算法,然后简单地分析了各种算法的性能特点。利用Matlab对部分算法进行了仿真,给出了LMS算法收敛性的仿真结果,并对仿真结果进行了简单的说明。
最后在LMS算法基础上设计了二阶格型数字滤波器并对其进行了结果仿真。
参考文献
[1]梁甲华,林争辉,林涛.基于可重构FPGA技术的自适应FIR滤波器的实现.电子工程师,2004,34(12):48-50.
[2]邓华.MATLAB通信仿真及应用实例详解.北京人民邮电出版社,2003.
[3]Kim Dai I,Wilde P De.Performance analysis of the self-orthogonali-sing adaptive lattice filter[J].IEEE Trans.signal processing,2000,80:2379-2406.
[4]马伟富,雷勇,腾欢.自适应滤波器(LMS)算法及其在DSP上的实现.四川大学学报(自然科学版),2004,VOL 41:470一473.
[5]张贤达.现代信号处理(第二版).清华大学出版社,2002.
[6]P.5.R..Diniz,刘郁林等译.自适应滤波算法与实现(第二版).电子工业出版社,2002.
[7]Makhoul J, Cossell L K. Adaptive lattice analysis of speech .IEEE Trans .1981.CAS-28:494-499
篇5
关键词:离散元,非连续介质,岩体力学,数值模拟
一.引言
当前,我国正处在一个基础建设的繁盛时期,在水利水电,核电,矿山,隧道,地下工程等各领域都会遇到地质环境复杂的岩石力学问题。为了解决工程中遇到的问题,对于岩体的力学性质有一个较为准确的把握,数值模拟是一个广泛应用的方法。
岩土力学中常用的数值计算方法可以分为两大类。一类基于连续介质的理论。如有限元方法,有限差分法,边界元法等。特别是有限元和有限差分法,应用极为广泛。连续介质方法对于处理断层、节理、裂隙这样的不连续结构面具有一定的局限性,只能处理为数不多的不连续结构面,例如,在有限元中,岩体中的节理被看作是特殊的节理单元[2];在有限差分中,岩体中的节理被看作滑移面;在有限元与边界元的耦合中,岩体中的节理被看作是边界面单元。在这些方法中,对于节理的处理都是小数量、小位移的,因此,对多结构面的不连续介质不适合用连续介质方法模拟,而应采用非连续介质方法进行模拟。于是离散单元法应运而生。
离散单元法是Cundall 于1971年提出的[3]。该法将结构面切割的岩体视为复杂的块体的集合体,允许各个块体平移或者转动,甚至相互分离。离散元法以受裂缝切割或分立的块体为出发点,块和块之间的相互作用在角和面上有接触,角点可以有较大的位移。在某些情况下如滑坡或冒顶时,岩块可以滑动甚至脱离母体而自由下落。
二.离散单元法原理介绍
离散元法的单元从几何形状上分类可分为块体元和颗粒元两大类,本文主要介绍块体元在岩石力学中的应用。
1.基本原理;
它的基本原理是牛顿第二定律,其基本思想是将岩体看成是由断层、节理、裂隙等结构面切割而成的一个个刚性或者可变形块体,块体与块体之间通过角、面或者边进行接触,块体可以平移、转动或者变形,节理面可以被压缩、分离、滑动,所有块体镶嵌排列,在某一时刻当给定块体一个外力或者边界位移约束,各个块体在外界的干扰下就会产生力和力矩的作用,由牛顿第二定律可以得到各个块体的加速度,然后对时间进行积分,就可以依次求出块体的速度、位移,最后得到块体的变形量,块体在位移矢量的方向会发生调整,这样又会产生力和力矩的作用,如此循环,直到所有块体达到一种平衡状态或者处于某种运动状态之下。因此,离散单元法比较适合于模拟节理系统在准静态或者动态下的变形过程。
2.基本方程[4]:
从力学分析角度上离散元对三大定律的满足上与有限元方法不同。从平衡方程上看,离散元采用牛顿第二定律来控制,按围绕各刚性块体形心的力平衡和力矩平衡来满足。
a.运动方程:每一个单元在任意时刻都应当满足牛顿第二定律
b.本构方程:从材料本构关系上看,离散元法避开了复杂的本构关系推导,采用在刚性块体间设置不同种类弹簧和阻尼(法向刚度和阻尼、切向刚度和阻尼)来反映材料的应力-位移关系。
c.几何方程:相对于有限元,从几何方程上看,各刚性块体间不再位移连续,而是允许大变形和断裂分开,可以模拟岩体不连续结构面的滑移与开裂。其位移联系为刚性块体间各接触点的相对速度关系。
在块体离散元中,假设块体为刚体,这样单元间法向和切向的相对位移的大小就反映了材料的变形和相互作用,这反映了材料在发生变形情况下的几何关系。岩体应力水平较低的情况下,这种假设是合理的。
上述的运动方程、本构方程以及几何方程构成了离散元法的基本方程。对于材料的塑性和破坏可以通过单元间连接元件进行模拟, 即可以用单元间弹簧的断裂来模拟材料的局部破坏或通过限制弹簧的变形和改变弹簧刚度来模拟材料的塑[4]。
三.适用范围
归纳起来,离散单元法适用于节理岩体的应力分析,其适用范围为[1]:采矿工程、露天和地下的开挖设计、地震工程、隧道工程、地下核废料处理系统
四.发展趋势
离散单元计算方法仍属于“发展中”方法,该方法在工程中应用远不如有限单元法等方法广泛。从前面所述典型问题可以看出,离散单元法若想在岩体力学中推广应用,还有很多问题需要解决。
1.离散元理论的研究
从总体上来看,利用离散元法计算工程问题的应用文章占绝大多数, 而研究离散元法的理论和算法的文章却很少。而离散元法自它诞生的那天起就带有缺乏理论严密性的先天不足。有人说离散元法是经验计算。理论基础的欠缺在块体元模型中尤为明显, 运动、受力、变形这三大要素都有假设或者简化[4]。离散元理论和算法有待于进一步研究。
接触力学模型与块体力学计算结果有直接联系,在离散元中,块体之间的接触是通过弹簧来实现的.目前广泛采用的弹簧方法还不能满足计算精度的要求,且人为因素多。建立更切合实际、人为干扰因素少或没有的接触力学模型也是今后研究的一个重要内容。
节理的确定也是经过统计分析处理的,这也是不真实的,在这些假定前提下,模拟的结果有可能偏离实际很大,因此,如何合理地确定离散元中相关参数,如何尽可能地反应真实节理在岩体中的位置和作用,这些都需要理论上的完善。
加强离散元相关理论的研究,可以保持其在模拟散体介质整体力学行为和力学演化方面的优势,可以有效地反应模拟介质地应力和应变状态,使其建立的模型满足几何、物理、受力和过程仿真的原则。另外,还应加强数值模拟结果与试验结果的比较。从中寻找离散元方法的不足,对其有针对性地进行改进。
2.与其它数值方法的耦合
有限元法、边界元法等数值方法基于连续性假设适合于解决连续介质问题, 而离散单元法适合于界面弱连接的非连续介质问题或连续体到非连续体转化的材料损伤破坏问题。因此, 如果能将离散元法与有限单元法和边界单元法等有机地结合起来, 便能充分发挥各自的长处, 可以极大地扩大该数值方法的范围。对于离散元和有限元等其他数值方法的耦合计算问题,已经有很多人进行了研究探索。离散元能否与其他数值方法如无网格方法等新兴算法进行耦合也是一个有价值的尝试。
3.多相多场耦合
随着浅部资源的逐渐减少和枯竭,矿产资源地下开采的深度越来越大。同时,地下工程建设如复杂地质条件下的核废物料堆放、地下水电站、地下厂房等的建设及深部丰富地热资源的开发利用,迫切需要展开对深部岩体力学问题的研究。由于深部岩体多处于高地应力、高温度和高渗透压即多场、多相介质耦合作用,因此,深部多相介质、多场耦合作用及其灾害发生机理与防治成为当前研究的重点之一。由于该问题的复杂性和非线性,有学者认为离散元法将成为解决深部复杂节理岩体中多相多场耦合作用问题的一种有效工具。
五.存在问题
1.在块体离散元中,依据节理、断层等结构面将岩体切割成单元。要想真实反映岩体的地质特征,就要有详细的统计资料(节理的走向、倾向、倾角、间距等),然而实际中要详细的统计这些地质资料,工作量是巨大的。实际中对节理几何信息的简化处理,可能导致误差。这是一个问题。
2.在离散元中,对于块体有不同的假设方法。1种方法是把结构面切割的块体处理成刚体,变形和破坏只沿结构面发生;还有方法把块体假设为可变形体,岩块、结构面同时可以发生不连续的变形和破坏。具体选择应视所面对的问题而定。比如如果研究对象是地表或近地表工程的块体稳定问题,在坚硬岩石条件下,如果岩石的变形相对结构面的变形可以忽略,块体可以处理成刚体,就没有必要太多地考究块体的力学参数,重点应该分析结构面的变形和强度特征。而若是在高地应力条件下,岩块变形不能忽视,再假设岩块为刚体就有问题了。
3.无论是离散单元法,还是有限元,边界元,有限差分都是很好的工具。针对不同的情况,要选择不同的工具。比如,假如受小型结构面切割的大面积块体可以处理成连续介质,岩块的变形处于主要地位,结构面的变形处于次要地位,就可以应用有限元方法来模拟。
在岩土力学中,应用数值方法计算十分普遍。然而在实际工程中,数值模拟的结果指导工程实践的作用还很有限,很多情况下,还是依靠工程人员的经验来解决工程问题。究其原因,往往问题不在数值方法本身。岩体参数的合理选择是很大的问题。
参考文献:
王永嘉,邢纪波. 离散单元法同拉格朗日元法及其在岩石力学中的应用[J].岩土力学,1995,16(2):1-13.
Goodman R. E, Taylor R. L, Brekke T. A. A mode of the mechanics of jointed rock[J]. J. Soil Mech. Div., ASCE,1968, 94:637659.
王泳嘉,刑纪波. 离散单元法及其在岩土力学中的应用[M]. 沈阳: 东北工学院出版社, 1991.
刘凯欣,高凌天.离散元法研究的评述. 力学进展. 2003,33(4):483-490.
朱焕春, Brummer R, Andrieux P. 节理岩体数值计算方法及其应用(一):方法与讨论[J]. 岩石力学与工程学报,2004, 23(20):3 4443 449.
朱焕春, 陈文理. 生成节理随机数的直接法[J]. 武汉水利电力大学学报, 1997, 30(2): 1012.
王涛, 朱焕春, 李浩, 等. 论生成节理随机数的直接法[J]. 岩石力学与工程学报, 2002, 21(4): 489492.
王涛, 盛谦, 陈晓玲. 基于直接法节理网络模拟的三维离散单元法计算[J]. 岩石力学与工程学报. 2005, 24(10): 1 6491 653.
篇6
关键词:微积分 牛顿 莱布尼兹 极限
1. 数学对自然科学的影响
数学是自然科学的基础学科,自然科学的发展离不开数学的发展。尤其是数学中的微积分理论 ,对整个自然科学的发展起了极大的推动作用 ,为自然科学中一些现象的解释提供了坚实的理论基础,使有限和无限、连续和离散、代数和几何形成了有机的结合与统一。在数学的众多学科分支中,就严谨性、应用性和简洁性而言,微积分应是最具代表性的学科之一。微积分以简洁、优美的形式把运动学问题、磁场问题、几何中曲线的切线问题、函数中最值问题、曲线长度及曲面面积和立体体积问题总结于一个高度统一的理论体系之中。因而,这一理论的产生被誉为数学史上乃至人类文明史上的伟大创造,受到历代数学家、物理学家、哲学家的盛赞。如果我们对其历史和现状作一番认真的考究,追溯这一理论产生的历史,将会使我们更深刻的认识到数学对自然科学发展所起的深刻影响。于此,微积分提出之后,遭到了许多人的猛烈抨击,其中也包括一些著名的数学家。牛顿继承和总结了先辈们的思想,作出了自己独到的建树。他把自己的发现称为“流数术”,称连续变化的量为流动量,无限小的时间间隔为瞬,而流量的速度称为流动率或流数。牛顿的“流数术”就是以流量、流数和瞬为基本概念的微分学,主观唯心论哲学家贝克莱是抨击微积分理论最强有力的人物。他愤恨牛顿的微积分理论给唯物论以支持,于是向流数术展开了猛烈的攻击。1734年,贝克莱出版了一本书:《分析学家:或一答致不信神数学家的论文,其中审查一下近代分析学的对象、原则及论断是不是比宗教的神秘,教义的主旨有更清晰的陈述,或更明确的推理。
2.关于微积分的本原问题
2.1 微积分使极限理论更加成熟
我们知道微积分的基础是极限论,而牛顿、莱布尼兹的极限观念是十分模糊的,牛顿的瞬和流数,莱布尼兹的dx和dy究竟是什么含义? 在他们各自的著述中没有给出明确和一贯的定义,在运用时也显得前后不一。牛顿和莱布尼兹在使用无限小量时,有时视瞬或dx为无限小增量,而有时视之为一个有限量加以运算,甚至把它作为零而忽略不计,这就在逻辑上造成明显的矛盾。牛顿曾用有限差值的最初比和最终比――一种萌芽状态的极限概念来说明流数的意义。但是当差值还未达到零时,其比值不是最终的,而当差值达到零时,它们比是0。怎样理解这样的最终比,牛顿也承认自己的方法只作出“简略的说明,而不是正确的论证。”而莱布尼兹的微积分以后,连当时在数学上颇有造诣的数学家象Bernoulli兄弟也颇感费解:“与其说有一种说明,还不如说是一个谜。”究竟极限是什么?无穷小是什么?在今天很容易理解。但在十九世纪以前还是一个数学上本质性的难题。基极限思想在当时也散见于各个时代著作中,如中国《庄子?天下篇》中“一尺之棰”、Zeno悖论、Endoxus的“穷竭法”、刘微的“割圆术”等和极限思想有直接关系,但这些都只能说是对极限有些模糊认识而已。十八世纪,许多数学家为维护微积分的应用价值和美学价值,在回击来自数学界内外的攻击同时,竭尽所能使微积分在理论上严密化、逻辑化,在形式更趋完美。在十八世纪前期,许多数学家,尤其是英国数学家总是企图使微积分与欧几里得几何结合起来,他们试图借助于几何学中论证之严谨体系去完善微积分。但这一努力是失败的,打破这一僵局的大数学家欧拉,他以代数方式研究微积分,力图用形式演算方式代替累赘的几何语言,使微积分建立在算术和代数基础上。达朗贝尔把牛顿的“最终比”发展为一种极限概念,并试图用极限加以定义和说明。他认为应以极限理论作为微积分的理论基础,这一思想在数学界产生了极其深远的影响。直到1821年以后,柯西出版他的《分析教程》、《无穷小计算讲义》、《无穷小计算在几何中应用》这几部具划时代意义的名著之后,微积分一系列基础概念及理正式明确地确定下来。自此以后,连续、导数、微分、积分、无穷级数的和概念也建立较坚实的理论基础之上―极限理论。我们现在所谓的极限的柯西定义或年之后半个世纪经过维尔斯特拉斯的加工才完成的。柯西把整个极限过程用不等式来刻画,使无穷的运算化为一系列不等式的推导。维尔斯特拉斯将柯西的完成了现今的-方法,形成了微积分的严谨之美。
2.2微积分―――状态与过程的统一
微积分是十七世纪数学所达到的最高成就。微积分出现以后,逐渐显示出它非凡的威力,过去许多数学家束手无策的问题,至此迎刃而解。恩格斯指出:“只有微分学才能使自然科学有可能用数学来不仅表明状态,并且也表明过程:运动。”然而,在十九世纪以前,微积分理论历史发展始终包含着矛盾:一方面纯粹分析及其应用领域中呈现出一个接一个的伟大发现与成就;另一方面则是基础理论的含糊性。事实上,无论是牛顿还是莱布尼兹,他们对微积分所作的论证都是不很严谨的和不清楚的。在欧洲大陆方面,莱布尼兹的含糊也招致了尼文(Nieuwentijt,荷兰哲学家)的反对。荷兰的物理学家和几何学家纽文也就一系列问题公开提出质问:无限小量与零怎样区别?无限个无限小量之和为什么能够是有限量?在推理过程中为什么能舍弃无限小量?包括一大批数学家也群起而攻之。尽管他们承认微积分的效用,欣赏微积分的美学价值,但却不能容忍这种方法的理论本身如此含糊甚至令人感到荒谬。法国数学家罗尔微积分为:“巧妙的谬论的汇集。”法国思想家伏尔泰则说微积分是一种“精确的计算和度量其存在无从想象的东西的艺术”。贝克莱和尼文太对微积分的攻击纯粹是消极的,他们不能给微积分以严格的基础,但他们的论点都有一定道理,在一定程度上它激励了微积分进一步的建设性工作。例如突变函数论、非线性泛函分析等学科的建立。因此,人们追求数学美,以达到精神上的愉悦,而这一点正是通过数学家经由数学的“神秘美”、“奇异美”和“朦胧美”,而最终达到完备的“统一美”和“和谐美”。
2.3微积分―――分析与几何的统一
微积分的本原问题是指它同现实世界的关系问题,即它是产生于存在还是产生于纯思维的问题。唯物主义与唯心主义有着根本不同的看法。唯心主义认为纯数学产生于纯思维。它可以先验地,不需利用外部世界给我们提供的经验,而从头脑中创造出来。杜林、康德、贝克莱等唯心主义者就是这种观点的代表。牛顿、莱布尼茨是微积分的创立者。他们分别在研究质点运动和曲线的性质中,不自觉地把客观世界中的运动问题引进了数学。各自独立地创立了微积分。这个功劳是应该肯定的。但是,他们没有很好注意到微积分同现实世界的亲缘关系。其运算出发点是先验的。所以,马克思把牛、莱的微积分称为“神秘的微分学”唯物主义认为,微积分同所有的科学一样,它起源经验,然后又脱离外部世界,具有高度抽象性和相对独立性的一门崭新的科学恩格斯指出:“数学是从人的需要中产生的”微积分是从生产斗争和科学实验的需要中产生的。生产实践对微积分的创立起着决定的作用。从十五世纪开始,资本主义在西欧封建社会内部逐渐形成。到十七世纪,资本主义生产方式有了巨大发展。随着生产发展,自然科学技术也雨后春笋般地发展起来了。它们跑出来向数学敲门,提出了大量研究新课题。微积分的创立就是为了处理十六、十七世纪在生产实践和科学实验中所遇到的一系列新问题。这些问题归纳起来大致分为四类:一是已知物体运动的路程与时间的函数关系,求速度和加速度;反过来,已知物体运动的速度和加速度与时间的函数关系,求路程。二是求曲线的切线。三是求函数的极大值、极小值。四是求曲线的弧长,求曲线所围成的面积,曲面所围成的体积等求积问题上述四类问题,形式各不相同,但有着共同的本质,即都是反映客观事物的矛盾运动过程。其中的量都在不断变化着。因此,研究常量的初等数学无法解决这些问题。生产和科研的需要,促使数学由研究常量向研究变量转化。于是微积分在传统代数学的长期孕育中,经《解释几何》这个“助产婆”的接生“而分娩了”。所以,恩格斯说:“数学的转折点是笛卡尔的变数。有了变数,运动进入了数学。有了变数,辩证法进入了数学。有了变数,微分学和积分学也就立刻成了必要的了”。
3.牛顿―莱布尼茨公式――联结微分与积分的桥梁
唯物辩证法是关于普遍联系的科学。微分与积分是一对矛盾的两个方面。它们之间的联系集中表现在互逆关系上。微分是已知原函数求导数(微商);积分则是已知导数求原函数。微分与积分的互逆关系,揭示了导数与原函数的对立统一关系。原函数经过微分转化为导数。导数在积分过程中又还原为原函数。微分与积分相互转化的辩证过程普遍存在于自然界中。前面说过,水分子的蒸发与凝聚的过程就是微分与积分矛盾转化的过程;在几何学中长与宽、面积与体积的相互转化;在物理学中路程与速度、速度与加速度的相互转化,都可以用微分与积分相互转化来描述。微分与积分这种相互联系、相互转化的辩证内容尽管在现实世界早已存在。但在数学领域里,这种互逆关系在“牛顿―莱布尼茨公式”诞生前一直被隐藏,未被人们所认识。这是因为微分与积分在发展历史上各有渊源。在几何学中,前者和计算切线的斜率有关。后者则和计算曲边形的面积相联系。牛顿、莱布尼茨之所被认为是微积分的创立者,主要是他们发现了微分与积分的互逆关系,找到了根据导数求原函数的一种简便方法,从而把表面上互不相干的两种运算统一起来了,使微分与积分成为一种普遍意义的强有力的数学方法,为数学的发展开发开辟了一条新的康庄大道。牛顿―莱布尼茨公式是微积分的基本原理。它表述为设函数?(x))在(a? b)上连续。如果函数F(x)是函数?(x)的一个原函数,则有:b ∫ ?(x)dx=F(b)-F(a)a这个公式左边是一个定积分,右边是原函数在(a?b)两端值的差。它把数轴在一个区间的定积分同这个区间端点的原函数联系起来了,揭示了微分与积分的对立统一关系。为了说明这个问题,我们从分析具体问题入手,先来考察质点在直线上的变速运动。设时刻t时质点在直线上的位置是s(t),那么从时刻t=a到时刻t=b这一区间,质点运动的路程为s(b)-s(a)。这是质点运动的一个方面。
再从另一个方面看。设已知质点在时刻t内的瞬时速度为u(t),我们用另一种方法可从u(t)计算出质点所走过的路程为:b ∫ u(t)dta 由于这两个表达式都是表示同一质点在同一时间内所走过的路程,因而应该是相等的,即b ∫ u(t)dt= S(b)-S(a) a 从微分角度看,路程函数S(t)的微商是速度函数u(t)dS(t) ― =u(t) 或 dS(t)=u(t)dt dt b从积分角度看,速度函数u(t)的积分值∫ u(t)dt a 表达了路程函数S(t)的两点值之差S(b)-S(a)。这里的b是任意固定的,有一个b就有一个S(b)与之对应。这样当我们深入一步,从运动的角度看公式时,即把b视为变量t,它给出了用定积分表达路程函数的方法:t ∫ u(t)dt=S(t)-S(a)at 这就用变上限的积分∫ u(t)dt表达了路程函数S(t)。因而 adF(x)=?(x)dx在区间(a?b)上的无限积累。微分与积分的同一性与差异性都包函在牛―莱公式之中。其同一性的一面是微分与积分共处于牛―莱公式之中,互相依存,互相贯通,在一定的条件下相互转化。原函数在微分条件下转化为导函数;导函数在积分条件下转化为原函数。微分把“有限”转化为“无限”,而积分又把“无限”转化为“有限”。牛―莱公式就是在这种“有限――无限――有限”的转化中,把定积分计算变为不定积分计算,把繁杂的极限计算转化为原函数两点值之差的运算。从而找到了计算定积分的捷径。然而,牛―莱公式的两边不是绝对的同一,绝对的统一,绝对的转化,而的有差别的同一,对立的统一,有条件的转化。公式的两边仅仅是数量上的同一,两边各自的性质、地位与作用并不相同。这个不同正是微分与积分的差异性,即互逆关系的表现。归纳起有三个方面:其一,两者所反映的事物性质不同。在物理学中微分所描述的是物体运动的路程向速度转化以及速度向加速度转化的过程;而积分却反其道而行之,它描写的是加速度转化为速度,速度转化为路程的过程。在几何学中微分就是求曲线的切线;而积分是求弧长,求曲线所围成的面积,曲面所围成的体积。一般地讲,微分就是已知函数求函数的变化率;而积分是根据函数的变化率求函数。其二、两者所处的地位不同。在微分与积分这对矛盾中,一般地说微分是矛盾的主要方面,居于支配地位;积分是矛盾的次要方面,居于被支配地位。微分是积分运算的前提和基础。进行积分运算,首先要“化整为零”,进行无限分割,即微分。无微分就不可能进行积分。但是积分又不是消极被动的。在导函数向原函数转化过程中,最后是由积分来完成的。没有积分就无法完成这一转化。其三、各自的作用不同。微分是把整体分成无限多个无穷小量,完成以“直”代“曲”的转化;而积分又把无穷多的无限小量累积起来,实现以“以曲代直”。微积分的“曲”与“直”、“有限”与“无限”的相互转化正是在微分与积分的相互作用、相互制约下实现的。它推动微积分的基本矛盾――“直”与“曲”,“匀”与“不匀“的矛盾运动,解决了初等数学无法解决的矛盾。
参考文献:
[1]张楚迁《数学文化》高等教育科学出版社
[2]张顺燕《数学的源与流》《数学的美与理》
[3]邓东皋 孙小礼 《数学与文化》
[4]克莱茵 《古今数学思想》
[5] 王树和《数学思想史》
[6]李文林《数学史概论》
篇7
高分子材料加工涉及的通常是高分子材料成型加工方法,化工原理课程也是海南大学(以下简称“我校”)高分子材料与工程专业的一门专业基础课。学生在初学化工原理时可能感觉与高分子加工技术相差较大,对将来专业知识没有直接帮助,学习的积极性与主动性均难以充分调动,甚至还易产生消极抵触的情绪。因此,在课程刚开始的绪论这一章的教学中在介绍什么是化学工业过程时笔者不以教材里的传统化工加工为例,而是详举高分子行业中运用化工原理知识进行材料加工处理的实例,提前介绍一些高分子材料加工的方法,拉近学生与传统化工加工技术的距离,让学生理解高分子加工的一些操作与传统化工类的操作间的异同点,以便消除同学们内心的疑惑,指明高分子材料加工专业的同学学习化工原理知识的必要性。如天然橡胶的初加工是海南(以下简称“我省”)省的特色产业也是我校高分子材料专业的一个重要方向。从天然橡胶树上采割的胶乳经过一系列的处理得到干胶产品(如图所示)。在这个过程中干燥、浓缩、压片等操作与传统化工生产中的相关的单元操作一样,所用的基本原理相同,设备基本通用。高分子材料如聚乙烯的合成中乙烯气体在常压常温下,加压输送合成前的加热升温操作及反应后产物的分离与传统化工专业的流体输送原理及加热原理是相同的,所用设备是相通的。
二、将高分子加工工艺融入化工原理的课程教学中
在高分子材料的加工中采用了大量的化工单元操作。但这些高分子加工艺在传统的化工原理教材中是看不到的。这就要求任课教师具有高分子材料加工方面的知识背景,这样可以将高分子加工工艺中运用到的化工原理的知识融入课程的教学中,学生领会到该门课程的知识在专业知识中的基础作用学习兴趣才会提高,并且在将来的工作中能有意识地提前运用化工原理的理论知识,进行企业的节能降耗等的工艺改进。如在以动量传递理论为基础的单元操作的有关教学中,教材通常是以牛顿型流体如水、苯或甲苯等常规化学品的流体输送为例,而高分子材料专业的学生处理对象多为大分子材料,所处状态通常固体颗粒或黏稠状态,属于非牛顿型流体范畴。因此教材中的例子缺乏对高分子材料专业学生的足够吸引力,难以达到应有的示例效果。教学中我们以胶乳厂中天然浓缩胶乳的生产工艺为例,说明工艺中我们利用泵提供新鲜胶乳能量,促使其流入高速离心机中,而离心机是非均相物分离的一个单元操作。高分子量的聚异戊二烯在离心机转鼓的轴中心较远的地方富集,而小分子如水分、小分子量的聚异戊二烯在轴中心附近富集。将这两个位置的乳液分别导出就分别得到浓缩胶乳和胶清胶,并利用非牛顿型流体的阻力计算方法表明,由于胶乳的黏稠度远大于水的黏度在动力消耗上要比同等条件下输送水的动力消耗大。鉴于在塑料或橡胶的加工生产中大量运用到了螺杆挤出机。所以在流体输送设备介绍中,笔者是以螺杆挤出机在塑料加工中的应用为例,说明螺杆挤出机的工作原理,并且介绍在塑料挤出机的料斗的颗粒进料系统中可以利用固体流态化技术,采用真空吸料或用鼓风机压料进行原料输送。在以热量传递为理论基础的单元操作中,在介绍以导热方式进行的热传递时,笔者以未硫化胶膜在平板硫化仪内加热硫化为例进行导热说明。而以塑料在螺杆挤出机内或橡胶在炼胶机上进行塑炼时的粘流态受热为例介绍对流传热热传递方式。在以质量传递为理论基础的单元操作中,以粉末涂料的生产为例,介绍喷雾干燥工艺。这些将高分子材料加工工艺融入化工原理的课堂教学中,拉近了材料加工与化工原理知识间的距离,提高了学生学习的兴趣,起到明显的教学改革效果。
三、以高分子材料为实验对象
化工原理一般是同学们从公共基础课转向专业课学习所接触到的第一门工程性课程,亦是一门理论与实践紧密结合的技术基础课程。它的实验课教学设计至关重要,其不仅关系到整门课程教学效果的好坏,更是决定能否推进该课程素质教育的关键环节之一。为提高高分子材料类专业同学参与化工原理实验课的学习热情,笔者在实验教学中选择高分子材料进行相关的实验。如干燥实验中有的专业以甘蔗渣纸板为实验对象,获得有关纤维的干燥过程曲线和干燥速率曲线。而我省特色产业天然胶乳加工中有将天然胶乳干燥制备成干胶的这一操作。为了结合我校的高分子材料专业,专业实习提前将有关化工原理的知识融入到专业学习中。实验中以天然胶乳制备的湿膜片为实验材料,获得天然胶乳薄膜制品的干燥过程曲线和干燥速率曲线,为以后同学们去胶乳厂参观实习提供理论和实验依据。这一举措不仅有效激发了同学们参与实验研究的主动性,反过来也极大促进了该课程理论学习的积极性。
四、有的放矢传授教学内容,适应少学时的课程教学计划
篇8
1 引入物理发展史教学,激发学生学习物理的兴趣,提高学生的学习效率
有的学生提起物理学习就头痛,以致于失去学好物理的信心。面对这种情况,我们不妨给学生讲一些着名物理学家成才的故事,就会激发起学生的学习。例如:牛顿在小时候的学习成绩并不是很好,很多考试成绩不及格,但经过努力,最终成为着名的科学家。把这些事例讲给学生听,他们会感到物理学家也就是平凡人,和自己区别并不大,只要努力也能学好物理。其次, 讲述知识的得出过程,来激发学生的学习兴趣,例如:在讲牛顿第一定律的时候,讲理想斜面实验后,再介绍伽利略斜塔实验时大铁球、小铁球同时下落,加上牛顿管中羽毛与铁片同时下落的实验,说明力是改变物体运动状态的原因,学生就听得非常入神。引出牛顿第一定律的得出过程,给学生增加了很大的学习兴趣,学生有了学习兴趣,学习才会更加主动,遇到问题时解决问题才更加有了信心,也使学生在学习过程中养成了严谨的学习态度,不断提高自己的科学素养,变被动学习为主动学习。
2 通过物理学史的学习,增强学生对物理知识的全面理解和掌握,提高学生的学习效率
对于物理学中各个基本概念、基本原理和定律,只有了解它们产生、形成和发展的过程,即了解它们是如何得来的,又如何演变发展成为现在这个样的,才能真正懂得它们的本质,在教学中也才能深入浅出,讲深讲透,课堂教学效率无形中就提高了。通过物理学史的学习,有助于学生了解具体的概念、定理,定律的来龙去脉和具体的发展过程,可以使学生对该知识有更深层的理解和掌握,而不再是简单地记住一些概念、公式和定律,这样,学生对知识的掌握会更加牢固和熟练,学习效率自然就会提高。
3通过物理学史的学习,使学生树立正确的价值观,从而学生学习的内在动力,提高学习效率
物理学史集中体现了人类对物理世界的探索和逐步认识的历程。他们的事迹留给我们更多的是一种精神:探索未知,发现真理、献身科学事业的精神。在物理学史上,有许多物理学家具有难以想象的毅力、信心和意志。他们与困难或过时传统的观念作斗争,以及与科学界内部和外部的阻力作斗争,甚至还要经受恶势力的迫害,这需要科学家顽强的意志和献身科学的牺牲精神。居里夫妇研究放射性元素,受放射性元素射线的危害,历经四十多个月艰苦劳动,数万次的反复提炼,才从几吨沥青铀矿渣中提炼出了0.12克的氯化镭,布鲁诺为卫科学真理义无反顾地走上了十字架被活活烧死,像这样一些生动的事例,在物理学史上比比皆是。物理学史在培养学生高尚的情感、进取的人生态度、树立正确的价值观方面具有不可替代的作用。
4学习物理学史,对学生进行爱国主义教育,使学生在学习中获得高尚品格,自觉地投身到学习中去
篇9
公元前212年,当古罗马军队攻进叙拉古城时,统帅马塞勒斯出于对阿基米德才能的敬佩,曾下令不准伤害这位旷世绝伦的大师。而沉迷于数学世界的阿基米德此时似乎并不知道城池已破,直到一个罗马士兵的影子落在了他画在炭灰地上的图形上。
一种传说是,那个冒失的士兵一脚踩在了图上,阿基米德气冲冲地喊道:“别碰我的圆!”另一种说法是,罗马士兵喝令阿基米德去见马塞勒斯,遭到了他的严词拒绝——他要首先解出自己的(数学)问题。不管是哪一种情况,最终都由那个暴怒的士兵用剑做了快速了结。一个75岁高龄的人类奇才就这样撒手人寰。两千多年后,英国数学家、哲学家怀特海发出如是感慨:没有一个人会由于全神贯注于对一个数学图形的冥想而丧生。
故事没有讲完。马塞勒斯对于阿基米德的死深感悲痛。他处决了杀死阿基米德的士兵,并为阿基米德修了一座陵墓。在墓碑上,根据阿基米德生前的遗愿,刻上了球内接于圆柱的几何图形。
阿基米德的主要兴趣是在纯几何方面,他自认为发现圆柱体体积和它的内接球体的体积比例,是他平生最大的成就。这一立体几何难题求证的是:当一个球体内接于一个圆柱体时,它的体积是圆柱体体积的三分之二,而这一球体的面积是其外切圆柱体表面积的三分之二。上述定理是从球面积等于其大圆面积的4倍这一定理推导出来的。
随着时间的流逝,阿基米德的陵墓被荒草湮没了。在他逝世100多年后,公元前75年,担任西西里行政官员的罗马政治家和作家西塞罗找到了他的坟墓,西塞罗写道:“发现它四周都是封闭的,并被荆棘丛和灌木丛覆盖着……我注意到有一个小柱状物从灌木丛中伸了出来,在这个柱状物上有一个球体和一个圆柱体图形。”
西塞罗重新修复了阿基米德的坟墓,聊表景仰之忱。
作为希腊化科学的杰出代表,阿基米德在数理科学和工程技术上建树颇多,并把数学原理应用于多项发明,堪称古代世界最伟大的数学家和“实干科学家”。他对科学的特殊贡献在于,他曾利用实验或是发明来测试理论,而且他认识到可以用数学方法描述的基本原理是物理现象的基础。也正是他第一次把数学应用到物理上,创造了力学的科学。他有一句名言:“给我一个支点,我就能移动整个地球。”
在科学史上,阿基米德由于最先表述了几个基本定律而闻名,它们都跟现实生活的应用大有关联,而且还留下了不少佳话。比如,他为辨别金王冠是否掺假而苦苦思索,在洗澡时从溢出的水获得灵感,发现并总结出浮力定律,同时也解答了国王的困惑。
再如,他利用扎实的杠杆原理知识,设计制造了一套精细的杠杆和滑车,不借助任何外力而将一艘满载货物的大船从港口一直拉到了岸上。当马塞勒斯率领的罗马军队第一次进攻叙拉古城时,阿基米德设计的巨型投石机抛出一连串大石块,砸毁了敌军的8条大木船。他还利用滑轮和杠杆原理设计了一种军用机械,可以用铁“嘴”把敌船“叼”起来,在空中摇晃并猛摔在悬崖上。另有传说,公元前215年,在马塞勒斯率大军乘战舰攻打叙拉古的危急情况下,阿基米德利用凹面镜的聚光作用,把阳光集中到一点照射到入侵的罗马战船上,由此产生的高温引起熊熊大火,击溃了敌军。
2005年,美国“发现”频道的“传说终结者”节目,出钱赞助美国麻省理工学院等名校的学者模拟了当时的场景。试验者用300平方英尺的黄铜和玻璃制成了一面巨大的凹面镜,然后在150英尺之外把强烈的光线聚焦到一艘老木船上,试图把这艘船点着。但令人失望的是,虽然这艘老木船被烤得冒烟,但始终没有燃起火苗。随后,科学家们又把这面凹面镜移到了距木船75英尺的地方,这回火苗倒是按预期燃起来了,但小得可怜,并且一会儿就自动熄灭了。
参与实验的一位大学教授表示,尽管实验没有取得传说中的效果,但从理论上说,利用聚光点燃物体是绝对可能的,那么谁又能肯定阿基米德没有用凹面镜来攻击罗马战船呢?在历史上,阿基米德是一个非常伟大的数学家,我们不能因为实验的结果而低估他的智慧和能力。
阿基米德的著作明显反映出他对现代科学的预知。常常有一种说法:假如那时阿基米德能运用一套合适的数学符号的话(那个年代里阿拉伯数字系统和代数符号尚未问世),那么他就会早于牛顿两千年发现微积分。
美国数学史家E.T.贝尔指出,全部历史上任何3个“最伟大”的数学家的名单都将包括阿基米德的名字。通常与他相联系的另外两个名字是牛顿和高斯。要是考虑到在这些巨人各自生活的时代,数学和物理学的相对充足或贫瘠,并依据他们所处的时代背景来评价他们的成就,一些人会将阿基米德排在首位。
篇10
科学革命的实质是什么?科学进步的图像是什么?换言之,科学革命变革的主要实体是什么?科学发展的模式是什么?国外学者对此问题做出了形形的回答。
一、国外学者的回答
波普尔(K.Popper)认为,科学是人类心灵的壮丽探险,科学的本质就在于永无止境的探索。他把“问题”作为整个科学探索的起点,运用“可否证性”(falsifiability)或“否证”(falsification)概念,提出了科学进步的四段图式;P1(问题1)TT(试探性理论)EE(消除错误)P2(问题2)。这个图式周而复始,永无止境。显然,波普尔把理论看作科学变革的实体——科学革命是科学理论的变更,因此理论是暂时的、脆弱的,它随时都可以被一次否证。
本世纪60年代初,库恩(T.Kuhn)出版了他的代表作《科学革命的结构》。在这本小册子中,库恩反对逻辑经验主义把科学的发展看成是各种货色一件件地或—批批地添加到不断加大的知识货堆上。他力主动态地、历史地看待科学的进步,把科学的发展视为常规时期和革命时期交替出现的过程。他不满意波普尔把理论看作科学变革的实体,他的科学观的核心是“范式”(paradigm)概念。库恩给范式赋予多种含义(有人统计共有21种用法),从“一种具体的科学成就”到“一组特定的信念和预想”。综而观之,它是由理论要素、心理要素以及联合这两个要素的本体论和方法论要素组成的,每一种要素内又包括五花八门的具体内容。库恩认为科学革命就是抛弃旧范式,采纳新范式。他利用范式概念建立了下述的科学发展的动态模式:前科学常规科学危机科学革命新的常规科学……
库恩开创了以科学史料为基础来考察科学哲学问题,探讨科学发展和知识增长规律的先河。继库恩之后,又有拉卡托斯、费耶阿本德、劳丹等人的学说汇入其中,形成了一股历史主义的潮流。
拉卡托斯(I.Lakotos)既不满意波普尔的否证主义,也不满意库恩范式的模糊性和选择范式的非理性标准。为了强调科学发展的连续性和科学进步的合理性,他提出了研究纲领的模式。在拉卡托斯看来,科学总是以研究纲领的形式向前发展的。科学发现和评价科学理论的基本单位是研究纲领,它是一个有结构、有层次的整体。研究纲领内部有相对稳定的“硬核”,外部是柔韧多变的“保护带”,还有一套解决疑难的机制,即助研究法(heuristic)。硬核是约定的,是作为研究纲领未来发展基础的、最普遍的基本假设和基本原理,它比范式具有更大的稳定性。保护带由各种辅助假设构成,当遇到反常或否证时,保护带可以通过调整辅助假设而达到保护硬核的目的。当研究纲领失去解释力和预测力时,它就会因逻辑的和经验的原因而碎裂,人们就会抛弃这样的退化的研究纲领,而采纳进步的研究纲领,这是科学革命的基本原理,是一个自然的新陈代谢过程。
在同库恩的论战中,费耶阿本德(P.Feyerabend)描绘了他的科学发展模式。他认为科学有一定的“韧性”,人们总能够从许多理论中选出一种可望取得成功的理论,即使遇到巨大困难时仍可加以坚持,而置大量反证于不顾。在这一点上,他不赞同波普尔关于理论总是被不断驳倒的观点。有了韧性,我们就不必用顽强的事实取消某一理论了,我们可以使用其他理论T′、T″、T″′等,即对现行的理论进行调整,这就不可避免地要接受增生原理,容许不同理论的并存。在这一点上,他又坚决反对范式的绝对统治。在费耶阿本德看来,科学之所以不断发展,正是增生与韧性相互作用的结果。
劳丹(L.Laudan)把科学看作一种解决问题、定向问题的活动。他同意理解和评价科学进步的工具是较一般的大理论,而不是单个的具体理论。他认为这种大理论不是范式或研究纲领,而是所谓的研究传统。研究传统为发展具体理论提供了一套指导方针。它们中的一些构成了一种本体论,以—般方式详细阐述研究传统所属领域中的基本实体的类型。研究传统中具体理论的作用,就是通过把经验问题还原为研究传统的本体论,来解释这些经验问题。研究传统还概括了这些实体相互作用的方式。研究传统也往往说明某种程序,它构成这一传统内的研究者所愿意接受的合法的研究方法。这些方法论原则广泛包括试验技术、理论检验和评价方式等。简而言之,研究传统就是有关领域的一组本体论和方法论的“做”与“不做”。在劳丹看来,科学革命不过是竞争着的研究传统之间的特别引人注目的一次决定性冲突所带来的研究传统此消彼长的新格局。
为了说明科学革命的实质并描绘科学进步的图像,其他西方学者也从不同的角度对库恩的范式论进行了批判、修正和改造。例如;尼古拉斯•麦克斯韦(NicholasMaxwell)的“形而上学蓝图”、斯尼德-斯台格缪勒(Sneed-Stegmüller)的“理性重组”(S纲领)、夏佩尔(D.Shapere)的“域”(domain)理论等,我们对此不拟一一加以介绍。在这里,有必要提及苏联学者凯德洛夫(Б.М.Кедров)的观点。
凯德洛大是从列宁关于革命的普遍定义出发来论述科学革命概念的,他从认识论和方法论两个方而对“革命”概念进行厂逻辑分析,并详细论述了科学革命的三个特点。在此基础上,他对科学革命做了下述定义:“所谓自然科学革命,应当首先理解为研究和说明自然现象的观点本身的根本转折,用来认识(反映)所研究的对象的思维结构本身的转折。真正的自然科学革命的实质恰恰在于思维方式这种急剧的转折,恰恰在于由已经陈旧的科学认识方法向新的进步的科学认识方法的转变。”以此为根据,凯德洛夫把历史上的科学革命分为四种不同的类型:第一类革命——哥白尼革命——从外观到现实性,第二类革命——康德革命——从不变到发展,第三类革命——“自然科学最新革命”(列宁在《唯物主义和经验批判主义》中的称谓),第四类革命——科学技术革命。在凯德洛夫看来,这也是在科学史上先后发生的四次革命。鉴于这个问题本文作者已有专文论述,此处不拟赘述。
国外学者的探索是难能可贵的,他们构造的实体和模式都从不同方面或角度说明了科学进步的事实,包含有部分的真理性。但是,他们的实体似乎都没有抓住科学革命的实质,他们的模式也不完全能说明科学发展的历史实际。波普尔把科学变革的实体视为理论,他涉及的层次似乎偏低,结果他的四段图式导致了走马灯式的“不断革命”。劳丹的研究传统、凯德洛夫的思维方方式,指的都是科学的哲学基础或科学中的哲学成分,其涉及的层次恐怕偏高,把它们的变革看作是科学革命的实质,似乎也没有深中肯綮。拉卡托斯的研究纲领、费耶阿本德的韧性原理和增生原理,尤其是库恩的范式,又显得过于庞杂,使人不得要领。
那么,科学革命的实质或科学革命变革的主要实体究竟是什么呢?弄清这个问题,才能比较正确地描绘科学进步的图像。而要弄清这个问题,必须首先从分析科学理论的结构入手。
二、科学理论的基础或框架——科学观念
不少人承认,科学革命的最关键的因素是重建科学理论的基础或框架。然而,人们对这样的基础的理解却不尽相同。有人认为科学理论的基础是这门科学的经验材料、基本理论原理和基本概念的总和;有人认为它是基本理论的、逻辑的或哲学的思想观念;有人认为它是本体论和方法论的信条;有人认为它是世界图像、研究的普遍方法、解释的思想、知识的构架;还有人认为它是认识活动的全部综合,其中包括主体及其目的和任务,认识的手段、方法和条件,知识的认识作用和体系,等等。
说起来,爱因斯坦对科学理论的结构是有真知灼见的。他在谈到科学理论时这样写道:“科学一旦从它的原始阶段脱胎出来以后,仅仅靠着排列的过程已不能使理论获得进展。由经验材料作为引导,研究者宁愿提出一种思想体系,它一般地是在逻辑上从少数几个所谓公理的基本假定建立起来的。我们把这样的思想体系叫做理论。”爱因斯坦以理论物理学为例,说明科学理论的完整体系是由基本概念、被认为对这些概念是有效的基本关系以及用逻辑推理得到的结论这三者构成的,其中前两者是科学理论的基础或根本部分,它们不能在逻辑上进一步简化。在爱因斯坦看来,所谓基本关系,就是基本概念之间的根本关系,他往往又称基本关系为基本假定、基本假设、基本公设、基本公理、基本原理、基本定律、基本命题等。爱因斯坦在一些场合还把基本概念和基本关系统称为基本观念,或曰科学观念。这样一来,科学观念就是科学理论的基础,它也是科学理论的逻辑前提或框架。
例如,牛顿力学的理论基础是:具有不变质量的质点,任何两个质点之间的超距作用,关于质点的运动定律。在狭义相对论中,就是相对性原理和光速不变原理以及同时性概念等。
科学观念(基本概念和基本关系)虽然在科学理论的逻辑结构中仅占很少的比重,但由于它是最核心、最抽象的部分,因而反映了科学对象的最深刻、最本质的联系,蕴涵着十分丰富的内容,从中可以导出原先料想不到的结论(如从狭义相对论的前提导出质能关系式),甚至还隐含着“尚未理解的东西的残余”,它的更隐秘的根源有待于人们进一步去揭示。
爱因斯坦十分强调科学观念在科学理论中的显著地位。他认为通过最少个数的基本概念和基本关系的使用,就可以尽可能完备地理解全部感觉经验的关系。他甚至认为理论物理学的目的,就是要以数量上尽可能少的、逻辑上互不相关的假设为基础,来建立概念体系,如果有了这种概念体系,就可能确立整个物理过程总体的因果关系。
关于科学理论的基础的来源、特点及其与感觉经验的关系,爱因斯坦有一段原则性的论述(他虽然是就物理学而言的,实际上也适用于其他理论科学):“物理学构成一种处在不断进化过程中的思想的逻辑体系,它的基础可以说是不能用归纳法从经验中提取出来的,而只能靠自由发明来得到。这种体系的根据(真理内容)在于导出的命题可由感觉经验来证实,而感觉经验对这基础的关系,只能直觉地去领悟。进化是循着不断增加逻辑基础简单性的方向前进的。为了要进一步接近这个目标,我们必须听从这样的事实:逻辑基础愈来愈远离经验事实,而且我们从根本基础通向那些同感觉经验相关联的导出命题的思想路线,也不断变得愈来愈艰难、愈来愈漫长了。”
三、科学革命是科学观念急剧而根本的改造
科学观念是科学家或科学共同体借助于经验事实的提示,通过思维的自由创造和理智的自由发明而抽象出来的。它在逻辑上不能再加以分析,是不能再简化的一种逻辑元素,其中包含着人们当时还不甚理解的东西。因此,它反映了在科学发展的一定历史阶段人们对科学对象的认识,是当时历史条件下科学认识的界限,只具有相对的意义。随着时间的推移,大量反常现象和新的经验知识无法纳入这一框架之中,它自身的尚未被理解的残余也充分被揭示出来。这样,原来被视为基本概念和基本关系的东西不再是“基本”的了,它从科学发展的形式变为科学发展的桎梏。只有打碎旧的科学观念,科学发展的潜力才能充分发挥出来。这时,科学革命的时机就成熟了。
科学革命并没有抛弃已有的经验材料和经验知识,而只是改变了理解这些材料和知识的准则,确定了它们的合法地位。彭加勒说得好,只要人们不把那些用实验确证了的理论推到极端,“它就会有十分清楚的意义”,“只有它溶化到更高级的和谐中,它才能消失。”科学革命打碎的只是科学理论的旧框架,摧毁的只是科学理论的旧基础。爱因斯坦谈到这一点时说过,这里的基础这个词,并不意味着同建筑的基础在所有方面都有雷同之处。从逻辑上看,各个物理定律当然都是建立在这种基础上面的。建筑物会被大风暴或者洪水严重毁坏,然而它的基础却安然无恙;但是在科学中,逻辑的基础所受到的来自新经验或者新知识的危险,总是要比那些同实验比较密切接触的分科来得大。基础同所有各个部分相联系,这是它的巨大意义之所在,但是在面临任何新因素时,这也正是它的最大危险。
在科学革命中,即使是旧的科学观念,也并非统统被抛弃,其中一部分是辩证的扬弃。旧科学观念中的一些只是丧失了自己以前独有的统治地位,从以前的不正确的、与事实不符的壳体中解放出来,被赋予新的意义。它们原有的真理颗粒被保留下来,并作为从属成分有机地溶入新科学观念之中。
从历史上的科学革命来看,科学观念的改变通常有以下几种方式。1.彻底取代。如以地球为中心的观念被以太阳为中心的观念取代,原子不可分的观念被原子有内部结构的观念取代,超距作用被媒递作用取代,目的论和神创论被进化论取代。2.旧名新意。如道尔顿的原子论虽然可以追溯到古希腊的原子论,但他把纯哲学思辨变为科学的论证,给原子论以真正的科学内容。又如经典力学中的质量、惯性、时间、空间等基本概念在相对论中已被赋予新的含义和内容。3.合理推广。如力学中的相对性原理在狭义相对论中被推广到光学和电磁学,在广义相对论中又被从惯性系推广到加速参照系。4.辩证综合。如光的微粒说和波动说被综合为波粒二象性,分立的粒子的概念和连续的场的概念被综合为物质波的概念。5.包容蕴含。如能量子概念否定了“自然无飞跃”的传统观念,但这只在微观过程才显示出来,在经典系统中,由于h很小(h=6.626×1027尔格•秒),使得分立的能量谱实际上无法区分而连成一片,这时能量的连续作为极限情况被包括在新概念内。6.独辟蹊径。如自然选择、光速不变原理、等效原理、海森伯测不准关系、泡利不相容原理等都是在科学革命中提出的新观念。
对科学革命中原有经验知识的地位和科学观变革方式的考察,使我们清楚地看到,科学革命尽管使科学本身发生了质的变化,但是在新旧科学理论体系之间也存在着明显的继承关系。同时,也可以看到,科学革命的形式不仅有库恩所说的“危机”型,还应该容许其它形式存在,如“综合”型、“推广”型等等。
革命性变革最深刻的普遍特征是形成新理论体系的实体基础,而这样的实体基础就是科学观念,因此科学革命的实质是科学观念急剧而根本的改造。
在这里,我们之所以选择“改造”这个词,是经过深思熟虑的。在汉语中,改造一词具有双重含义:其一是,“就原有的事物加以修改或变更,使适合需要”;其二是,“从根本上改变旧的、建立新的,使适应新的形势和需要”。这样,“改造”一词就能恰如其分地描绘出科学观念的各种变革方式,体现了科学中的革命与继承的辩证关系。我们在“改造”二字前加上“急剧”和“根本”两个修饰语,无非是从速度上和程度上强调科学观念的改造是迅速的、彻底的,而不是缓慢的、逐步的、局部的、审慎的、尽可能少破坏的。因此,我们所谓的科学革命,指的是一种整体性的革命,这既可以针对整个科学而言(如历史上的三次科学革命,即以哥白尼的《论天球的运行》和牛顿的《原理》为标志的革命,以道尔顿的原子论、达尔文的进化论、麦克斯韦的电磁理论为标志的革命,以相对论和量子力学为标志的革命),也可以针对某一学科而言(如物埋学革命、化学革命、生物学革命等)。至于某一学科内部某个理论体系中的个别科学观念的变化,我们一般不称其为科学革命,而把它视为科学观念的局部变革(也有人称之为“局部革命”或“小型革命”)。这种变革虽然也是科学观念的部分质变,但并未引起整个科学观念的根本质变。
把科学观念作为科学革命中的变革的主要实体,一个优点在于它的明晰性,因为它不像范式、研究纲领等那么庞杂、含混。更为重要的优点在于它的合理性。科学观念是属于经验成分(经验知识、具体的理论等)和哲学成分(本体论、方法论、自然观、思维方式等)二者之间的中间层次。—方面,它是科学理论的基础,与科学具体理论本身紧紧相联。另一方面,它又是高度思辨、高度抽象的产物,与哲学成分密切相关。它既不像科学理论那么脆弱,易受实验触动;也不像哲学成分那么僵硬,难以改变,而具有相对的稳定性和一定的可变性。这就避免了波普尔、库恩等人的观点的缺陷。
在这里,有必要从更广阔的视野上稍加考察。事物的本质基础并非建筑在这一事物的范围内,而是以这一事物的全部因素为基础。基础属于这一事物,同时又不完全属于它。在一定的关系中,基础应该是内容丰富的,基础是体系的决定性的属性。作为科学理论的基础的科学观念正是这样,它决定着科学理论的性质:它属于科学理论体系,但在某些方面似乎又超出了科学理论体系的范围,因为它具有浓厚的哲学色彩。严格地讲,像本体论、方法论、思维万式、自然观等哲学成分,并不是科学理论体系之内的东西,它们是外在的。把科学革命的实质归结为某一种或某几种哲学成分的转变是不妥当的,因为科学革命毕竟不是哲学革命,科学革命变革的主要实体只能在科学自身中寻找,而无须到哲学中去寻找。
科学革命的最关键因素,科学革命的核心是形成本质上全新的基础。不过,在科学观念发生急剧而根本的改造的同时,科学理论也会焕然一新。也就是说,新的科学框架不仅能容纳已有的经验知识,而且还能容纳许多新的经验知识,而这些新知识是无法纳入旧科学框架中去的。另外,由于科学观念与那些哲学成份有千丝万缕的联系,新科学观念对旧科学观念的否定,必然耍伴随或导致新的自然观、方法论和思维方式等的全面变革。因此,笔者尝试给科学革命下这样一个定义:科学革命是科学观念急剧而根本的改造,与此同时,也伴随或导致科学理论、自然观、方法论和思维方式的全面变革。科学革命这一概念是关于科学进步的辩证诠释的基本概念。
四、科学发展的“进化一革命”互补图像
作为科学理论基础或框架的科学观念具有完整性、内在统一性和进一步发展的能力,这些逻辑构架起着组织、建立以及解释科学理论的作用,并调节和控制获得新知识的过程。因为它们在某种程度上是科学的(正确的、郑重的、不是荒唐的)抽象,比较深刻、比较正确、比较完全地反映了科学认识对象,从而具有巨大的现实统摄力量和潜在的容异功能。科学观念一旦建立起来;它的现实统摄力量就会不断地得以发挥,它所统辖的研究领域的知识不断积累,且日益成熟和完善。在科学发展的一定阶段,科学观念原有的潜在容异功能也会转化为现实性。也就是说,它可以作为一种研究指导纲领扩展到其它领域,甚至把与它不相协调的经验知识容纳进来或暂存起来。这时,科学观念对科学发展起着促进作用,科学呈现出相对平静的发展趋势,知识的增长主要表现在量的积累上。这就是科学的进化时期。进化时期主要是科学家在已有的科学观念指导下进行的定向研究时期,这也是科学理论的多产时期。
从牛顿的《原理》奠定了近代物理学的基础到19世纪末,物理学大体经历了两百多年的进化时期。在这段漫长的时间内,经典力学的基本观念被物理学家作为研究传统而接受下来,决定了他们的思想、研究和实践方向。牛顿力学起初主要处理质点问题(质点力学),后被推广到流体和刚体,流体力学和刚体力学就是在牛顿所提出的科学观念的基础上建立起来的。力学的基本观念又被引进光学、热学和电磁学的研究中。尽管热学中熵的概念和热力学第二定律以及电磁学中的场的概念,都是超出牛顿力学的基本观念之外的新东西,但是它们分别通过对分子热运动进行统计解释和通过以太的力学模型的运用,而把这些具有革命性的新观念纳入到力学框架之中。
科学的进步会引起它的基础的深刻变革。在进化阶段的后期,科学观念已基本穷尽了它的统摄力量和容异作用,科学理论也在这个基础上发展到了顶峰。这时,科学观念通过修修补补已无法容纳大量的反常现象,而且各理论体系之间发生的概念问题也越来越暴露出已有科学观念的局限性。这时,唯一的出路就是对这些科学观念进行根本的改造,提出新的科学观念,这就是科学发展中的革命时期。在这个时期,那些具有哲学头脑、思想活跃、敢于背离陈规旧说的科学家,往往成为科学革命的主将。
相对地讲,科学革命时期一般是不太长的,如历史上的三次科学革命所经历的时间分别为144年(1543~1687)、61年(1803~1864)和33年(1895~1928)。哥白尼-牛顿革命之所以持续时间最长,是因为它要摧毁亚里士多德的自然哲学教条,而这些教条在将近两千年间一直禁锢着人们的头脑,并被经院哲学当作毋庸置辩的真理。而且,当时科学成果和科学思想的交流受到各种条件的限制,远不如后来那么频繁和自由。尤其是,这次革命要总结人类有史以来的关于自然的知识,建立第一个真正的近代科学体系——牛顿力学。在哥白尼《论天球的运行》问世时(1543年),欧洲人所具有的力学知识是否像阿基米德(公元前287~212)所了解的那么多,还是值得怀疑的。但是,到这次革命的终结,牛顿力学已牢固建立起来,能够说明天上和地上所遇到的一切力学现象。照此看来,百余年的革命并不算长。第二次科学革命之所以持续时间较长,是因为这次科学革命的带头学科不是一门学科,而是一组学科(主要是化学、生物学和物理学)。这样一来,科学观念的变革发生在不同的领域,而这些科学观念彼此又不甚相关,一个学科中的科学观念的变革对另一个学科中的科学观念的变革没有什么直接的影响。于是,革命的持续时间势必要稍长一些。
科学的进步就是“进化-革命”的无穷系列。在进化时期与革命时期之间,也可能存在库恩所说的危机阶段,这在世纪之交物理学革命的前夕表现得尤为明显(但是,不见得每次科学革命前夕都有一个危机时期)。危机是科学革命的前夜,旧科学观念摇摇欲坠,新科学观念尚未诞生或尚未巩固之时,就是科学的危机时期。不过,科学发展的进化-(危机)革命阶段只是为叙述的方便而提出的理想模式,它们的界限并非泾渭分明。它们就像电影中的一串串渐隐镜头,当一串场景的最后几幅画面还未完全消失时,第二串场景的开头几幅画面就逐渐溶入,致使两串场景相接处的几幅画面我中有你,你中有我。
正如劳丹批评库恩时所说的,常规科学并非像库恩所描绘的那样“常规”,科学革命也不像库恩所断言的那么“革命”。因此,我们拟提出“进化-革命”互补图像来描绘科学的发展。在这里,“互补”的含义有二:其一是进化与革命互相转换,即进化转换为革命,革命又转换为进化,周而复始,以至无穷,而每一次循环,都使科学发展到一个新的更高的阶段;其二是进化与革命互相渗透,这不仅表现在二者的衔接处,而且也表现在二者的过程之中。例如,18世纪基本上是科学的进化时期,经典力学的基本观念不仅在力学发展中表现得生机勃勃,而且也指导着其他学科(例如电学、热学、化学等)的研究。但是,值得注意的是,康德在这个时期提出的星云假说,把发展的观念引入自然科学,这是超越于经典力学的新观念。拉瓦锡的氧化说和元素概念也否定了燃素说和燃素概念(燃素说是在经典力学基本观念指导下提出的燃烧理论)。这一切,都是在进化时期科学观念所发生的局部变革,或像有人说的局部革命或小型革命。同样,在革命过程中也伴随着一些进化。爱因斯坦1905年提出的狭义相对论标志着物理学一个领域的革命的开始,而普朗克1906年通过对爱因斯坦的电子运动的方程的修正进而得到的动能的表达式,以及闵可夫斯基1908年提出的四维世界理论,都不过是狭义相对论的自然进化而已。
因此,如果把事物的发展比喻为波浪式发展、螺旋式上升的话,那么科学的进步则可以形象地描绘为具有小波纹的滚滚向前的大波浪,或以大螺线为轴心而攀援上升的小螺线(等于把一个长而细的弹簧绕成螺线)。这就是科学发展的“进化-革命”互补图像(尽管它也是一个不尽恰当的模式)。后一个比喻显然与黑格尔的下述命题有某种相通之处:“科学表现为一个自身旋绕的圆圈,中介把末尾绕回到圆圈的开头,这个圆圈以此而是圆圈中的一个圆圈,因为每一个别的支节,作为方法赋予了灵魂的东西,都是自身的反思,当它转回到开端时,它同时又是一个新的支节的开端。”
参考文献
Б.М.Кедров,ЛениниНаучныеРевалюции•Всте-ствазнание•Физика,Издательства《Наука》,Москва,1980.
李醒民:简论凯德洛夫的科学革命观,北京:《自然辩证法通讯》,1985年,第1期。
《爱因斯坦文集》第一卷,许良英等编译,北京:商务印书馆,1976年第1版,第115页。
- 上一篇:农贸市场招商策划方案
- 下一篇:贫困学生资助先进事迹