统计学变量的定义范文

时间:2023-07-10 17:19:58

导语:如何才能写好一篇统计学变量的定义,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

统计学变量的定义

篇1

[关键词]教师职业倦怠 人口统计学变量 个性因素 组织因素

[中图分类号] G451 [文献标识码] A [文章编号] 2095-3437(2013)15-0027-03

教师职业倦怠是教育研究中值得关注的一个问题。“教师是一个高压力的职业,社会赋予教师的高度期望、繁重的工作量、学生行为问题、学生考试成绩和课程与教学改革等都是教师压力的主要来源。”[1]“过高的工作压力和职业倦怠会导致教师工作绩效下降、缺勤、离职,对教师的身心健康造成不利影响,并对学生产生直接、消极的影响,甚至波及整个社会。”[2]教师职业倦怠也因此成为教师专业发展的阻力和教师职业生涯中的危机。

一、职业倦怠的概念界定

对于职业倦怠的概念,不同学者从不同的角度提出了不同的看法,概括起来,不外乎两大类,即侧重揭示职业倦怠最终状态的静态定义和侧重描述职业倦怠动态发展过程的动态定义。

(一)职业倦怠的静态定义

Maslach认为,“职业倦怠是指那些需要连续不断地与他人互动的人际服务业者在经历长期压力下的一种行为反应,它由情感衰竭(emotional exhaustion)、非人性化(depersonalization)和低个人成就感(reduced personal accomplishment)三个成分组成”。[3]

在众多职业倦怠静态定义中,得到学术界广泛认同的当属Maslach对职业倦怠的界定。由于Maslach及其同事所编制的职业倦怠量表――MBI的普遍使用,使这一定义成为目前最常用的职业倦怠标准化操作性定义。

(二)职业倦怠的动态定义

与Maslach不同,Cherniss则从职业倦怠动态发展过程的角度界定职业倦怠,并给出了职业倦怠的定义,这一定义属于职业倦怠的动态定义。Cherniss认为,“职业倦怠是个体面对工作疲劳(strain)在态度和行为上消极变化的过程,可分为三个阶段:第一阶段为资源和需求的不平衡,即压力阶段;第二阶段为即刻、短时的情绪紧张、疲劳和耗尽,即疲劳阶段;第三阶段包括一系列态度和行为的改变(如以疏离、机械的方式对待工作对象),即防御性应对(defensive coping)阶段”。[4]

职业倦怠的静态定义和动态定义并不是相互排斥的,相反,在一定意义上,两类定义是互补关系,动态定义所描述的是静态定义的前一个阶段,静态定义所描述的是动态定义的最后阶段。

Schaufeli和Enzmann在研究了职业倦怠的诸多定义之后,最为全面地概括了职业倦怠现象的本质:“职业倦怠是一般个体所经验的、一种与工作有关的持续、消极的心理状态,它主要以精疲力竭为基本特征。职业倦怠表现为负性压力(distress)、低效能感、动机下降以及态度和行为的消极改变。这一心理状况是逐渐形成的,但却在很长一段时间内不被个体所觉知。它起因于工作中目的与现实的互不协调。职业倦怠因其实质上是一种不适当的应对策略,往往会持续存在”。[5]这一定义首先将职业倦怠的诸多症状概括为一个核心特征――精疲力竭和四种一般表现,即负性压力、低效能感、动机下降以及态度和行为的消极改变。其次,它强调未能实现的目标和不适当的应对策略是职业倦怠产生的前提条件。最后,它指出职业倦怠是一个逐步发展的过程。显然,这一概念和其他诸多概念相比,明显的优势在于不仅描述了职业倦怠的一般症状表现、产生原因及发生范围,而且具体指出了职业倦怠的核心特征和四个常见的伴随特征。此外,该定义还强调了职业倦怠是一个逐渐发展的过程,并指出应对策略,在职业倦怠形成过程中具有重要的作用。

二、教师职业倦怠的影响因素

影响教师职业倦怠的因素众多,概括起来主要分为人口统计学变量、个性变量和组织变量三大类。

(一)人口统计学变量

已有研究考察的人口统计学变量主要包括年龄与工作经验、性别、学生级别、教育程度和婚姻状况等。这些变量也与职业倦怠或多或少存在一定的相关。例如,多数研究表明,教师的年龄和工作经验与职业倦怠呈负相关,所以,在教师职业生涯初期,容易出现职业倦怠;就性别而言,较为一致的结论是男教师的非人性化程度明显高于女教师;从学生级别来看,多数研究显示中学教师的职业倦怠程度要高于小学教师;有关婚姻状况与职业倦怠关系的研究出现两种结果:一种结果表明,已婚教师的职业倦怠水平低于未婚教师,而另一种结果则显示,结婚与否和职业倦怠的相关性并不显著。其他一些人口统计学变量,如教师职称、任教科目、学校级别等与教师职业倦怠的关系,较难取得一致结论。

总之,人口统计学变量与教师职业倦怠的相关性较低,研究结果也不十分一致,有些研究并未发现显著的相关关系,甚至还得出与多数研究相反的结论。由此可以看出,人口统计学变量虽然是影响教师职业倦怠的因素,但并不是主要的因素。

(二)个性因素

影响教师职业倦怠的个性因素主要有心理控制源、A型人格、大五人格、工作期望、应对策略、自我概念、自尊和自信、自我效能、人生意义等。通过对这些因素的研究,可以解释为什么在相同或相似的工作环境和压力下,个体经验的职业倦怠程度会有所不同。

研究表明,心理控制源是职业倦怠的有效预测变量,外控教师因其将事件和成就归因于他人或机遇,因而其职业倦怠程度要高于内控教师;A型人格的人由于个性争强好胜,具有时间紧迫感和充满成功的理想等特点,通常认为更容易产生职业倦怠;研究表明,大五人格中的神经质与职业倦怠的关系最为显著;个体对组织、工作以及自身过高的期望也会影响其职业倦怠程度,过高的期望会增加职业倦怠的程度;研究表明,个体的自我概念、自尊和自信都与职业倦怠呈显著的负相关;Leiter认为,职业倦怠是由于自我效能感出现危机所致,实证研究也证明了这一点;职业倦怠的存在主义理论认为,职业倦怠是由于个体在生活和工作中寻求存在意义的需要未能实现所致,有关人生意义与职业倦怠关系的量化研究也充分支持了这一观点。

三、组织因素

组织因素成为影响教师职业倦怠的原因是职业倦怠是一个与工作有关的概念。工作压力源以及其他组织水平上的变量是产生职业倦怠的可能原因,因此,这应该是我们重点关注的因素。

(一)学生问题行为

学生是教师工作的对象,学生的行为表现是影响教师压力和职业倦怠的重要因素。很多实证研究均表明,学生在课堂的问题行为、不遵守纪律、态度冷漠是教师主要的压力源,学生问题行为与教师职业倦怠呈正相关。Hoerr和West将学生问题行为分为两类:一类是一般问题行为,即较常见的、可以被教师预知的、经常出现的行为;另一类是危机问题行为。他们发现,学生一般问题行为与情感衰竭、非人性化存在高相关,而学生的危机问题行为则只与非人性化维度相关。Friedman的研究结果表明,学生的不尊重(指学生不尊重老师和其他同学)和不用心(指学生学习考试不及格)等学生问题行为会增加教师的职业倦怠感。

(二)学校文化

教师的主要工作场所是学校,所以学校文化也是影响教师职业倦怠的因素之一。Leithwood、Menzies、Jantzi等人认为,如果学校的目标明确,学校给予教师一个不断学习的环境,学校文化是合作、团结的,教师的职业倦怠水平就低;相反,在组织僵硬的学校里,教师的职业倦怠水平就高。因此,学校应形成一个团结、合作、不断学习和相互支持的良好氛围,学校管理应该人性化。

(三)工作负担

大量研究表明,合理的工作量有利于降低教师的职业倦怠水平,相反,工作超负荷则会提高教师的职业倦怠水平。工作超负荷有质和量两方面的含义。从量的方面来看,工作超负荷是指有过多的工作要求,而用太少的时间去完成任务。如繁重的备课、批改任务,过多的学生数量等。从质的方面来看,工作超负荷是指工作的复杂和困难程度大,例如学校要求教师的教学成绩要在本地区排名第一。

(四)教师的自

以往的实证研究显示,教师参与的自也是影响教师职业倦怠的一个重要因素。当教师在教学和学校管理等事务中拥有更大的参与自,教师的职业倦怠水平就低,而缺乏参与自会使教师的士气、自尊和工作满意度下降,进而提高职业倦怠水平。

(五)角色冲突和角色模糊

角色冲突和角色模糊也是影响教师职业倦怠的重要组织变量。当个体面对两种冲突情境而又被期望做出角色行为时,角色冲突就会出现。当个体对其职业的权利、义务和责任缺乏明晰、一致的认识而感到无法胜任工作,或者面对不断增加的复杂工作和较大的组织变革时,角色模糊就会产生。

大量的实证研究表明,角色冲突与情感衰竭、非人性化呈正相关,与个人成就感呈负相关,其中,角色模糊与个人成就感的关系最为密切。总之,角色冲突和角色模糊与教师职业倦怠都有较高的相关,但比较而言,角色冲突对教师职业倦怠的解释能力相对较强。

(六)社会支持

社会支持通常从来源和类型两个方面进行划分。依据来源,社会支持可分为校内支持(包括同事支持、校长支持等)和校外支持(包括学生支持、朋友支持、配偶支持等)。依据类型,社会支持可分为信息支持、实际支持和情感支持三类。

一般而言,社会支持作为个体的一种应对方式,良好的社会支持能有效降低教师职业倦怠的程度,但因社会支持的结构较为复杂,不同类型的社会支持对教师职业倦怠的影响有所不同。例如,多数实证研究结果显示,校内支持与教师职业倦怠的关系比较密切,其对教师职业倦怠各成分均有负向预测作用,而校外支持与教师职业倦怠的相关性并不显著;情感支持能有效降低情感衰竭、非人性化;实际支持可以增强教师的个人成就感;教师的时间支持高,则情感衰竭和非人性化程度低。

个别学者的研究甚至得出相反的结论。例如Burke和Greenglass的一项研究结果显示,社会支持对教师职业倦怠的影响并不显著。Byrne认为,这可能是由社会支持理论结构的多维性和统计方法的多样性造成的。

除以上因素之外,工作需求、工作资源、工作控制以及付出与回报不成比例等也是影响教师职业倦怠的因素。而在以上各组织因素中,学生的行为问题、角色冲突与角色模糊、教师的自主性、工作负担是教师压力的主要来源。

综上所述,与教师职业倦怠有关的因素主要有人口统计学变量、个性变量和组织变量三类。其中,人口统计学变量相对比较稳定,它们与教师职业倦怠虽有相关关系,但不与教师职业倦怠有因果联系。个性变量则比较主观、多变,它们对教师职业倦怠的影响也比人口统计学变量要大。组织因素是属于微系统或中系统层面,其与教师职业倦怠的相关程度也最高。

[ 参 考 文 献 ]

[1] 周晓晔,秦巍.中学教师职业压力调查分析[J].辽宁师范大学学报(社会科学版),2004,(3):69-71.

[2] Farber,B.A.Stress and burnout in the American teacher[M].San Francisco,CA:Jossey?鄄Bass,1991.

[3] Maslach,C.Burnout: A social psychological analysis.In J.W.Jone(Ed.),The burnout syndrome:Current research,theory,investigations[M].Park Ridge,IL:London House Press,1982.

[4] Cherniss,C..Professional bournout in human service organiz?鄄

ations[M].New York:Praeger,1980.

[5] Schaufeli,W.B.&Enamann,D..The burnout companion to stu?鄄

篇2

学生考试成绩,作为一项衡量学生学习情况和教师授课效果的重要指标,在教学评价中起着举足轻重的作用。随着新课程改革的不断推进和教育教学改革的不断深入,对教学评价提出了更为客观的要求,这就要求教师在对学生学习成绩进行统计和评价的过程中必须借助于相关的统计学知识,从考试成绩中充分挖掘出有意义的教学资源,达到事半功倍的效果。文章以我校2010届高三理科两个班级学生省质检理综成绩为例,介绍如何应用SPSS统计软件对考试成绩进行分析和评价,以期为教学活动提供一定的帮助。

二、SPSS简介

SPSS(Statistical Package for Social Sciences)即社会科学统计程序,是一款享有“世界优秀统计工具”之美誉的专业统计软件,它和统计分析系统SAS(Statistical Analysis System)以及生物医学程序BMDP(Biomedical Programs)并称为国际上最具影响力的三大统计学软件。SPSS可以用对话框的形式实现各种管理和分析数据的功能,拥有数据管理、统计分析、图表分析和输出管理等功能,从而实现描述性统计分析、均值比较和相关分析等分析功能。它具有操作简便,统计分析方法全面,图形绘制快捷等优点,作为一种有效的统计工具,SPSS已经广泛应用于生物学、心理学和医学等各个领域,近年来,SPSS在教育教学统计中也得到了越来越广泛的应用。

三、应用SPSS统计软件进行试卷分析

(一)数据收集和分析内容

1.调查对象

三明二中2010届高三(8)、(9)班学生省质检理综成绩。

2.成绩分析内容

(1)试卷成绩分析

主要包括,学生人数、参加考试人数、平均分、最高分、最低分、及格率、标准差和成绩分布是否呈正态分布等。

(2)学生成绩分析

比较高三(8)和(9)班,两个不同班级的学生成绩是否有差异,以及两个班级男生和女生成绩是否有差异。

(二)应用SPSS统计软件进行试卷分析

首先可以将学生成绩输入Excel中,然后导入SPSS中,主要设置的变量包括编号、姓名、班级、性别、理综成绩等。数据处理操作步骤如下:

1.定义分数段

在成绩分析时,为了更直观地看出不同分数段学生人数及其所占比例,这里可以将分数转换成分数段,SPSS中具体操作如下:点击TransformRecode Into Different Variables(转换重新定义不同变量),弹出Recode Into Different Variables(重新定义不同变量)对话框,把“理综”成绩这个变量输入Output Variable(输出变量)对话框中,在Name(名字)栏目中输入“分数段”,单击Change(改变);然后单击Old and New value(旧的和新的值)按钮,选择Range(范围),在其下栏目中输入相对应的分数范围,由于理综总分为300分,180分代表及格,所以用0179.9,Value(值)中输入50用来代表不及格的分数,单击Add(添加);同理,我们可以定义60、70、80、90分段的分数段,如图1所示。

图1 定义分数段对话框示意图

2.成绩分析

以班级为单位进行试卷分析,绘制成绩分布直方图和Q-Q概率图对本次理综考试情况进行正态分布分析,具体操作步骤如下:单击AnalyzeDescriptive StatisticsFrequencies(分析统计学描述频数分析),在弹出的Frequencies(频数分析)对话框中,把“理综”和“分数段”两个变量导入Variable(变量)中;点击Statistics(统计)按钮,在弹出的Frequencies:Statistics(频数分析:统计)对话框中,选中Mean(平均分)、Std deviation(标准偏差)、Minimum(最低分)、Maximum(最高分)和Range(范围)这五个常用指标,单击Continue(继续),返回主对话框,点击Charts(绘图)按钮,在弹出的Frequencies:Charts(频数分析:绘图)对话框中,选中Histograms(柱状图)和其下的With normal curve(正态分布曲线),再点击Continue(继续),返回主对话框,点击OK按钮,就可以获得学生总数、缺考人数、最高分、最低分、平均分、优、良、中、差和不及格人数分布及其百分百直方图,统计结果如表1、表2和图2所示。

表1 学生理综成绩基本统计情况

表2 学生理综成绩分布情况

教育学与统计学理论认为,一次难度适中信度可靠的考试,其成绩分布应该接近正态分布(陈捷,2008),文章为了验证本次理综考试是否符合正态分布,采用Q-Q概率图对考试成绩进行正态分布分析,具体操作如下:执行Graphs(图表)Q-Q,打开“Q-Q Polts”( “Q-Q 图”)对话框,将“理综”作为变量输入Variabls(变量)中,其他采用系统默认选项,点击OK按钮,就可以得到学生理综成绩正态分布Q-Q概率图,如图3所示。

3、考试成绩差异性比较

(1)不同班级之间学生理综成绩比较

执行AnalyzeCompare MeansIndependent-Samples T Test(分析比较方法独立性T检验),在弹出的Independent-Samples T Test(独立性T检验)对话框中,把“理综”选入Test Variable(检验变量)对话框中,将“班级”选入Grouping Variable(分组变量)对话框中,单击“Difine Groups”(分组)按钮,在弹出的Difine Groups(分组)对话框中,在Groups1(第1组)中输入8班;在Groups2(第2组)中输入9班,点击Continues(继续)返回主对话框,单击OK,完成比较,统计结果如表3、表4所示。

表3 不同班级学生理综成绩情况表

表4 不同班级学生理综成绩独立样本T检验

表5 男女学生理综成绩情况

(2)男女学生理综成绩比较

操作步骤同(1),得到统计结果如表5和表6所示。

表6 男女学生理综成绩独立样本T检验

四、结果分析

1.从表1可以得到,参加理综考试的学生人数为107人,没有缺考学生,平均分为211.55分,标准差为41.63,最高分为273分,最低分为85分,全距为188分。说明本次考试整体难度较高;标准差为41.63,最高分与最低分的差距为188分,说明这两个班学生理综水平两极分化较大,这可能与学生对该学科的学习兴趣有关。

2.从表2和图2可知,大部分的学生集中在良、中和及格分数段,不及格的人数占到约20%,而优等分数段的学生仅有一人,主要是由于这两个班级都是平行班,尖子生较少;此外,本次理综考试的难度偏大导致及格率较低。而从图3学生成绩正态Q-Q概率图看,尽管有一定数量的学生成绩在趋势线附近有波段,但从总体来看,基本还是呈直线分布,因此,本次理综省质检考试成绩还是可以近似认为呈正态分布。

3.表3和表4显示,高三(8)班和(9)班两个班级学生理综成绩的平均分分别为213.91分和209.15分,虽然(8)班的平均分高于(9)班,但是两个班级学生的成绩没有显著差异(P=0.557>0.05);表5和表6结果显示,两个班级男女生的理综成绩平均值分别为211.36分和211.89分,男女生理综成绩没有显著差异(P=0.95>0.05)。

五、总结

篇3

关键词:力量;影响;体育舞蹈

一、前言

体育舞蹈可以被描述为体育和艺术的特殊结合,是一种使舞蹈双方,以原始的方式,通过不同的音乐类型和塑造协调复杂的优美舞姿来表达真实的情感。舞者的技术和艺术的质量性能取决于广泛的机动能。一名舞者的技术和艺术表演水平取决于运动的宽谱能力.到目前为止在体育舞蹈方面的研究者已经向在一定舞蹈学科的技术表演领域的个人运动能力的增值上向一些有趣的消息屈服。同样,许多研究也证实了舞蹈的基本运动能力对一支成功的舞蹈表达影响很大。鉴于舞蹈技术,即运动结构,在一般的舞蹈活动中,可以说最活跃的是身体的尾椎,它是移动的“基础”。对于一个成功的舞蹈技巧主要负责执行任务的是舞者的下肢,肌肉和腹部。这种能力缩小他们的速度使他们得到放松,并决定着舞蹈表演中必要的力度,及时与特定的肌肉群发生相互的反应,影响舞者能量的合理利用,以及肌肉的显现,很大程度上有助于移动性能的审美表达。力量这种运动能力在舞蹈活动中起着重要的作用。它出现在不同的表现形式中,舞蹈的活动类型决定着其潜力的效用水平。

本文的假设是:

假设一:基于被期望的肌肉运动力量能力对标准舞的表演和技术的效能进行统计上的重要预测。

假设二:基于被期望的肌肉运动力量能力对拉丁舞的表演和技术的效能进行统计上的重要预测。

二、研究方法

(一)样品的参与者

使用了一个具有代表性和目的性的由49个包括25名女性和24名男性组成的体育舞蹈受访者的分层抽样。这个样品包含初中1和初中2的从12岁到15岁年龄群的舞蹈者。他们作为舞蹈分派D3、D4的一部分,竞争的项目涵盖了基本的编排组合和更复杂的舞蹈技术的元素。他们都积极参与了2年的训练过程,每周训练三次。

(二)样本的变量

本研究的目的,一个预测变量(通过三个力量测试定义)和两个标准变量(通过三支拉丁舞和三支标准舞定义)被选中。预测变量用于测试在拉丁舞和标准舞表演中的相关性和预测成功的可能性。它是由:1.上肢提升――MPGDT2.从躺的位置扔实心药球――MBMLE;3.从现场跳――SKOKUDAL。预测变量是由标准化测试对运动强度的能力评价和他们具备必要的度量特性所组成。拉丁舞、和标准舞的标准变量都将被用于评估舞蹈结构习得的质量和速度。标准变量是分别由五支舞中的三支组成的。为了在动力学中将二者进行比较,在拉丁舞表演中,我们选择了桑巴,恰恰恰和牛仔,从标准舞中我们选择了华尔兹,探戈和快步来进行比较。这些变量当中的每支舞都被基础技术元素所定义。综上所述,这些变量包含一个标准的拉丁舞变量和一个标准的标准舞变量。所有的技术元素都已经被国际体育舞蹈联合会――IDSF规定采用。拉丁舞和标准舞的基础技术元素评估通过评审委员会使用打分制完成,打分范围从0到10。评审委员会是由波斯尼亚和黑塞哥维那体育舞蹈联合会得到许可的裁判组成。

(三)实验描述

预测变量的标准化考试系统是由强度运动能力的评估:MPGDT,MBMLE SKOKUDAL组成的。这些测试具有一定的指标特性。测试标准变量是由验证评审委员会来完成的,同时也负责评估舞蹈结构表演水平的0到10分的测量任务。所有分数的算术平均结果将把每个试验者所得的分数放到拉丁舞和标准舞的水平评估量表里。

(四)统计数据处理研究的结果

从研究得到的结果以描述性对比统计分析程序处理。比较数据,我们采用参数统计,其中:相关性和回归性分析。作为统计重要性水平,我们设置P

三、结果与讨论

篇4

求相关系数r:相关系数介于区间[-1,1]内,相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母r表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。

相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。

(来源:文章屋网 )

篇5

相关热搜:统计学  统计学原理

一、数据统计分析的内涵

数据分析是指运用一定的分析方法对数据进行处理,从而获得解决管理决策或营销研究问题所需信息的过程。所谓的数据统计分析就是运用统计学的方法对数据进行处理。在实际的市场调研工作中,数据统计分析能使我们挖掘出数据中隐藏的信息,并以恰当的形式表现出来,并最终指导决策的制定。

二、数据统计分析的原则

(1)科学性。科学方法的显著特征是数据的收集、分析和解释的客观性,数据统计分析作为市场调研的重要组成部分也要具有同其他科学方法一样的客观标准。(2)系统性。市场调研是一个周密策划、精心组织、科学实施,并由一系列工作环节、步骤、活动和成果组成的过程,而不是单个资料的记录、整理或分析活动。(3)针对性。就不同的数据统计分析方法而言,无论是基础的分析方法还是高级的分析方法,都会有它的适用领域和局限性。(4)趋势性。市场所处的环境是在不断的变化过程中的,我们要以一种发展的眼光看待问题。(5)实用性。市场调研说到底是为企业决策服务的,而数据统计分析也同样服务于此,在保证其专业性和科学性的同时也不能忽略其现实意义。

三、推论性统计分析方法

(1)方差分析。方差分析是检验多个总体均值是否相等的一种统计方法,它可以看作是t检验的一种扩展。它所研究的是分类型自变量对数值型因变量的影响,比如它们之间有没有关联性、关联性的程度等,所采用的方法就是通过检验各个总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。(2)回归分析。在数据统计分析中,存在着大量的一种变量随着另一种变量的变化而变化的情况,这种对应的因果变化往往无法用精确的数学公式来描述,只有通过大量观察数据的统计工作才能找到他们之间的关系和规律,解决这一问题的常用方法是回归分析。回归分析是从定量的角度对观察数据进行分析、计算和归纳。

四、多元统计分析方法

篇6

1一般资料

1.1研究对象

选择2007年11月到2009年4月在我院神经内科住院急性脑梗死患者共67名,平均年龄(55~84)岁,70岁以上16名,占23.9%,其中男41名(占61.2%),女性26名(占38.8%)。诊断均符合全国第四届脑血管病学术会议修订的诊断标准,并经头部CT或MRI检查证实,排除颅内出血或任何出血性神经系统病。所有病例除外改良RANKIN评分>4分(即排除严重失能的患者,卧床不起者,大小便失禁者和需要长期维持护理者),大脑静脉血栓,外伤或手术史,急慢性炎症,发热、感染性疾病、肝肾功能不全(AST或ALT>3倍正常值上限,根据cockcroft公式计算出肌酐清除率<30ml/min),合并肿瘤、自身免疫性疾病、外伤、近期手术及服用糖皮质激素或免疫抑制剂者。其中51名(76.1%)患者合并高血压病史,是主要的血管危险因素。

1.2主要实验仪器

GEsignalLX1.5T磁共振成像设备、德国HERMLE离心机、美国GE8层CT机、韩国BIONET12导心电图机、美国贝克曼库尔德(BECKMANCOLTER)公司的IMMAGE型全自动生化分析仪、全自动血细胞分析仪、美国HELENA公司的快速电泳仪、贝林浊度分析仪,EDTA试管。

2研究方法

所有患者均经进行详细的病史(高血压病、冠心病、糖尿病、高脂血症、脑血管病、吸烟史、教育水平)采集及神经系统检查体格检查,血压、血常规、血糖、血脂、肝肾功能,尿酸,12导联-心电图,头部CT或MRI等检查。所有脑梗死患者于发病72h内测定HS-CRP,每3个月进行一次访视,收集所有终点事件,随访1年。

2.1血管性危险因素和临床变量

高血压(收缩压≥140mmhg或舒张压≥90mmhg或正在服用降压药),糖尿病(治疗过或已知空腹血糖≥7mmol/l),高胆固醇血症(总胆固醇≥220mg/dl或正在服用降血脂药),高甘油三脂血症(甘油三酯≥190mg/dl或正在服用降脂药),吸烟史(当前吸烟或过去6个月停止吸烟),冠心病史,脑血管病史。血清HS-CRP正常值为0~5mg/l,大于5mg/l定义为异常值(我院正常值范围0~5mg/l)。

2.2脑梗死和终点事件的定义

脑梗死的定义为:有局灶性缺血性神经功能缺损;症状≥24h,或无论症状持续的时间,CT/MRI有相应的脑梗死证据。终点事件的定义为:任何原因的死亡(血管性和非血管性);任何新发的非致死性血管事件(包括复发的脑卒中、短暂性脑缺血发作、急性心肌梗死、不稳定型心绞痛)。

2.3改良RANKIN量表评分与病情程度

采用改良RANKIN量表评分评价患者的病情严重程度。所有入选患者都进行改良RANKIN量表评分(ModifiedRankinScale,mRS),本研究所有患者的评分在0~4分之间,评分0~2分被定义为轻度残疾,3~4分被定义为中重度残疾。

2.4采集血样和超敏C反应蛋白的测定

入选的患者在合格事件发生后72h晨起空腹完成静脉血样采集,全血在3000rpm条件下离心15min后,分离出血清保存于-80℃等待分析。超敏C反应蛋白使用贝林浊度分析仪检测,单位:mg/l。所有结果均进行复查。

3统计学处理

计量资料用均数±标准差(x±s)两组计量资料的比较应用t检验,计数资料应用χ2检验。各自变量与终点事件的相关性应用单因素分析和多元线性逐步回归分析。进入方程的变量包括:年龄、男性、高血压、糖尿病、冠心病、脑血管病、高甘油三脂血症、高胆固醇血症、吸烟史、HS-CRP>5mg/l,终点事件(复发的卒中、其他血管事件和任何原因导致的死亡)作为应变量。Log-rank检验用于评价HS-CRP增高组(HS-CRP>5mg/l)和HS-CRP正常组(HS-CRP≤5mg/l)之间的关系,P<0.05为差异有统计学意义。数据采用SPSS13.0软件进行统计学处理。

4结果

4.1患者的一般情况及HS-CRP测定结果的分析

两组在性别、年龄、文化水平、及血管危险因素或既往史(高血压病史、糖尿病史、高胆固醇血症、高甘油三脂血症、吸烟史、冠心病史、脑血管病史)之间没有统计学差异(P>0.05)(见表1)。HS-CRP的水平与患者的年龄、性别、受教育水平、血管常见危险因素及既往史没有明确的关系。

4.2终点事件相关危险因素分析

4.2.1单因素分析随访1年的时间中,所有患者都服用抗血小板类药物进行预防,每3个月随访一次收集和记录所有不良事件。共发生20例(29.9%)终点事件,其中包括脑梗死10例,短暂性脑缺血发作3例;冠心病5例;死亡2例(分别死于脑出血和胰腺癌)。各变量与发生终点事件的单因素分析(见表2)。其中HS-CRP>5mg/l是发生终点事件的危险因素,差异有统计学意义(P<0.05)。

4.2.2多因素分析根据单因素分析结果,采用逐步引入法将所有自变量引入logistic回归方程,运算结果(见表3),最终HS-CRP进入方程中。HS-CRP增高组终点事件发生率明显高于HS-CRP正常组,差异具有统计学意义(P<0.05)4.3HS-CRP与改良RANKIN量表评分(mRS)的关系所有患者入选时都进行改良RANKIN量表评分,mRS分为6个等级(0~6分)用于评价神经功能丧失程度。本研究67例患者中47例患者评分≤2分,12例患者评分3分,8例患者评分4分。mRs评分3~4分的患者的HS-CRP中位数水平明显高于0~2分的患者,差异有统计学意义(P<05)(见图2)。

5讨论

尽管脑梗死的治疗在过去的十几年时间有了很大的提高,但是,1年内发生死亡和血管事件的风险仍很高。因此,探讨预测脑梗死预后的指标,有很大的临床应用价值。近年来,心脑血管缺血性疾病与血浆炎症指标的相关性成为研究的热点。近年研究发现,CRP直接参与了动脉粥样硬化的过程[2]。CRP是一种炎症急性时相反应物,主要在肝脏内合成分泌,受细胞介素-6(IL-6)刺激产生。动脉粥样硬化是一种周身性的慢性炎症,这种炎症与血管内皮细胞破坏、血管功能的异常、脂质代谢异常有关。流行病学研究显示血浆HS-CRP水平升高人群的心血管疾病的危险显著增加,且心血管疾病患者HS-CRP水平与其预后密切相关。然而有研究中发现脑卒中患者HS-CRP水平升高与脑卒中的严重程度相关而非与再发心脑血管事件相关[3]。超敏CRP可检测出0.2~10mg/l的CRP浓度,在这个水平上测定的CRP目前已代替其他炎症因子(如IL-6和TNF-α)。吕雅丽等[4]搜集CRP水平对急性脑梗死预后影响非随机对照研究,进行Mate分析,结果提示发病时CRP的水平可以初步评价脑梗死患者的预后。

本研究为前瞻性队列研究,目的是了解脑梗死风险指标与脑梗死后一段时间内预后的关系。国内的报道多针对缺血性脑血管病后1个月内的短期预后,而我们的研究针对脑梗死后1年内的远期预后。因为脑梗死各风险指标的作用是预测再发缺血性血管病变,所以我们关心的问题是该指标及危险因素与再发缺血性血管病变的关系,故将其定义为终点事件。另外,我们参照目前国际上此类文章的方法将死亡也定义为终点事件。为了排除其他因素度终点事件的影响,本研究还应用了多因素逻辑回归分析,该方法不但除外了非研究因素的影响,而且除外了各风险指标之间的叠加作用。风险指标中仅有HS-CRP增高(即HS-CRP>5mg/l)与终点事件的发生密切相关,而与其他危险因素和既往史无关。

本研究表明,HS-CRP可能是脑梗死后1年内死亡及再发缺血性血管病的独立预测指标,可以用来预测不良的预后。国外资料报道,CRP水平与缺血性脑血管病的预后密切相关,CRP水平升高,特别是持续升高者预后不良,不仅病死率高,而且功能恢复也很差[5]。本研究结果同时显示,终点事件的发生与HS-CRP的水平呈正相关性,在血清HS-CRP>5mg/l的患者中,终点事件的发生比HS-CRP≤5mg/l的患者多,提示血清HS-CRP>5mg/l的患者炎症反应较强,动脉硬化更严重,这与国外报道相似[6]。可能由于CRP水平增高,导致血小板的凝集和释放功能异常,从而影响止血和凝血过程。有研究表明,凝血因子的启动可增加脑卒中患者的患病率和死亡率。另外,本研究结果显示,mRS评分(3~4分)的患者HS-CRP中位数水平比mRS评分(0~2分)的患者更高,表明HS-CRP水平可以反映脑梗死患者神经损伤的严重程度。这可能是CRP水平增高使与缺血性脑血管病病理相关的炎性反应程度较强,加速了梗死区半暗带的恶化,进而加重了脑损伤。基于以上的结论可以对于HS-CRP增高的患者进行更加积极的预防,包括非药物干预和药物治疗两种方法。非药物干预包括:减肥、饮食、运动和戒烟[7,8]。药物治疗可选药物有:阿司匹林[9,10]、他汀类[11-13]和ACEI类[14],他们都能降低CRP的水平。可根据患者的具体情况选择合理的治疗措施。

篇7

2002年1月,隆冬的户外,寒风凛冽。北京延庆的宾馆内,来自某工厂的全体BB(六西格玛黑带)和包括总经理在内的各级干部正在分组讨论年度六西格玛课题战略。第二天,一行人头戴印有六西格玛标志的帽子,顶着寒风,高举代表各个课题队的鲜艳旗帜攀登上了雄伟壮丽的八达岭长城,揭开了2002年六西格玛活动的序幕。

【背景】这是一家显像管制造企业,也是最早在业内推行六西格玛的企业之一,每年有两次这样的六西格玛选题活动。在选题会上,依据公司确定的年度经营目标层层分解,拟定出为实现该目标而必须进行的课题,然后将众多的课题按照重要程度分类,并分配给合适的人员。

作为2002年的重点工作之一,就是攻克显像管异物发生的难题。众所周知,异物是显像管生产的天敌,管内异物是导致退货的最根本原因。在以前,为了降低不良品率,工厂特别设置了一个三检班,即实施出厂前第三次全检,然而仍然有大量的不良品流出到客户手中。

单纯依赖检验仅仅能够做到事后补救,但不解决根本问题,最根本的解决之道就是消除缺陷的发生源。因此,在年度选题会上,减少管内异物的发生率被作为一个六西格玛黑带课题进行讨论。解决了这一问题,不仅可以大幅度节约修理成本,对于维护公司的品质形象和提高市场占有率也有显著的作用。

一、定义阶段

定义阶段是以客户的需求为依据,寻找问题点或改善机会的一个阶段。如同公安机关的立案活动,这个案件的重要性如何,是普通的民事纠纷,还是刑事案件?案情复杂吗?是需要成立专案组重点侦查,还是普通的业务处理?这就是六西格玛课题的定义过程。

2002年1月13日,课题正式进入定义阶段。在明确了品质要害点(CTQ)后,成立了项目组,确定项目的目标和范围,以及为改善活动确立时间计划表。

1.课题选择

异物的不良发生率在企业里一直居高不下,每月因异物堵孔导致的修理费用近50万元之多。在2002年1月5日的干部会议上,总经理指出2002年是向异物宣战的一年,要建立起完善的异物管理系统,彻底减少管内异物,确保世界模范工厂的地位并赢得顾客的信任。

陈述课题选择的理由,说明为什么该课题被认为是重要的,以及是否获得了领导的支持,还可以从该课题同公司或部门战略的关联程度上表达。应用图表的方式能够更为直接地传递信息,有利于课题团队成员的彼此交流和向上级报告。

2.把握顾客需求

站在外部顾客和内部顾客的角度上看待问题,分析外部顾客的意见和内部顾客的意见,正确地把握顾客最关心的问题,即。

3.把握问题的水准

经统计从2001年11月至2002年1月间的三个月内的堵孔平均发生率为1.57%,修理后品质信赖度差,工程处于一种极不稳定的状态,经常出现品质事故,造成批量不良。应用排列图方法对堵孔解剖后的数据进行分析后表明,金属异物、锈、焊接异物、荧光粉、石墨是产生堵孔的最主要因素,尤其是金属毛刺,因此应强化金属部件入库品质和脱脂管理。

把握问题的水准时要观察一段期间内的历史数据,最好是最近的3~6个月的数据。应用控制图来代替传统的趋势图,既可以看出随时间的发展趋势,也可以看出该过程的受控状态。本例中应用的是单值控制图。

4.设定课题目标及范围

参照以往的历史数据,对比同行业内的其他工厂水平,团队成员们为本课题设定了一个挑战性的目标,即堵孔发生率减半,到2002年6月份计划达到0.8%,目前的基准水平为1.57%。研究范围界定为机工部品的加工工程、电子枪制造工程和封接除尘工程。

5.形成课题队

以本课题的担当黑带为首组成了一个跨职能的工作团队,界定了团队中每位成员在课题中的作用和任务。

做课题最忌讳的就是单打独斗和不能有效地集中团体的智慧,因此,对黑带来说,其项目领导能力和个人沟通技巧极为关键。团队成员一般在6~7人,业务和技能方面互补。

6.预估课题效果和制定课题计划

一个课题的解决会带来很多综合性的效果,包括有形的和无形的效果,然而可以计算出来的有形财务效果更具有说服力,也更容易获得领导的支持。显像管发生异物性堵孔后必须经过修理,修理单价为A,年产量为B,达到预期改善目标后的发生率下降为0.77%(1.57%-0.8%),按照年计算的预估效果金额为A×B×0.77%=320万元。

最后就是利用甘特图法,为课题的各个阶段制订较为详尽的工作计划。

二、测量阶段

这个阶段是查找嫌疑犯的过程,立案后的第一件事情就是查找所有可能的线索,不放过任何蛛丝马迹。专案组的组长也就是六西格玛黑带(BB),召集了全体成员分析案情,大家把所有和这个案子相关联的事物一一罗列。

六西格玛相信的是有因即有果,这样的一个因果关系我们可以用数学上的函数模型来表达,即Y=F(X),每一个课题总能归结为一个的简单方程:Y=f(X1,X2,…,Xk),测量阶段所要寻找的就是这一个个的X,我们也把它称为原因变量或输入变量,而Y则称为结果变量或输出变量。大家运用头脑风暴法畅所欲言,如果可能性低或关联性不大会在后续的过程中利用经验和证据将它排除掉,但前提是你必须先把它列入你的排查和搜索范围。

课题进入到测量阶段,主要进行三件事情,第一是明确关键的输入和输出变量,第二是进行基础测量系统的研究,也就是验证一下你所得到的数据可靠性如何,第三是对短期工程能力的分析研究,其中最重要的工作就是筛选出对结果Y起决定作用的X’s,为后续在分析阶段进一步分析X和Y之间的关系并建立数学模型F提供输入。

1.测量Y及其工程能力

六西格玛课题的Y就是我们要研究和解决的问题,也就是顾客最关心的事情。在这个课题里所定义的Y就是综检Mask堵孔不良,计算公式是:

Y(综检Mask堵孔不良)=(综检堵孔不良数/综检作业数)×100%

然后根据公式定义小y(y1、y2……),它是构成大Y的缺陷分类,不是产生结果Y的原因X。对缺陷的分类定义,甚至在必要的时候还要用图示说明,以统一对缺陷定义的一致性。在此课题里Y=y1+y2+y3+y4+y5+y6+y7+y8,其中分类是这样的:

y1:金属异物堵孔;y2:黑化皮膜堵孔;y3:焊接异物堵孔;y4:燃烧类异物堵孔;y5:AL膜堵孔;y6:GLASS碎片堵孔;y7:荧光粉堵孔;y8:电子枪异物堵孔。

初学者最难以区分的就是X和Y。据统计,40%以上的课题失败是因为一开始就没有选择好课题以及清楚明确地对Y进行定义。

按照设定的管理规格计算出Y的工程能力Cpk=-0.51,表明现在的工程能力远不能满足客户需求。

2.测量系统分析

但是,我们对于问题现状的把握数据可靠吗?万一出现错误,如同将自杀被判断成他杀,这将直接导致我们的行动失误,因此必须经过检验。

4月14日课题组准备了10个测试样本,这10个样本中既有良品也有不良品,然后安排4个检验员进行判断,每人测量3次。根据判断结果的一致性来确定测量系统的可靠性,分析结论是,该测量系统稳定可靠,误差水平可以接受。

在进行测量系统分析的时候,一定要注意随机化和盲测,即10个样本不能让被测试者注意到明显的识别方式以确保随机,每一次测试前都要打乱顺序,随机抽取;第二不要让被测试者在一次测试内重复检测同一样本,而是在一次测完10个样本后换另外一个被测试者。

3.发掘并筛选潜在的原因变量

从哪些方面寻找破案线索或原因变量呢?工程绘图是个好方法。按照课题选定的流程范围,从人机料法环测(即5M1E)等几个方面,罗列出所有可能的影响因子,然后进行筛选。

案情迷茫,线索重重,从哪儿开始调查?哪一条线索更有价值呢?六西格玛提供了几个简单有效的筛选和评价工具,可以帮助我们把有限的资源和精力集中在最容易产生突破效果的线索上。在这个课题中首先应用了因果矩阵法,紧接着应用了失败模式影响法对所有潜在的原因变量进行筛选,从而缩小包围圈,快速聚焦于核心因子(犯罪嫌疑人)。

筛选出比较重要的输入变量为脱脂液污染度、脱脂时间、B/P除尘喷嘴污染度、脱脂U/S强度、B/P除尘AIR压力、B/P除尘U/S强度等共计18个因子。

因果矩阵的左边两列输入的是来自于工程绘图选定的工艺流程及其输入变量(流程的关键工艺),横排的关键输出列出的是顾客最关心的小Y,最顶端的一行是评价小y对顾客的重要度(从1~10评分),其重要度的评价不能随意,要参考定义阶段的排列图表现并经过团队的综合评价后给出。交叉格内的数字表达的是工程输入变量对于关键输出变量的影响度,判分标准为(0,1,3,9),影响度很大,给9分,影响度低则给1分,没有影响给0分。比如脱脂黑化流程中脱脂液污染与金属异物堵孔的影响程度为9。最右列的合计数字是每个输入变量的影响度乘以对应关键输出变量的重要度之和。经过电脑EXCEL表格运算后,按照合计分值的大小重新排序。通常选择排在前10~15位的因子为第一次的筛选结果。这些因子随后被作为了失败模式影响分析的输入而进行第二次筛选。

2002年2月20日,课题组的成员对前期的工作进行回顾,听完课题黑带的项目进展报告后,由黑带主持进行第一次的潜在失败模式影响分析。经过分析研究,对于一些能够立即改善的事项拟定出对策和改善期限后各自分头实施。

经过一段时间的改善和巩固后,课题组成员再次聚集在一起进行失败模式影响分析,根据风险优先数的排序结果,筛选出如下5个最重要的原因变量。这就好比破案根据线索找出具体的目标嫌疑人:

X1=黑化炉温度

X2=B/P除尘喷嘴转速RPM

X3=MASK焊接压力

X4=B/P除尘U/S强度

X5=脱脂U/S强度

三、分析阶段

课题进展到现在,已经筛选出来5个关键的输入变量,它们是如何对结果产生影响的呢?首先需要分析嫌疑犯的犯罪经过。进入到分析阶段,主要是搜集数据,了解潜在的原因变量对结果是如何发生作用的。在这一阶段应用了不少的统计工具,如假设检验等工具尽管复杂,但是Minitab软件可以帮助我们很轻松地实现。

1.多变量的主效果分析

法律尊重事实,六西格玛用数据说话。为了有效地收集数据,课题组成员重新设计了数据收集表格,按照日期、机种、黑化炉温度、焊接压力、B/P除尘U/S强度、B/P除尘喷嘴转速RPM等因素进行层别和记录,将收集来数据输入Minitab的分析工具表中,应用主效果分析图表明:黑化炉温度、荫罩焊接压力、B/P除尘U/S强度、B/P喷嘴转速RPM对堵孔率似乎有比较明显的影响,但仍需应用统计分析方法确认数据的信赖性。

2.统计分析中的假设检验

统计分析方法可以最大限度地减少主观判断的不确定性,或者说将主观判断的风险降到最低限度。例如嫌疑犯是否真的有罪?假设检验就是在没有确定的证据之前假设罪犯是无辜的,这叫做疑罪从无,建立假设后寻找证据支持或假设。如果不是这样,则将会产生个人的主观臆断,或者说你相信他有罪,你的主观意识中就会去寻找一切支持他有罪的证据,这叫做有罪推定。

本课题针对在测量阶段确定的5个关键输入变量逐一进行分析,从统计信赖性上验证其对结果的影响,并实施改善。

例如,课题组安排了3名倒班员工记录在自然状态下的黑化炉温度和荫罩堵孔发生率状况,然后建立假设和分析。应用工程能力分析法,可以看出黑化炉的温度对结果的影响较大,Cpk只有0.07,经研究后采取了如下三条主要措施:

1)预热区间加热器增加,增大加热功率,保证加热能力。

2)脱脂干燥区间延长,改善干燥状态,同时提高部件入炉前温度。

3)黑化炉保温系统保全,减少炉内热量散失。

改善后工程能力提高到了0.57。同样的分析方法被应用于关键因子X2、X3和X4的分析及改善上。经过多次改善后,工程的稳定性良好,自5月份中期荫罩堵孔发生率接近1%。

四、改善阶段

找出了犯罪嫌疑人,但是对于团伙作案他们之间是什么样的关系我们必须明确,这样才能找出主犯和从犯。在这个课题中,有影响的关键因子X已经确定了,那么如方程式Y=F(X)中的X取什么值才能使得Y有最佳的表现?多个因子X之间又往往互相影响,应用实验计划法就是为了在复杂的交互作用条件下寻求关键因子的最佳取值。本课题中,应用响应表面法(RSM)分析B/P除尘强度、B/P喷嘴转速得出保证效果的最佳条件为,B/P除尘强度:26±4G;B/P喷嘴转速:34±3RPM。

五、控制阶段

这一阶段是维持管理的阶段,拟定控制计划(Control Plan),实施日常管理,将课程全阶段的研究成果纳入公司的标准管理体系,应用标准来稳定和固化前期的改善成果,并检验课题的效果。

自实施改善以来,堵孔发生率逐月下降,6月份以后的平均值为0.79%,达到了课题开始之前设定的目标。Y的工程能力也提高到了1.0。

【实施效果】该课题完成后,经过六西格玛推进委员的财务效果分析师(FEA)进行验证,达到了课题目标,按年间效果金额进行计算,可为公司节约费用310万元,同时,本课题被集团公司评为二等奖,其他工厂也纷纷前来取经。

六西格玛虽然应用了大量的统计学原理,但是学习六西格玛完全不同于学习统计学,更多的时候,你只要知道如何按照规定的格式要求把相应的数据输入电脑,能够读懂结果和进行判断就足矣,一旦陷入统计学的迷宫往往就会偏离你解决问题的方向。当然,拥有深厚的统计理论基础,对于知其所以然并判断数据的信赖性有很大的帮助。

篇8

关键词:多点地质统计学 训练图像 储层建模

一、多点地质统计学与训练图像

基于变差函数的传统地质统计学随机模拟是目前储层非均质性模拟的常用方法。然而,变差函数只能建立空间两点之间的相关性,难于描述具有复杂空间结构和几何形态的地质体的连续性和变异性。

针对这一问题,多点地质统计学方法应运而生。该方法着重表达空间中多点之间的相关性,能够有效克服传统地质统计学在描述空间形态较复杂的地质体方面的不足。多点地质统计学的基本工具是训练图像,其地位相当于传统地质统计学中的变差函数。对于沉积相建模而言,训练图像相当于定量的相模式,实质上就是一个包含有相接触关系的数字化先验地质模型,其中包含的相接触关系是建模者认为一定存在于实际储层中的。

二、地质概念模型转换成图像训练

地质工作人员擅于根据自己的先验认识、专业知识或现有的类比数据库来建立储层的概念模型。当地质工作人员认为某些特定的概念模型可以反映实际储层的沉积微相接触关系时,这些概念模型就可以转换或直接作为训练图像来使用。利用训练图像整合先验地质认识,并在储层建模过程中引导井间相的预测,是多点地质统计学模拟的一个突破性贡献。

可以将训练图像看作是一个显示空间中相分布模式的定量且直观的先验模型。地质解释成果图、遥感数据或手绘草图都可以作为训练图像或建立训练图像的要素来使用。理想状态下,应当建立一个训练图像库,这样一来建模人员就可以直接选取和使用那些包含目标储层典型沉积模式的训练图像,而不需要每次都重新制作训练图像。

三、多点模拟原理

进行多点模拟,需要使用地质统计学中的序贯模拟。但是,多点模拟与传统的基于变差函数的两点模拟是不同的。在传统地质统计学中,我们假设空间变量服从多元高斯分布,这样,确定每一个网格单元条件分布的均值和方差,就相当于求解一个克里金方程组。而在多点模拟中,条件分布是直接通过扫描训练图像得到的。假设现在有一个储层已被离散成N=Nx*Ny个单元格,其属性用随机函数{Z(x)|x储层}来表示。那么,显然变量Z的分布完全由N个变量的联合分布所控制:

利用序贯分解,可以将这个N维的联合分布分解为一系列条件分布:

序贯模拟算法的具体步骤如下:

1.定义一个用于访问所有节点随机路径;

2.对每一个节点i=1,2,…,N 执行

2.1利用前期得到的i-1个抽样,对条件分布进行模拟;

2.2从上面的条件分布模拟结果中抽取一个结果。

持续这一进程直到所有节点都被访问到,这时就生成了一个模拟实现。通过定义另一个随机路径,可以得到新的模拟实现。这一序贯多点模拟算法被命名为SNESIM(Single Normal Equation SIMulation)算法。

四、多点与两点地质统计学之间的理论联系

可以通过一个简单的例子了解多点与两点地质统计学之间的关系:

给定3个已知数据I1、I2、I3,估计位置处的砂岩概率(图1)。

在两点统计学中,这相当于利用三个已知量的线性组合来估计未知量的条件期望:

上式可以近似的写作:

通过求解、、、四个系数,可以确定未知量的条件期望。但是在确定未知量条件期望的过程中,无论是使用变差函数求取两点的相关性,还是使用协方差来求取二阶矩,每次只能使用三个已知数据中的两个,而无法同时使用三个已知量。

全面、准确的条件期望的表达式应当是:

这个含有非线性项的表达式中将三个已知量都包括在内,同时也有更多的系数需要求解。与求解四个系数的方程组类似,这里需要求解一个包含八个方程的方程组,这些方程被称为标准方程。引入非线性项的一个显著后果是标准方程中出现了高阶统计量。由于通过稀疏数据难以推断高阶统计量,因此不可能解出所有的标准方程。但是,我们可以引入一个给定的数据事件,并应用贝叶斯法则来计算条件期望:

其中A代表处为砂岩的数据事件,即;B代表数据事件。可以通过扫描训练图像,统计数据事件B重复出现的次数以及这些重复中为砂岩的概率来计算条件期望:

这一公式是SNESIM算法的核心。可以看出多点地质统计学在再现高度非线性空间结构方面明显优于基于变差函数理论的传统两点地质统计学。

五、结论

将更多的地质资料整合到储层建模过程中以确保最终数值模型更加符合地质认识,这在预测储层流体特征时是十分必要的。多点地质统计学为地质工作者提供了一个强大的工具,使得他们可以通过训练图像将概念模型和先验地质认识整合到建模过程中。

目前研究的重点是提高多点模拟算法的性能,包括:提高运行速度,降低内存开销,提高沉积模式再现效果以及更灵活的整合不同来源的信息等。有理由相信,随着多点建模方法不断趋于主流,以及越来越多的地质工作者对这一方法变得熟悉,多点地质统计学将成为下一代地质建模工具。

参考文献

[1] 王家华等. 克里金地质绘图技术——计算机的模型和算法[M]. 1. 北京:石油工业出版社, 1999 :1-3.

[2] 王家华, 陈涛. 储层沉积相多点地质统计学建模方法[J]. 石油化工应用, 2013, 32(8):57-59.

[3] 张团峰. 在储层建模中利用多点地质统计学整合地质概念模型及其解释 [J]. 地学前沿, 2008, 15(1):26-34.

[4] André G. Journel. Geostatistics: Roadblocks and Challenges[J]. Quantitative Geology and Geostatistics, 1993(5):213-224.

篇9

[关键词] 市场营销 统计分析 市场细分 市场定价

一、统计分析的特点

1.以统计数据为依据,利用统计数据说话

2.定量分析定性分析相结合

3.统计分析方法具有特殊性

4.统计分析的对象具有综合性

5.统计分析的范围具有广泛性

二、市场细分与统计方法

面对市场竞争环境的日趋激烈,产品或品牌的日益复杂化,许多企业都意识到不可能依靠单一产品满足所有的消费者需求。因此,如何审视市场特征、判别消费者需求,是企业的产品或品牌能否取得成功的关键因素。

1.市场细分的概念

市场细分是按照消费者欲望与需求把一个总体市场划分为若干具有共同特征的子市场的过程。分属于同一细分市场的消费者,他们的需要和欲望极为相似,分属于不同细分市场的消费者对同一产品的需要和欲望存在着明显的差别因此,企业必须知道哪些客户对自己是最有价值的,他们的具体需求是什么,如何才能接近他们――市场细分的目的就是把需求大体相似的消费者划归为同一群体,从而以相应的商品和服务去满足该群体消费者的需求。

2.统计方法在市场细分中的应用

从市场细分的程序来看,市场细分的基本观念是,通过统计方法,在基础变量(如消费者的性别、年龄等)和行为变量(如对产品的购买率)之间建立某种联系。因此,对基础变量的选择、建立变量间联系的方法成为细分研究成败的关键,在选择细分变量时可以采用统计学的因子分析模型。其基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子,以较少的几个因子反映原材料的大部分信息。使用因子分析检验数据,可以剔除相关性很大的变量。这就可以为市场细分中产生综合变数提供可能性,根据每个因子的方差贡献率大小排序,只选择方差贡献率大的前几位因子,作为细分的重要综合变数,这样就实现了只提取少数市场细分有重要影响的变数作为细分变数的目的,使得市场细分具有可操作性。

三、客户满意度与统计方法

1.客户满意度的含义

客户满意是一种心理活动,是顾客的需求被满足后的愉悦感。客户满意度可以简要地定义为:顾客接受产品和服务的实际感受与其期望值比较的程度。即顾客的可感知的效果与期望匹配,就会满意,超过了就会高度满意。这个定义既体现了顾客满意的程度,也反映出企业提供的产品或服务满足顾客需求的成效。

2.统计方法在客户满意度测评中的应用

弄清楚了顾客满意产生的机理,我们就可以借助统计学的工具对顾客满意度进行测量,为企业决策服务。而要测量顾客满意,就必须有一套衡量、评价、提高顾客满意度的科学指标体系。一般地在进行顾客满意指标体系建立时,主要可以分为四个步骤:

(1)提出问题。进行顾客满意指标体系建设的第一步,就是要明确影响顾客满意的因素有哪些,同时还必须考虑如何将这些因素获得与量化,即包括对下面几个问题的回答:影响购买和使用的顾客满意因素有哪些?在这些满意因素中,哪些因素能为成为满意指标?每一个满意指标对购买和使用的影响程度如何?上述数据可以从哪些渠道获得?应该采用何种方式采集数据?采集数据时应注意哪些问题?

(2)采集数据。采集数据的方法有很多种,建立不同的顾客满意指标体系所侧重的采集方法不同。在顾客满意指标体系建立过程中采用的方法主要包括:二手资料收集、内部访谈、问卷调查、深度访谈和焦点访谈。

(3)建立行业顾客满意因素体系。通过分析、整理收集到的二手资料和内部(外部)访谈所获得信息,建立顾客满意因素体系表。对各类指标的属性进行充分分解,则初步建立起顾客满意因素集合,为下一步展开数据收集工作提供调研目标。建立起来的行业顾客满意因素体系包含了几乎所有可能影响顾客满意指数的指标,多数都以三级或四级指标的形式表现出来。

四、市场定价与统计方法

1.市场定价的方法

定价方法有成本导向、竞争导向、需求导向三种。成本导向定价指按开发成本和人为订立的利润比率确定价格。竞争导向定价法是指企业通过研究竞争对手的生产条件、服务状况、价格水平等因素,依据自身的竞争实力,参考成本和供求状况来确定同类产品的价格。需求导向定价是以消费者的认知价值、需求强度及对价格的承受能力为依据,以市场占有率、品牌形象和最终利润为目标,真正按照有效需求来策划房地产价格。

2.统计方法在市场定价中的应用

篇10

关键词:数据挖掘;统计学;涵义

统计学如何为数据挖掘服务,这是在“数据挖掘”飞速发展的今天,统计工作者必须回答的一个问题,我国厦门大学的朱建平教授提出:“统计学应该随时关注数据分析,哪里有数据,哪里就应该有统计分析。”统计学是搜集、展示、分析和解释数据的学科,它拥有非常深厚的理论基础,并在社会生活的各个领域发挥着巨大的作用。近代统计学方法与信息处理的关系日益密切,作为信息处理的一个基本工具,统计学方法将发挥越来越重要的作用。

数据挖掘是近十几年里发展起来的一门崭新的学科,由于它与统计学都关心从数据中发现某种结构,因而从数据挖掘诞生之日起,就与统计学有了千丝万缕的联系。

一、统计学与数据挖掘的涵义

统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察的系统数据,进行量化的分析、总结,进行推断和预测,为相关决策提供依据和参考;它分为描述统计和推断统计。描述统计包括对客观现象的度量、调查方案的设计,对所收集的数据资料进行加工整理、综合概括,通过图示、列表等方式进行分析和描述。推断统计是在搜集、整理监测样本数据的基础上,对有关总体做出推断,其特点是根据随机性的观测样本数据以及问题的条件和假定,对未知事务做出以概率形式表述的推断。

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的,人们事先不知道的,但又具有潜在价值的信息和知识(模型或规则)的过程。这个定义包括以下含义:数据源必然是真实的、大量的、含噪声的;发现的知识可接受、可理解、可运用,并不要求发现放之四海皆准的知识,仅支持特定的发现问题。它能高度自动化的分析原有数据,做出目的性推理,从中挖掘出潜在的模式,从而帮助决策者调整策略,做出正确的决策。它融数据库技术、人工智能技术、数理统计技术和可视化技术为一体,是一个多学科相互交叉又融合所形成的一个新兴的具有广泛应用前景的研究领域。

二、统计学与数据挖掘的联系

(一)数据挖掘虽不同于统计分析,但许多挖掘技术又来源于统计分析,数据挖掘中有许多工作可以由统计方法来完成。比如预言算法(回归)、抽样、基于经验的设计等。

(二)数据挖掘不是为了替代传统的统计分析技术,相反,数据挖掘是统计分析方法的扩展和延伸。大多数的统计分析技术都基于完善的数学理论和高超的技巧,其预测的准确程度还是令人满意的,但对于使用者的知识要求比较高。而随着计算机能力的不断发展,数据挖掘可以利用相对简单和固定程序完成同样的功能。

(三)数据挖掘技术的出现为统计学提供了一个崭新的应用领域,也对统计学的理论研究提出了挑战。数据挖掘技术有相当大的比重是由高等统计学中的多变量分析所支撑。

(四)统计学与数据挖掘的结合日益紧密。数学是传统意义上统计学方法的首要工具,而计算机和网络为代表的信息技术,正逐渐成为统计学应用的首要工具。随着数据源的不断膨胀和数据结构的日益复杂,单纯依靠数据挖掘技术,已渐露力不从心之态,而统计学的同步发展,正不断充实、完善着数据挖掘技术。因此,随着信息化水平的提高,统计学与数据挖掘的应用平台渐趋统一。

三、预测性挖掘中常用的统计学方法

数据挖掘中应用的统计学预测性方法主要有判别分析和回归分析。其中,判别分析用于对离散型目标变量的预测,而回归分析则主要用于对连续性目标变量的预测。

(一)判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类。判别分析是统计学的基本分析方法之一。