统计学变量类型范文

导语：如何才能写好一篇统计学变量类型，这就需要搜集整理更多的资料和文献，欢迎阅读由公务员之家整理的十篇范文，供你借鉴。

统计学变量类型

篇1

[关键词]社会科学统计方法应用问题

社会科学的实证研究在应用统计学时,统计分析是其关键环节,资料性质分析、资料类型的判断、统计方法的选择等各个环节都应把握好,否则,其分析结果将是没有意义的。本文拟通过对社会科学实证研究论文中应用统计分析方法出现的问题,从描述性分析、定量资料的统计分析、定性资料的统计分析、相关与回归分析等方面进行解析。

一、描述性分析问题

在社会科学实证研究中,一般首先要对社会调查数据进行描述性统计分析,以发现其内在的规律性,再选择进一步的分析方法。描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、集中趋势分析、离散程度分析、分布形态以及一些基本的统计图形。

描述性统计分析虽然较为简单,但如果对某个事件或某种现象的描述不清楚或存在偏差,那么其后的所有分析都将值得怀疑,而描述的偏差可能会引起公众或学术界对某些社会现象的误解,甚至误导政府决策。

1.均值的误用

均值是用于描述样本集中趋势的最常用指标,但应注意,对于正态或近似正态的对称分布样本,它是较好的指标,一般与离散趋势指标中的标准差一起描述数据资料(即形式);而对于偏态分布的样本,则常用中位数来描述集中趋势,一般与离散趋势指标中的四分位数间距一起描述数据资料(即形式),究其原因是均值容易受到极端值的影响。

对于两个分布完全不同的样本,可能会得到相同的均值,因此均值在某种程度上抹杀了样本内部的差异,而往往这种内部差异正是需要进行深入研究或应当引起人们注意的。为了弥补均值的这种缺陷,一般在报告均值的同时,也应该报告标准差,或用直方图或散点图的形式描述分布,以展示群体内部的差异。

2.绝对数的误用

因为社会调查研究比较容易得到大容量的样本,所以对任何小概率事件,用绝对数报告都会出现较大的数字,单纯对绝对数的强调往往会产生误解。比较合理的方式一般是在报告某事件绝对数的同时,给出该事件的发生率或占研究样本的比例。

3.相对数的误用

相对数常用于描述定性资料的内部构成情况或相对比值或某现象的发生强度,一般有比与率两种形式。虽然比与率的计算形式是相同的,即两个绝对数之商乘以100%,但它们的含义是不同的。率用于反映某种事物或现象发生的强度,而比则用于反映部分与整体或某一部分与另一部分之间的关系。当数据的比较基础相差悬殊,用绝对数表述没有可比性时,就要借助于相对数。

应用相对数也容易出现一些问题,如:百分比与百分率的混用;当分母很小时,只计算百分比或百分率,而没有报告样本量;当比较两个或多个总体率时,没有考虑到各总体对应的内部构成情况是否一致,而直接比较等。

例如在报告流动人口犯罪问题时,给人的印象往往是流动人口犯罪率高于常住人口,其实是忽视了流动人口的年龄和性别构成与常住人口完全不同,且青年男性是犯罪率较高的人群,这样对两个不同群体的比较往往会导致错误的结论。

二、定量资料的统计分析问题

定量资料的统计分析是指所观测的结果变量是定量的,而且希望考察定性的影响因素取不同水平时,定量观测结果的均值之间的差别是否有统计学意义。定量资料的统计分析在统计学应用中占有很大的比重,出现的误用也比较多。

正确选择定量资料统计分析方法的关键有两点:一是正确判断统计研究设计的类型;再是检验定量资料是否满足“独立性、正态性及方差齐性”的前提条件[1]。前者要求使用者对统计研究设计的类型较为熟悉,后者则需要进行预分析,可适当借助于统计分析软件。根据前提条件是否满足来决定用参数假设检验或方差分析,还是用非参数检验方法,进而根据对统计研究设计类型的判断,确定采用具体的统计分析方法。

对定量资料作统计分析时,常犯的错误有:

1.不管统计研究设计类型,盲目套用t检验或单因素方差分析;

2.不验证“独立性、正态性及方差齐性”前提条件,而直接应用参数检验法;

3.将多因素设计定量资料人为拆成多个成组设计定量资料,采用t检验法;

4.将多因素设计定量资料用单因素多水平方差分析解决,或用一元分析替代多元分析等。

三、定性资料的统计分析问题

定性资料的统计分析是指观测结果为定性变量的统计处理问题。定性资料的统计分析在社会科学研究中的应用也是很广泛的,通常根据影响观测结果的原因变量性质分为三种情况:

1.原因变量都为定性变量,此类资料就是通常理解的定性资料。常用的统计分析方法有:检验、秩和检验或Ridit分析、Spearman秩相关分析、线性趋势检验、一致性检验(也称Kappa检验)、加权检验、对数线性模型等。

2.原因变量中既有定性变量,又有定量变量。这类资料的统计分析通常有两种处理方法:一是结合专业知识先将定量的原因变量离散化,使其转化为定性变量,然后采用上面3.1的统计方法处理;二是先对定性的原因变量,采用哑变量技术进行处理,转化为多个二值变量,赋予0或1值,然后采用Logistic回归分析方法或多值有序变量Logistic回归分析处理。

3.原因变量全部为定量变量。这类资料的分析可以直接采用Logistic回归分析方法或多值有序变量Logistic回归分析处理。

定性资料的最常用表达形式是列联表,列联表有多种类型,如横断面设计的四格(或称2x2)列联表、队列研究设计的四格列联表、配对研究设计的四格列联表、双向无序的R×C列联表、单向有序的R×C列联表、高维列联表等,不同类型所用统计方法也不同,所以处理这类资料的关键是分辨出列联表的类型,从而选择相应统计分析方法。

在社会科学研究中,定性资料的统计分析常犯的错误主要就是列联表的误判,从而错误的选用统计方法。

四、相关与回归分析问题

相关分析是研究变量之间的相互关系,常局限于统计描述,较难从数量角度对变量之间的联系进行深入研究;回归分析则是研究变量之间的依赖关系,可实现对自变量进行控制,对因变量进行预测,及对随机变化趋势进行适当修匀。

相关分析可用于对定类、定序、定距及定比等尺度的各类资料进行定量描述,但各类资料的计算公式是不同的,所以应用时,需要判明资料的类型;而回归分析则要根据因变量性质的不同,选用不同的回归分析方法,一般可分为两类:一是因变量为连续型变量,具体的,当为非时间性的连续型变量时,可用线性回归分析、多项式回归分析、非线性回归分析等;当为时间变量时,可用COX半参数回归分析、指数分布回归分析及威布尔回归分析等;当为随时间变化的连续型变量时,则需要利用时间序列分析。二是因变量为离散型变量,需要利用Logistic回归分析、对数线性模型分析及多项Logit模型分析等。

在社会科学研究中,相关与回归分析的应用非常广泛。但应用时也经常出现一些错误:

1.没有结合问题的专业背景和实际意义,就进行相关与回归分析。其结果有时可能是莫名奇妙的,可能出现所谓的虚假相关。

2.对于较简单的线性相关与回归分析,不注意应用条件,盲目套用。一般地,Pearson相关分析要求两变量都是随机变量,且都服从或近似服从正态分布,若不满足条件,应采用其它相关分析法,如Spearman相关分析等。而线性回归分析则要求因变量必须是随机变量,且服从或近似服从正态分布,在回归分析前,先要进行统计检验,证实两变量的显著相关性,再进一步进行回归分析才有意义。

3.只求得相关系数或回归方程,而不进行参数假设检验就下统计分析结论。因为相关系数或回归方程都是由样本数据求得的,是否具有统计学意义,必须通过其相关参数的假设检验来判定。

4.多元回归分析策略的错误。在社会科学实证研究中,对多元回归分析的应用,不少人采取的策略是先用单变量分析,得到有统计学意义的多个变量,再将它们引入回归方程进行多变量分析,用逐步回归法进行筛选,从中选出有统计学意义的变量,这种分析策略是不正确的。因为自变量之间可能存在不同程度的交互作用,在单变量分析中无统计学意义的变量并非在多元回归分析中也没有意义。正确的处理方法应该是先综合分析各种变量之间的作用、实际意义及关系,有些可作为控制变量(如性别、年龄等),将经过初步筛选的所有变量代入回归方程进行分析,再采用逐步回归方法,必要时可多用几种筛选变量的方法,同时要注意自变量间的交互作用,进行综合分析,这样才能得到较为可靠的结果。

参考文献:

[1]王在翔:社会统计理论与实践[M].青岛:中国海洋大学出版社,2008

[2]胡良平等.医学统计学基础与典型错误辨析[M].北京:军事医学科学出版社,2003.148-239

[3]柯文泉:统计方法应用中应注意的几个问题[J].时代经贸,2008,6(96):83-86

篇2

很多科研人员(包括临床医生)在进行科研工作过程中，习惯用专业知识取代一切其他知识。其突出表现是：等科研工作已经完成，甚至论文已写完，因某些数据处理有问题被退稿时，才想起要找统计学工作者帮助处理论文中的实验数据；考虑问题稍周到一些的科研人员在科研工作完成之后，在撰写论文之前就想到要运用统计学知识来分析实验数据。这两种运用统计学的科研人员都是在把统计学当作分析数据的“计算工具”或当作发表学术论文的“敲门砖”，是对统计学重要性认识不足的突出表现。理由很简单，科研数据是否正确可靠、是否值得进行数据分析、结论是否可信等一系列重要问题都没有令人信服的证据来帮助说明，换句话说，若缺乏科研设计或科研设计不科学、不完善，即使花费10年时间和数亿人民币进行调查或实验获得了大量科研数据，与某人用计算机产生的毫无专业含义的任意多个随机数据没有什么区别，除了浪费了大量国家和人民的血汗钱，对科学技术进步、对人类的贡献不仅为零，甚至是负数！因此，在进行科研工作之前，制定科学完善的科研设计方案，特别是其中的实验设计方案或调查设计方案的质量好坏，是科研工作成败的关键所在！

科研设计包括专业设计和统计研究设计。专业设计主要包括基本常识和专业知识的正确、全面、巧妙地运用；而统计研究设计包括实验设计、临床试验设计和调查设计。值得注意的是：在很多科研人员所做的科研课题中，不仅严重忽视统计研究设计，就连专业设计也有严重错误，主要表现在犯了基本常识错误和违背专业知识错误。这类错误所发生的频率还相当高，是一种不能容忍的不正常现象！

在统计研究设计所包含的3种研究设计中，实验设计是最重要的，因为很多关键性的内容都包含在其中，其核心内容是“三要素”、“四原则”和“设计类型”。所谓“三要素”就是受试对象(或调查对象)、影响因素(包括试验因素和重要的非试验因素)和实验效应(通过具体的观测指标来体现)；所谓“四原则”就是随机、对照、重复和均衡原则，它们在选取和分配受试对象、控制重要非试验因素对观测结果的干扰和影响、提高组间均衡性、提高结论的可靠性和说服力等方面将起到“保驾护航”的作用；所谓“设计类型”就是实验中因素及其水平如何合理搭配而形成的一种结构，它决定了能否多快好省且又经济可靠地实现研究目标。科研人员若对重要非试验因素考虑不周到、对照组选择不合理、设计类型选择不当或辨别不清，导致科研课题的科研设计千疮百孔、数据分析滥竽充数、结果解释稀里糊涂、结论陈述啼笑皆非。下面笔者就“实验设计”环节存在的问题辨析如下。

1 在分析定量资料前未明确交代所对应的实验设计类型

人们在处理定量资料前未明确交代定量资料所对应的实验设计，对数千篇稿件进行审阅后发现，大多数人都是盲目套用统计分析方法，其结论的正确性如何是可想而知的。这是一条出现非常频繁的错误，应当引起广大科研工作者的高度重视。

2 临床试验设计中一个极易被忽视的问题——按重要非试验因素进行分层随机化

例1：原文题目为《气管舒合剂治疗支气管哮喘的临床观察》。原作者写到：“全部病例均来源于本院呼吸专科门诊和普通门诊，随机分为治疗组40例和对照组30例。其中治疗组男21例，女19例；年龄21～55岁，平均(36.28±9.36)岁；病程2～23年，平均(10.31±17.48)年；病情轻度者16例，中度24例。对照组30例，男16例，女14例；年龄20～53岁，平均(35.78±9.53)岁；病程3～24年，平均(11.05±6.47)年；病情轻度者13例，中度者17例。两组间情况差异无显著性，具有可比性。”请问这样随机化，其组间具有可比性吗？

对差错的辨析与释疑：显然，研究者在试验设计时未对重要非试验因素采用分层随机保证各组之间的可比性。这条错误的严重程度为不可逆，出现不可逆错误意味着原作者的试验设计具有无法改正的错误，必须重做实验！究其原因，主要是原作者未理解统计学上随机的概念。统计学上随机化的目的是尽可能去掉人为因素对观测结果的干扰和影响，让重要的非试验因素在组间达到平衡。稍微留意一下原作者随机化分组，明显带有人为的痕迹，治疗组40人比对照组30人多出10人；治疗组病程的标准差17.48是对照组病程的标准差6.47的近3倍。笔者很疑惑怎样的随机化才能达到如此的不平衡？事实上随机化有4种：子总体内随机、完全随机、分层随机和按不平衡指数最小原则所进行的随机，原文条件下应当选用分层随机，即以两个重要的非试验因素(性别和病情)水平组合形成4个小组(男轻，女轻，男中，女中)，然后把每个小组内的患者再随机均分到治疗组和对照组中去，这样分层随机的最终结果一定是治疗组和对照组各35人，且使2组间非试验因素的影响达到尽可能的平衡，从而可大大提高组间的可比性。在本例中，若“病程”对观测结果有重要影响，在进行分层随机化时，在按“性别”和“病情”分组的基础上，还应再按“病程”(设分为短、中、长)分组，即共形成12个小组，将每个小组中的患者随机均分入治疗组与对照组中去，这是使“性别、病情、病程”3个重要非试验因素对观测结果的影响在治疗组与对照组之间达到平衡的重要举措，也是所有临床试验研究成败与否的最关键环节！

3 实验设计类型判断错误

例2：某作者欲观察甘草酸、泼尼松对慢性马兜铃酸肾病(AAN)肾损害的干预作用，于是，进行了实验，数据见表1。原作者经过用甘草酸和泼尼松分别与同期正常对照组和模型组比较，一个P＜0.05，另一个P＜0.01，于是得到甘草酸、泼尼松对慢性AAN肾损害具有一定程度的保护作用，且泼尼松的效果更佳。请问原作者的结论可信吗？表1 各组大鼠血BUN及SCr变化比较（略）注：与正常对照组同期比较，*P＜0.05，**P＜0.01；与模型组同期比较，P＜0.05，P＜0.01

对差错的辨析与释疑：本例错误极为典型，通常科研工作者欲观察某种药物是否有效，习惯上会建立正常对照组、模型组(即该药物拟治疗的病态组)和在模型组基础上的用药组(如本例中甘草酸组和泼尼松组)。这样的设计本身并没有错，但这仅仅是专业上的“实验安排(可称为多因素非平衡组合实验[1])”，而并非是统计学中所说的某种标准实验设计类型。写在“组别”之下的4个组，并非是一个因素的4个水平，而是2个因素水平的部分组合。这2个因素分别是“是否建模(即正常与模型2个水平)”和“用药种类[即不用药(相当于安慰剂)、用甘草酸和用泼尼松3个水平]”。2个因素共有6种水平组合，即“组别”之下缺少了“正常基础上用甘草酸”和“正常基础上用泼尼松”。这样设计的实验才可能反映出“是否建模”与“用药种类”2个因素之间是否存在交互作用。

在本课题研究中，由于未在实验前作出正确的实验设计，处理数据时错误就悄然产生了。具体到本例，从原作者在表1的注解中可以看出，通过单因素方差分析分别比较同期(即相同观测时间点)的甘草酸组和泼尼松组与正常对照组和模型组之间的差别是否有统计学意义。这样的做法有3个严重错误：第一，严格地说，在模型组基础上的用药组是不适合直接与正常对照组相比较的，因为这样的比较解释不清到底是药物的作用还是由于模型未建成功而造成的假象；第二，将各个时间点割裂开分别比较破坏了原先的整体设计，数据利用率降低，误差估计不准确，导致结论的可信度降低。将一个重复测量实验的各个时间点割裂开来考察，就等于在各个片段上估计实验误差、作出统计推断，好像盲人摸象一样，摸出来的结果差别何其之大；第三，要想说明两种药物哪个效果更佳，在得出差别具有统计学意义的基础上，衡量的标准是应看组间平均值的差量的大小而不应看P值是否足够地小，不能说P＜0.01时就比P＜0.05时更有效，这种忽视实验误差、忽视绝对数量和脱离专业知识的想法和做法都是不妥当的。

如何正确处理表1中的实验资料呢？关键要正确判定该定量资料所对应的是什么实验设计类型。由前面的分析可知，表1定量资料对应的是“多因素非平衡组合实验”，而不是某种标准的多因素实验设计类型。明智的做法是对“组别”进行合理拆分，即根据专业知识和统计学知识，对“组别”之下的所有组重新进行组合，应使每种组合对应着一个标准的实验设计类型。正确地拆分结果分别见表2和表3。表2 正常对照组与模型组大鼠血BUN及SCr变化的测定结果（略）表3 模型组和2个用药组大鼠血BUN及SCr变化的测定结果（略）

事实上，由科研习惯形成的这一套实验方案笔者形象地称之为多因素非平衡的组合实验，或者说，它是实验设计的表现型。通常可以进行统计分析的都必须是标准型(即统计学上所说的某种实验设计类型)，因此需要能看出代表表现型本质的原型(本例中组别之下应该有6个组，这6个组构成一个2×3析因设计结构，但原作者少设计了2个组)。通常需要将表现型或/和原型拆分成标准型后再选择合适的统计分析方法进行数据分析。本例根据原作者的意图，可以将表1拆分成2个标准型，形成2个具有一个重复测量的两因素设计定量资料，见表2和表3。相应的统计分析方法就是具有一个重复测量的两因素设计定量资料的方差分析。此处请读者注意：第一，具有一个重复测量的两因素设计定量资料的方差分析和一般的方差分析虽然都叫方差分析，但它们的计算公式却有本质区别，绝不可混用；第二，重复测量因素(本例中为时间)不要与实验分组因素(表2中叫“是否建模”；表3中叫“药物种类”)同时列入左边，它们是本质不同的两种因素，一般应该把“重复测量因素”放到表头横线下方。

通过本例可以看出，在实验前明确实验设计是多么重要的一件事情。试想，若让本例原作者写明他的实验设计类型，他必然就会对基本的实验设计类型作一番调查和学习，自然就能发现他所“设计”的实验并不是统计学上相应的实验设计。那么通过咨询相关人士必能做出比较正确的实验设计，不仅可以提高科研设计水平，而且可以大大提高科研课题和论文质量。

例3：原文题目为《土荆芥-水团花对胃溃疡大鼠黏膜保护作用的研究》。原作者使用单因素多水平设计定量资料方差分析处理表4中的数据。请问原作者这样做对吗？表4 各组黏膜肌层宽度、再生黏膜厚度变化（略）注：与正常组比较，aP＜0.05；与NS组比较，bP＜0.05；与CP 10 mg·kg－1 组比较，cP＜0.05

对差错的辨析与释疑：本例涉及到统计学三型理论[1]中的一些概念，简单地说就是可以直接进行统计分析的来自标准设计的数据表叫标准型，反映问题本质但并非是标准型的数据表叫原型，而掩盖了原型信息的数据表叫表现型。“组别”之下的6个组，似乎是某个因素的6个水平，其实不然！这6个组涉及到多个试验因素，应对“组别”拆分重新组合后，再分别判定各种组合所对应的实验设计类型，并选用相应的统计分析方法。组合1：空白对照组(正常)、阴性对照组(NS)，这是单因素两水平设计(简称为成组设计)。由于正常组无实验数据，故该组合无法进行统计分析；组合2：NS组、RA组、CP(20/mg·kg-1)组，这是单因素3水平设计，因素的名称叫“药物种类”；组合3：NS组、CP(10/mg·kg-1)组、CP(15/mg·kg-1)组、CP(20/mg·kg-1)组，这是单因素4水平设计，因素名称叫CP的剂量(其中，NS组可视为CP的剂量为0)。

对于组合2和组合3，若定量资料满足参数检验的前提条件，可选用相应设计定量资料的方差分析，否则，需要改用相应设计定量资料的秩和检验。

4 人为改变设计类型且数据利用不全

例4：某作者使用表5中的数据进行分析，欲比较治疗组和对照组在治疗后的各个时间点的疗效情况，使用的分析方法为一般卡方检验，请问原作者这样做对吗？

对差错的辨析与释疑：从给出的统计表可以看出，该作者有意或者无意之间收集了一类相当复杂的实验设计类型下的定性资料，结果变量为多值有序变量的具有一个重复测量的两因素设计定性资料，处理这个设计下收集的定性资料要使用相应设计定性资料的统计模型分析法。由于上述方法过于复杂，因此，通常在实际运用中，实际工作者将重复测量因素武断地视为实验分组因素，从而使该资料变为结果变量为多值有序变量的三维列联表资料。在已经出错的前提下，原本应当使用CMH校正的秩和检验或者有序变量的多重logistic回归分析处理资料。然而，该作者显然在此基础上进一步合并了数据，将结果变量变成二值变量(有效、无效)，也就是说，原作者实际使用的仅仅是最后一列数据(即总有效率)，并且最为严重的错误是将三维列联表资料强行降维成二维列联表资料，使用一般χ2检验进行分析。经过一系列的简化与错误合并，最后结论的可信度还剩下多少呢？表5 原作者对2组疗效比较的试验设计及数据表达（略）注：与对照组同期比较，*P＜0.05

由于篇幅所限，这类错误笔者只给出1例，实际上此类例子在很多杂志中普遍存在。这说明在进行实验设计时，很多研究人员并未做到心中有数；分析数据时，按自己熟悉的简单统计分析方法所能解决的数据结构强硬地改造数据，严格地说，在用表格表达实验资料的那一刹那就已人为改变了资料所对应的实验设计类型，这种做法的科学性和得出结论的正确性都将受到质疑[2]。

5 正交设计及数据处理方面的错误

人们在进行正交设计和对正交设计定量资料进行统计分析时，常存在下列3个误区：很多人过分强调用正交设计可以大大减少实验次数，因此，无论各实验条件(正交表中的每一行)下的实验结果波动有多大，都不做重复实验，这是第1个误区；将正交表各列上都排满试验因素，用对实验结果影响最小的试验因素所对应的标准误作为分析其他因素是否具有统计学意义的误差项，导致误差项的自由度较小，结论的可信度较低，这是第2个误区；在对正交设计定量资料进行方差分析后，即使存在多个无统计学意义的因素，仍对少数几个有统计学意义的因素进行解释，未将无统计学意义的因素合并到误差项中去重新估计实验误差，以获得具有较大自由度的误差项，这是第3个误区。

参考文献

篇3

【关键词】焦虑；抑郁；因素分析，统计学；学生；农村人口

【中图分类号】 R 749.7 R 395.6 【文献标识码】 A 【文章编号】 1000-9817(2008)09-0785-03

抑郁、焦虑症状是青少年常见的心理障碍，不仅会影响身心健康，还与吸烟、饮酒、伤害等健康危害行为密切相关［1-2］。农村学校寄宿生大都是由于父母外出打工或住家偏远不得不寄宿，这些孩子长期与父母分离，情感的缺失可能会对孩子的心理健康产生不良影响。为进一步了解安徽省农村寄宿学生的心理卫生状况，笔者于2007年12月到2008年5月对安徽省寄宿制学校学生样本人群的抑郁、焦虑症状及其影响因素进行了研究，结果报道如下。

1 对象与方法

1.1 对象选取安徽省长丰、绩溪、全椒、岳西4个县，每个抽样地区抽取农村寄宿制学校4～5所，每所学校分别从各年级（小学五年级～高中三年级）抽取1～3个班的所有学生作为调查对象，共收回有效问卷3 834份。其中长丰县958人（25.0%），绩溪县1 008人（26.3%），全椒县1 019人（26.6%），岳西县849人（22.1%）；在校住宿学生1 586名（41.4%），在亲朋家住宿学生233名（6.1%），租房住宿学生323名（8.4%），在家住宿学生1 692名（44.1%）；寄宿生（在校和租房住宿合并）1 909人（49.8%），走读生（在亲朋家和在家住宿合并）1 925人（50.2%）；小学生721名（五年级、六年级分别为377和344人），初中生1 898名（初一、初二、初三分别为680，813，405人），高中生1 215名（高一、高二、高三分别为451，424，340人）；男生2 293名（59.8%），女生1 541名（40.2%）。平均年龄（15.15±2.07）岁。

1.2 调查变量（1）人口统计学变量：包括年级、性别、年龄、地区、父母文化程度、自评家庭经济状况、独生子女情况、自评性格倾向、住宿类型等。（2）抑郁和焦虑症状评定：应用Zung抑郁自评量表（Self-rating Depression Scale, SDS）［3-4］和焦虑自评量表（Self-rating Anxiety Scale, SAS）［4-5］进行评定。SAS和SDS均包含20个项目，其评定分为4级，按最近1周以来的实际情况评分，20个项目评分之和为粗分，粗分乘以1.25，四舍五入取整数即为标准分。本研究以标准分≥50分为界值，评估有无抑郁、焦虑症状。

在校住宿生是指来校上课和参加其他课外活动且在学校宿舍住宿的学生；住亲朋家住宿生指来校上课和参加其他课外活动且在亲戚或朋友家住宿的学生；租房住宿生指来校上课和参加其他课外活动自己租房住宿的学生；在家住宿生指来校上课和参加其他课外活动且回家住宿的学生。

1.3 调查方法及质量控制在正式调查之前对调查员进行调查技术培训，统一方法。开展预调查完善调查表；所有调查表均印有指导语，调查时解释指导语并提醒学生和教师仔细阅读指导语后填写；以班级为单位，现场发放调查表，要求学生以匿名方式集中独立填写问卷，当场核验收回。

1.4 统计分析资料以EpiData 3.0建库录入，经数据转换导入SPSS 10.0进行统计分析。统计方法包括描述性分析不同住宿类型学生的抑郁、焦虑症状分布特征，用χ2检验和多因素Logistic回归对抑郁、焦虑症状的影响因素进行分析。

2 结果

2.1 抑郁、焦虑症状检出情况 3 834名学生抑郁症状检出率为49.5%，焦虑症状检出率为24.6%，抑郁和焦虑症状并存检出率为20.8%。抑郁和焦虑呈正相关（r=0.404，P＜0.01）。

2.2 不同住宿类型学生抑郁、焦虑症状检出情况表1显示，在校住宿、在亲朋家住宿、租房住宿和在家住宿学生的抑郁症状以及焦虑症状的检出率差异有统计学意义，其中在校住宿与租房住宿的学生抑郁、焦虑症状检出率差异无统计学意义（χ2抑郁=1.269，P=0.260；χ2焦虑=0.350，P=0.554），而在家住宿与在亲朋家住宿的学生抑郁、焦虑症状分布差异亦无统计学意义（χ2抑郁=0.644，P=0.422；χ2焦虑=0.103，P=0.748），将在校住宿与租房住宿的学生合并为寄宿生，在亲朋家住宿与在家住宿合并为走读生。寄宿生和走读生抑郁症状检出率分别为52.7%和46.2%，差异有统计学意义（χ2=16.021，P=0.000）；寄宿生和走读生的焦虑症状检出率分别为27.7%，21.5%，差异亦有统计学意义（χ2=19.573，P=0.000）。

4种住宿类型中，抑郁症状检出率男、女生差异均无统计学意义。在校住宿学生中，焦虑症状检出率女生高于男生，差异有统计学意义（χ2=5.547，P=0.021）；其余3种住宿类型的学生，焦虑症状检出率男、女生差异均无统计学意义。无论在校住宿、在亲朋家住宿、租房住宿还是在家住宿，从小学五年级至高三年级学生抑郁症状和焦虑症状的检出率差异无明显的规律性。4种住宿类学生间抑郁症状检出率比较，差异有统计学意义(χ2=17.927，P＜0.01)；焦虑症状检出率比较，差异也有统计学意义(χ2=20.046，P＜0.01)。

2.3 抑郁、焦虑症状的影响因素分析

2.3.1 抑郁、焦虑症状影响因素的单因素分析 χ2检验表明，寄宿情况、地区、年级、独生子女情况、父亲文化程度、自评家庭经济状况、体型、自评性格倾向8个因素间抑郁症状检出率差异有统计学意义，寄宿情况、地区、性别、年级、独生子女情况、父亲文化程度、自评家庭经济状况、体型、自评性格倾向9个因素间焦虑症状检出率差异有统计学意义。

2.3.2 多因素非条件Logistic回归分析见表2。

由表2可见，分别以抑郁症状（焦虑症状）（无症状赋值为0，有症状赋值为1）为因变量；以焦虑症状（抑郁症状）、地区（设置哑变量，“岳西县”为参照）、年级（设置哑变量，“高三”为参照）、性别（“男”为参照）、独生子女情况（“是独生子女”为参照）、父亲文化程度（设置哑变量，“大专及以上”为参照）、自评家庭经济状况（设置哑变量，“上等”为参照）、体型（设置哑变量，“很胖”为参照）、自评性格倾向（设置哑变量，“外向”为参照）、寄宿情况（走读生为参照）为自变量，进行多因素Logistic回归分析（Forward：LR法）。纳入标准α =0.05，剔除标准 α=0.10。

结果表明，寄宿生有抑郁、焦虑症状的危险均高于走读生；性格外向的学生发生抑郁症状的危险性较低；绩溪县和全椒县学生抑郁症状发生情况低于岳西县；家庭经济水平上等的学生比经济状况一般的学生更易出现抑郁；五年级到初二年级学生发生抑郁的危险性比高三年级更大。女生有焦虑症状的危险性高于男生；高三年级学生的焦虑症状检出率高于其他年级；绩溪县学生焦虑发生率低于岳西县；抑郁与焦虑密切相关。

3 讨论

以往运用Zung自评抑郁量表、流调中心用抑郁自评量表、Beck抑郁量表等自评抑郁量表进行的调查发现，我国青少年抑郁发生率为22.8%～44.0%［6-10］。国外青少年自我报告的发生率为8.6%～52.4%［11-14］。本次调查的寄宿制学校3 834名学生抑郁症状检出率为49.5%，其中寄宿生的抑郁症状检出率为52.7%，高于安徽省中学生（22.8%）［7］和安徽省大学生(28.2%)［15］。学生总的焦虑检出率为24.6%，寄宿生的焦虑症状检出率为27.7%，高于安徽省中学生［16］，低于丁树荣等［17］的调查结果。反映抑郁和焦虑情绪问题在农村寄宿制学校中普遍存在，寄宿生和走读生都有较多的心理问题，但是寄宿生比走读生更容易出现抑郁、焦虑情绪，特别是抑郁。可能因为本次调查中66.1%的学生为留守儿童，且寄宿生有70%为留守儿童，其余还有部分为离家偏远而寄宿，这些孩子长期与父母分离，与家人联系及外界交流相对较少，生活环境相对封闭，情感的缺失可能会对孩子的心理健康产生不良影响。

由于评定方法和人群种族的不同，青少年抑郁、焦虑症状是否存在性别差异国内外研究的结果不一致。很多研究认为，抑郁症状的性别差别不明显［18-20］，焦虑症状女生显著高于男生［9，15］，本次调查结果与这一结论相同。可能与男女生的心理特征有关，女生情感细腻、敏感，具有较高的焦虑特质。岳西县寄宿生出现抑郁、焦虑症状的风险均高于全椒县和绩溪县，笔者分析是因为岳西县是国家级贫困县，经济水平落后，且地处大别山脉，交通较闭塞，地形地貌在4个县中最为特殊，寄宿生生活条件较差，故该县寄宿生较易出现抑郁、焦虑情绪。

多因素结果显示，小学五年级到初二年级的学生发生抑郁的风险较高，而以高三年级为参照，其他年级出现焦虑情绪的风险均低于高三年级。考虑是因为小学五年级到初二年级这个时期的学生正处于青春发育期，青春发动期的身心变化本身是一种应激事件，可能导致个体的抑郁风险增高［21-22］。对农村寄宿制学校这一特殊群体，父母的日常教育关心都比较少，面临这一转变而无法适应、无处倾诉解决，很可能导致抑郁情绪的增加；而高三年级学生面临高考压力,焦虑情绪的产生在所难免，与苏虹等［9］报道一致。

综上所述，农村寄宿制学生的心理健康不是某一个因素的独立作用,而是多个因素的相互作用结果。只有正确认识其危险因素，采取适当的预防措施，通过家庭、学校和社会等多方面的关心和帮助，方能促进农村寄宿制学生的身心发育。但本研究只是横断面调查，还需要进一步研究来确定抑郁、焦虑的影响因素。

(致谢：本课题得到安徽省学校体育卫生协会的大力支持，特此感谢!)

4 参考文献

［1］陶芳标，张金霞，毛琛，等.抑郁、焦虑症状与中学生多种危害健康行为.中国学校卫生，2004，25(2)：131-133.

［2］张洪波，陶芳标，曾广玉，等.安徽省中学生故意伤害行为及社会心理特征研究.中国公共卫生，2002，18(5)：563-565.

［3］ ZUNG WW. A self-rating depression scale. Arch Gen Psychiatry, 1965,12:63-70.

［4］汪向东，王希林，马弘，主编.心理卫生评定量表手册：增订版.北京：中国心理卫生杂志社，1999：194-196，235-238.

［5］ ZUNG WW. A rating instrument for anxiety disorders. Psychosomatics, 1971,12(6):371-379.

［6］曾强，李乐，唐双阳，等.某高校大学生抑郁症影响因素和预防途径分析.实用预防医学，2006，13(6)：1 412-1 413.

［7］张洪波，陶芳标，曾广玉，等.安徽省中学生抑郁心理症状及其相关因素.中国公共卫生，2001，22(6)：497-498.

［8］冯正直，张大均，汪凤.中学生抑郁症状的影响因素分析.中国临床心理学杂志，2005，13(4)：466-468.

［9］苏虹，王保金，陈卉鸣，等.中学生抑郁、焦虑情绪的流行特征及相关因素分析.中国行为医学科学，2002，11(2)：196-198.

［10］刘贤臣，等.SDS和CES-D对大学生抑郁症状评定结果的比较.中国心理卫生杂志，1995，9 (1)：19-20.

［11］PATTEN CA, GILLIN JC, FARKAS AJ, et al. Depressive symptoms in California adolescents: Family structure and parental support. J Adolesc Health, 1997,20(4):271-278.

［12］MIKOLAJCZYK RT, BREDEHORST M, KHELAIFAT N, et al. Correlates of depressive symptoms among Latino and Non-Latino White adolescents: Findings from the 2003 California Health Interview Survey. BMC Public Health, 2007,147(7):21.

［13］CROCKETT LJ, RANDALL BA, SHEN YL, et al. Measurement equivalence of the center for epidemiological studies depression scale for Latino and Anglo adolescents: A national study. J Consult Clin Psychol, 2005,73(1):47-58.

［14］LA GRECA AM, HARRISON HM. Adolescent peer relations, friendships, and romantic relationships: Do they predict social anxiety and depression? J Clin Child Adolesc Psychol, 2005,34(1):49-61.

［15］许韶君，陶芳标，张洪波，等.大学生抑郁、焦虑症状及其影响因素的分析.安徽预防医学杂志，1999，5 (2)：121-122.

［16］张洪波，陶芳标，曾广玉，等.安徽省中学生焦虑心理症状流行特征研究.中国校医，2001，15(1)：10-11.

［17］丁树荣，王天奎，王本华，等.中学生焦虑状况及影响因素研究.中国公共卫生，1996，12(9)：419-420.

［18］BENNETT DS, AMBROSINI PJ, KUDES D, et al. Gender differences in adolescent depression: Do symptoms differ for boys and girls? J Affect Disord, 2005,89(1-3):35-44.

［19］MASI G, FAVILLA L, MUCCI M, et al. Depressive symptoms in children and adolescents with dysthymic disorder. Psychopathology, 2001,34(1):29-35.

［20］KOVACS M. Gender and the course of major depressive disorder through adolescence in clinically referred youngsters. J Am Acad Child Adolesc Psychiatry, 2001,40(9):1 079-1 085.

［21］STICE E, PRESNELL K, BEARMAN SK. Relation of early menarche to depression, eating disorders, substance abuse, and comorbid psychopathology among adolescent girls. Dev Psychol, 2001,37(5):608-619.

篇4

关键词：生物统计学;SPSS;考核方式;改革

中图分类号：G642.0 文献标志码：A 文章编号：1674-9324（2015）18-0247-02

生物统计学是数理统计方法在生物科学领域的应用，它主要是研究数据资料的收集、整理、分析和解释的科学[1]。生物统计学是我院动物科学、动物医学、动物药学、动植物检疫、水产饲草等专业的专业基础课，由于该课程理论抽象、公式繁多、内容枯燥，是学生们普遍认为难学的一门课程[2]。实验教学是培养学生理论联系实际，提高创新意识和实践能力的重要环节。在生物统计学的教学工作中充分认识并落实实验教学的地位，对于培养学生运用数理统计方法解决生物学领域问题的能力、增强创新意识、提高人才培养质量有着重要的作用[3]。可见实验教学在生物统计学中占有重要地位，因此我们应该注重实验教学环节并对其适时改革。

一、SPSS在生物统计学上机实验中的应用

目前，在生物统计学上机实验课中，可选用的软件有Excel、SPSS、SAS、Oringin和R软件等[4-7]。其中SPSS为专业统计软件，其统计分析功能较强，是复杂、大型统计分析中的常用工具[8]。SPSS即社会科学统计软件包是世界著名的统计分析软件之一，“易学、易用、易普及”是SPSS软件最大的竞争优势，也是广大数据分析人员对其偏爱有加的主要原因。SPSS主要具有以下优点：大量成熟的统计分析方法、完善的数据定义操作管理、开放的数据接口、灵活的统计表格和统计图形。因此我们在实验教学中首选SPSS软件作为上机用统计软件。由于SPSS软件版本多，而且多为英文版，对于初学者来说中文版本更为适合，因此我们专门购买了SPSS17中文多国语言版本。

SPSS软件运行时有多个窗口，各窗口有各自的作用，但是想快速入门，只需要熟悉两个基本窗口即可，他们是数据编辑窗口（SPSS Data Editor）和结果输出窗口（SPSS Viewer）。数据编辑窗口是SPSS的主要程序窗口（见图1），其功能主要是定义SPSS数据的结构、录入数据和管理数据。数据的录入一般分两种方法：（1）在数据编辑窗口里，新建数据，首先打开数据编辑窗口的左下方“变量视图”，在里面定义需要录入数据的变量名称以及其他选项，如图1中的“品种”、“血糖值”就是变量名，然后回到数据视图，可以在定义好的变量下录入相应的数据。（2）在数据编辑窗口里，可以直接打开已经存在的数据，如“.cav、.xls、.dbf、.txt”等形式的数据资料。SPSS结果输出窗口是SPSS的另一个主要窗口（见图2），它的主要功能是显示管理SPSS统计分析结果、报表及图形。SPSS结果输出窗口中显示的结果等信息可以保存起来，以后需要时候可以再打开查看结果。

二、数显互动系统在生物统计学上机实验中的应用

生物统计学的上机操作实验环节可以提高学生的动手能力，还可以提高其解决实际问题的能力。但是对于从未接触过SPSS统计软件的初学者来说，只是口述SPSS统计软件的各种操作是不够的，学生不容易接受，而且会手忙脚乱。因此我们使用的是Motic第二代数码显微互动系统，该系统由教师主控单元、学生终端单元和链接教师和学生间的网络系统三部分组成。该系统的优点在于可进行图像的实时数字传输，实现师生双向信息互动和文件传送[8]。

生物统计学的整个上机实验过程主要包括以下几个环节：（1）老师演示：学生上机操作前老师要以例题的形式进行讲解和操作，教师通过数码互动系统在主控单元计算机屏幕进行数据分析操作，每名学生坐在自己的电脑前就可以从电脑上看到教师分析数据时的每一个操作动作，这样可以使得学生很快就掌握了该次上机的详细操作步骤。（2）学生操作：学生针对本次实验内容自己上机运用SPSS软件进行相应的统计分析，在这个环节里如果学生遇到不会操作的地方，可以举手向老师请教，在老师的指导下能够顺利完成实验内容。（3）写电子版实验报告：只用SPSS分析完数据还不够，还要会分析最终结论（即统计推断）。因此学生要把实验的主要结果（图、表等）和最终结论填写到实验报告中。最终以Word的形式通过Email发送给老师。

三、生物统计学上机考核方式的改革

考核方式的改革是生物统计学实验教学改革的重要组成部分。合理的考核评价体系，对于客观、全面评价学生的学业水平和引导学生的学习方向上发挥着重要作用，能够达到调动学生积极性，提高学生学习效率的目的[3]。以往的上机考核多以上机实践总结和考勤作为评分标准，学生在写上机实践总结时往往存在抄袭，而且文笔好的学生写的总结内容丰富全面，可能得了高分，这样对于学生的动手能力和水平难以准确地给予评价。因为我们针对上机考核方式进行了一些改革。在上机考核中增加了电子实验报告和上机考试这两部分。电子实验报告是每次实验课上当堂完成实验操作结果那部分，既可以作为检验学生对每节实验课是否掌握的依据，还可以提高学生的电脑运动能力（Word）。上机考试主要是针对整个上机实验内容进行抽样考试，我们事先出各种类型的试卷，针对不同的班级随机抽取一个类型的试卷进行上机考试，因为班级多，而计算机机房的电脑有限，只能采用各个班级轮流上机考试。为了杜绝了不同班级考题一样及考题外漏等问题，我们分别出了A、B、C等多种类型试卷。最终，上机总分=考勤（10%）+电子实验报告（20%）+上机考试（70%）。

四、结语

通过以上SPSS软件的应用、数显互动系统的应用以及多元化评定上机考核等方面的改革与实践，使得学生对生物统计学的学习、理解、操作等情况能够及时反馈给老师，老师可以根据情况不断完善实验教学方法和手段，从而提高实验教学效果，同时增强了学生的动手能力和解决实际问题能力。学以致用是生物统计学最重要的特点之一，因此不仅要求学习者掌握知识，更要学会应用知识[9]。尤其是在做本科生或研究生毕业论文的时候，学生应该能够独立完成合理试验的设计，运用SPSS统计软件，针对不同数据进行分析，完成高质量的毕业论文。

参考文献：

[1]张勤.生物统计学[M].第2版.中国农业大学出版社，2008.

[2]白俊艳，贾小平，张小辉，等.生物统计学课程改革与实践[J].畜牧与饲料科学，2013，34（10）：57-60.

[3]张强，张建平.生物统计学实验教学的探索与实践[J].实验室科学，2012，15（6）：15-18.

[4]梅花，白乙尔图.SPSS统计软件在《生物统计学》教学中的实例应用[J].中国畜牧兽医文摘，20l2，（7）：217.

[5]朱水平.生物统计学实验教程[M].云南科技出版社，2006.

[6]姜红霞.origin软件在生物统计学教学中的应用[J].陕西教育：高教版，2009，（3）：82-83.

[7]马相如.自由软件R及其在生物统计学教学中的使用[J].科技传播，2010，（3）：81-82.

篇5

关键词：职业紧张；工作要求-自主模式；个体特征；职业类型

An Preliminary Assessment of Job Strain of People in Different Types of Profession in Luwan District WU Jian-hua1，DAI Jun-ming2，YU Hui-zhu3，XU Hui-hua1，LIU Huai-yu1，SHEN Wen-rong1，SHENG Da-ying1，FU Hua2（1.Luwan District Center for Disease Control and Prevention，Shanghai 200025，China；2.School of Public Health，Fudan University，Shanghai 200032，China；3.Shanghai Municipal Center for Disease Control and Prevention，Shanghai 200336，China）

Abstract：［Objective］ To assess job strain of people in different types of job in Luwan District. ［Methods］ Using a working requirement & self-determination questionnaire，targeting at 617 persons from teachers，science researchers，government officials and administrators of building-keeping，to assess the level of their psychosocial job strain. Then use analysis of variance to assess each factor's contribution，and use chi-square test and logistic regression to compare factors which have influence on people's job strain. ［Results］ Taking“demand”，“control”，“skill”，and“social support”as the factors determining people's strain，their scores are statistical significantly different among age goups，educational background，and jobs，but not significant between sex groups.It shows that 50.2% of the studied group of people are in higher job strain，and it counts as 36.5% for science researchers and government officials，56.3% for teachers，and 50.4% for administrators of building-keeping. Multi-way analysis of variance shows that OR for teachers and administrators of building-keeping are 2.69（1.618-4.454）and 2.30（1.156-4.566）respectively. There's significant difference between different jobs，but not significant between ages，gender and educational background. ［Conclusion］ Researcher population are in higher job strain than others，in which teachers and administrators of building-keeping need much care.

Key Words：job strain；Working requirement & self-determination；questionnaire；types of profession

近年来随着社会变革与经济的快速发展，人们在工作中所感受到的压力在迅速增加。由于长期工作压力所致职业紧张问题正逐步引起全社会的广泛关注［1］。1994年联合国报告［2］指出：“世界正在变成充满紧张的世界”。卢湾区为中心城区之一，职工的职业类型已经发生了显著变化，原有影响职工健康的生产性有毒有害因素已明显减少，而因工作压力所致职业紧张等社会心理因素正在转化为主要的职业性有害因素。

对职业紧张程度评估中，KARASEK［3，4］提出的工作要求自控（或支配）模式（Job Demand-Control Model，JDC模式）是最有影响的理论之一。JDC模式从个体角度评估职业紧张，认为工作要求高，而工作自控（支配）力低即为引起职业紧张的重要原因，工作的自控（支配）水平高可缓解工作要求的健康负效应。并专门设计了评估职业紧张程度的工作内容问卷调查表（Job Content Questionnaire，JCQ）。THEORELL［5］又对JDC模式进行补充，提出社会支持是职业紧张的修正因素。以工作要求-自控（支配）模式理论为指导的研究，国内开展较少。为了评估卢湾区3种职业类型在职职工的职业紧张程度与健康的关系，即开展该项调查。本文报道其初步调查分析结果。

1 对象与方法

1.1 对象

选择以中学教师、科研与行政管理人员及物业服务员工构成的调查样本为研究对象，并且均知情自愿。该调查表设计了简明导言，由对象自主填写。共发出问卷786份，收回有效问卷617份（应答条目数超过80%者），应答率78.5％。平均年龄37.2岁，标准差为11.67。其中，30岁以下者189人，占30.6%；30至45岁203人，占32.9%；45岁以上的177人，占28.9%；未填年龄的48人，占7.8%。性别分布：男性213人，占34.5%；女性367人，占59.5%；未填性别者37人，占6%。学历分布：初中及以下者60人，占9.7%；高中及中专129人，占20.9%；大专124人，占20.1%；大学本科及以上者281人，占45.5%；未填者23人，占3.7%。

1.2 问卷设计

职业紧张评估调查，以KARASEK’s［3，4］工作内容问卷（JCQ）为基础，参照THEORELL［5］设计的简明工作紧张问卷，结合我国职业人群特点与资深职业卫生专家建议，形成24个条目的简明JDC问卷，其中评估工作要求（Demand）由“我对工作要求非常认真”等6个条目组成。自控（支配）程度（Control）包括自我控制力与工作技能二个子项。自我控制力，包括“我有决定我的工作应该如何做的自由”等4个条目；工作技能（Skill）由“我的工作要求我学习新的知识与技术”等6个条目组成。社会支持（Social Support）包括“我的主管重视我的意见”等8个条目。内部一致性评估Cronbach’sα值为0.80。所有条目答案均采用李氏5级赋值法设定。问卷同时收集相关的个体特征年龄、性别、受教育程度、职业与工作描述等信息。

1.3 统计分析方法

将JDC问卷所有条目均完成（缺一不可）者纳入分析，以保证结果的真实性。对JDC模式各评估因子均分，运用单因素方差分析法进行不同年龄组、性别、受教育程度、职业间的比较。运用四格表与行×列表的χ2检验与非条件Logistic回归分析职业紧张程度的影响因素。所有资料均使用EPI软件建立数据库，进行资料的录入；运用SPSS 11.5软件包完成分析，α=0.05。

2 结果

2.1 不同个体特征间JDC模式评定各因子均分比较

不同年龄组间、受教育程度与职业间，JDC模式中各评估因子均分方差分析比较，差异均有统计学意义。工作要求以低年龄组高学历的教师为高，自主程度得分以年龄30～45岁组、大学本科以上学历、工作要求决定自主技能得分均显著低于其它两个年龄组，而社会支持高于30岁以下年龄组。不同性别间JDC模式中各评估因子均分差异均无统计学意义（见表1）。

2.2 不同个体特征间职业紧张程度分级比较

依据KARASEK的JDC模式理论，根据工作要求均分与自主性均分的比值对职业紧张程度进行分级，工作自主性得分为工作决定自主与工作技能均分的均值，如果比值大于1则职业紧张程度高，反之为低。结果显示：不同年龄组、性别、受教育程度间均未显现统计学意义。而不同职业间统计学差异显著，科研与管理人员职业紧张程度高的比例为36.5%，教师为56.3%，而物业管理员工为50.4%；所有调查对象的职业紧张程度高者为50.2%。

2.3 个体特征对职业紧张程度影响的非条件Logistic回归分析

为控制多因素间的相互影响，引入多因素非条件Logistic回归分析。以职业紧张程度为应变量，紧张程度高为1，低为0；而个体特征变量为自变量。对多分类变量，引入哑变量进行分析。结果显示：不同年龄组、性别与受教育程度间对应变量的贡献无统计学意义。而3种不同职业间差异明显。以科研与行政管理人员为对照，教师组与物业员工组OR值分别为2.69（1.618～4.454）与2.30（1.156～4.566），均有统计学意义。

3 讨论

引用KARASEK设计工作内容调查表来评估职工的职业紧张程度，虽然国际上自20世纪70年代问世以来，得到广泛使用，但国内运用的报道少见，这可能与其为专利问卷而影响到其推广使用。而工作内容调查表是基于JDC模式理论而设计，其对职业紧张程度的评定比较简便。同时由于工作要求-自控（或支配）模式理论在探讨职业紧张程度与健康的关系中，国外进行了大量研究，尤其是在职业紧张程度与心脑血管疾病的关系方面［6］，它也是目前在“职业紧张与健康”研究领域中被广泛使用的评估工具。

研究人群选择科研与行政管理人员、中学教师与物业服务员工3种不同职业人群，是基于其劳动类型考虑的，科研与行政管理人员以脑力劳动为主，物业管理员工以体力劳动为主，而中学教师是介于两者之间，其工作中既包括脑力劳动又包括体力劳动。

职业紧张JDC模式各因子得分在不同年龄组、受教育程度与职业类型间比较均显现统计学意义，而男女不同性别间这些因子得分均未显现统计学意义。可以认为年龄、受教育程度、职业类型间职业紧张因子得分差异明显，而不同性别职业紧张因子的得分是一致的。

JDC模式理论是根据“工作要求与自控（支配）力”均分比值来分级，比值≥1评定为职业紧张程度高，分析结果显示不同年龄组间、不同性别间、受教育程度间差异均无统计学意义，而3种不同职业间比较差异有统计学意义。无论是单因素分析还是多因素分析均得到一致结果。说明3种不同职业间其职业紧张程度变化较大。中学教师与物业员工群体的职业紧张程度高的比例明显高于科研与行政管理人员。科研与行政管理人员在本研究中评定其职业紧张度低，可能与公众认识不一致，这与JDC模式的理论假设有关。因为其职业活动中工作自主程度较高。根据JDC模式理论，工作自主性高同时工作要求也高的职业被定为主动性职业，职业紧张程度不评定为高［7］。

从研究人群整体来看，3种职业人群的职业紧张程度高的比例达到50.2%，需要得到职业卫生专业人员及整个社会关注。

参考文献：

钱令嘉.加强我国职业应激研究［J］.中华劳动卫生与职业病杂志，2003，21（1）：1-2.

CARL Z. Occupational Medicine［M］. 3rd ed. St. Louis：Year Book Inc，1994：945.

KARASEK R A. Job demands，job decision latitude，and mental strain：implications for job redesign［J］. Admin Sci Q，1979，24：285-308.

KARASEK R A，THEORELL T. Health work：Stress，Productivity，and the Reconstruction of Working Life［M］. New York：Basic Book，1990.

THEORELL T，KARASEK R A. Current issues relating to psychosocial job strain and cardiovascular disease research［J］. J Occup Health Psychol，1996，1：9-26.

BACQUER D，PELFRENE E，CLAYS E，et al. Perceived job stress and incidence of coronary events：3-year follow-up of the Belgian Job Stress Project cohort［J］. Am J Epidemiol，2005，161（5）：434-441.

戴俊明，傅华.职业紧张评估方法研究进展［J］.环境与职业医学，2006，23（3）：278-281.

篇6

车间有 3 台80 000 m3/ h 的组合式空调器进行工位送风，并安装了 28 台屋顶排风机，总风量为273 420 m3/ h，车间每小时换气次数为 2. 7 次，车间内为微负压。有缸体、缸盖、曲轴、凸轮轴等 4 条生产线，共有铣、钻、镗、削、磨等机械加工生产设备 130 余台套，有作业人员约 200 人。生产工艺以机加工为主，部分零件需进行淬火、回火等热处理。该车间承担铁质和钢质发动机缸体、缸盖、曲轴及凸轮轴四大件机械加工任务，年产量为 3 万辆份，生产中使用大量的金属加工液，每年消耗量 60 余吨，现场检测情况正常生产状态下，对机械加工车间各工作岗位及车间休息场所分别进行了连续3 d 的矿物金属加工液浓度检测，共检测 23 点，车间空气中的金属加工液浓度 0. 10 ～ 2. 62 mg/m3，。除车间休息处 2 点全部达标外，工作岗位 21 点，达标 3 点，达标率仅为 14. 3%。其中缸体线和缸盖线机加工全部超标，曲轴线和凸轮轴线机加工达标率分别为 20. 0% 和66. 7% 。检测结果分析金属加工液达标率的影响因素本次研究考虑了 4 种可能影响金属加工液达标率的因素。其中设备密闭情况分为良好和不良两类，前者指具有封闭罩，且正常生产时只在上下料过程中开启门窗的设备。通风情况则根据现场调查，将有局部通风设备且气流组织合理的场所归为通风良好，否则归为通风不良。设备密闭情况、通风情况、生产线的差异都对工作场所金属加工液达标率具有影响，并具有统计学意义 ( P ＜0. 05) ，但设备类型对达标率的影响无统计学意义。金属加工液浓度影响因素的多元回归分析以金属加工液浓度为因变量，候选自变量有: 密闭情况 ( 0: 不良，1:良好) 、通风情况 ( 0: 不良，1: 良好) 、生产线、设备类型。因生产线和设备类型为无序多分类变量，采用哑变量的方法进行赋值。变量筛选方法为 stepwise，变量入选标准为 P ＜0. 05，剔除标准为 P ＞ 0. 10。经回归分析，4 个候选变量中进入回归模型的仅有 2 个，分别是密闭情况、通风情况，。回归模型的决定系数( R2) 为 0. 501。经方差分析检验，模型具有统计学意义 ( F= 10. 049，P ＜ 0. 001) 。入选的两个因素 ( 密闭情况和通风情况) 其回归系数均小于 0，表明密闭情况和通风情况的改善，有利于降低工作场所金属加工液浓度。

在金属加工作业中，特别是在相对封闭的空间，工作场所空气中会存在一定浓度的金属加工液。金属加工液由于产生的方式不同，其颗粒直径范围也有较大区别。一般情况下，机械雾化过程产生的金属加工液主要以液滴形态存在，液滴直径范围较宽，通常为 2 ～10 μm。蒸发产生的蒸汽在冷凝过程中也会形成直径非常细小的冷凝悬浮体，粒径通常为 2 μm以下，如在磨床 ( 转速可达上万转，冷却液雾化剧烈) 等设备周围，95%的液滴粒径＜3 μm。此次现场调查结果显示，该机加车间在机加过程中有大量金属加工液散发于车间空气中。其中加工设备不密闭，无净化装置，无有效的局部机械排风设施等原因对部分岗位金属加工液浓度结果产生较大影响。如金属加工液浓度较高的岗位缸体精加工卧式加工中心岗位加工时喷射大流量加工液，产生大量金属加工液雾滴，由于设备未封闭，上部又接近送风口，在送风压力下，金属加工液向四周扩散; 又如曲轴线淬火岗位，排气管道较小，排风能力有限，又未加装排风罩，为防止油烟影响操作岗位，在设备内部加装普通电风扇向后吹风，导致金属加工液扩散至整个车间。此外，生产过程中金属加工液跑、冒、滴、漏现象普遍，机加设备上下料时，缸体、缸盖在加工转运过程中均有不同程度的金属加工液滴漏，滴漏的加工液未能进行及时回收处理，逐渐挥发到空气中。

本次研究针对金属加工液浓度的影响因素进行了统计分析，卡方检验与多元回归分析结果不尽一致。前者结果表明，生产线对金属加工液达标率具有影响，但在多元回归分析中，该因素未进入回归方程。其原因可能是，该指标与其他具有重要影响的指标 ( 设备密闭情况和通风情况) 存在联系，因而在单因素分析时，造成了该指标有统计意义的假象。在多元回归中，由于采用了逐步回归的方法，有效遏制了有较强相关关系的自变量同时进入方程，消除了混杂因素，因而更好地反映了各因素之间的关系［7］。根据以上分析结果，我们建议该发动机厂机械加工车间应在推进自动化机械加工的同时，采取密闭机加设备，加装局部通风设施，合理设置送、排风口，安装金属加工液捕集器或金属加工液回收装置等综合性措施［8 ～11］，降低车间金属加工液浓度至标准限值以内，以保证作业人员减少接触职业病危害因素。

作者：赵同强吴家兵祁成吴琨卢锐凌瑞杰单位：十堰市职业病防治院华中科技大学公共卫生学院

篇7

【关键词】统计数据；分析方法；市场调研；判别分析

一、数据统计分析的内涵

数据分析是指运用一定的分析方法对数据进行处理，从而获得解决管理决策或营销研究问题所需信息的过程。所谓的数据统计分析就是运用统计学的方法对数据进行处理。在实际的市场调研工作中，数据统计分析能使我们挖掘出数据中隐藏的信息，并以恰当的形式表现出来，并最终指导决策的制定。

二、数据统计分析的原则

（1）科学性。科学方法的显著特征是数据的收集、分析和解释的客观性，数据统计分析作为市场调研的重要组成部分也要具有同其他科学方法一样的客观标准。（2）系统性。市场调研是一个周密策划、精心组织、科学实施，并由一系列工作环节、步骤、活动和成果组成的过程，而不是单个资料的记录、整理或分析活动。（3）针对性。就不同的数据统计分析方法而言，无论是基础的分析方法还是高级的分析方法，都会有它的适用领域和局限性。（4）趋势性。市场所处的环境是在不断的变化过程中的，我们要以一种发展的眼光看待问题。（5）实用性。市场调研说到底是为企业决策服务的，而数据统计分析也同样服务于此，在保证其专业性和科学性的同时也不能忽略其现实意义。

三、推论性统计分析方法

（1）方差分析。方差分析是检验多个总体均值是否相等的一种统计方法，它可以看作是t检验的一种扩展。它所研究的是分类型自变量对数值型因变量的影响，比如它们之间有没有关联性、关联性的程度等，所采用的方法就是通过检验各个总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。（2）回归分析。在数据统计分析中，存在着大量的一种变量随着另一种变量的变化而变化的情况，这种对应的因果变化往往无法用精确的数学公式来描述，只有通过大量观察数据的统计工作才能找到他们之间的关系和规律，解决这一问题的常用方法是回归分析。回归分析是从定量的角度对观察数据进行分析、计算和归纳。

四、多元统计分析方法

（1）相关分析。相关分析是描述两组变量间的相关程度和方向的一种常用的统计方法。值得注意的是，事物之间有相关关系，不一定是因果关系，也可能仅仅是伴随关系；但如果事物之间有因果关系，则两者必然存在相关关系。（2）主成分分析。在大部分数据统计分析中，变量之间是有一定的相关性的，人们自然希望找到较少的几个彼此不相关的综合指标尽可能多地反映原来众多变量的信息。所谓的主成分分析就是利用降维的思想，把多指标转化为几个综合指标的多元统计分析方法，很显然在一个低维空间识别系统要比在一个高维空间容易的多。（3）因子分析。因子分析的目的是使数据简单化，它是将具有错综复杂关系的变量综合为数量较少的几个因子，以再现原始变量与因子之间的相互关系，同时根据不同因子，对变量进行分类。这些因子是不可观测的潜在变量，而原先的变量是可观测的显在变量。（4）聚类分析。在市场调研中，市场细分是最常见的营销术语之一，它按照一定的标准将市场分割为不同的族群，并使族群之间具有某种特征的显著差异，而族群内部在这种特征上具有相似性。聚类分析就是实现分类的一种多元统计分析方法，它根据聚类变量将样本分成相对同质的族群。聚类分析的主要优点是，对所研究的对象进行了全面的综合分析，归类比较客观，有利于分类指导。（5）判别分析。判别分析是判别样品所属类型的一种多元统计方法。若在已知的分类下，遇到新的样本，则可利用此法选定一种判别标准，以判定将该新样品放置于哪个类中。由定义我们可以知道判别分析区别于聚类分析的地方，而在判别分析中，至少要有一个已经明确知道类别的“训练样本”，从而利用这个数据建立判别准则，并通过预测变量来为未知类别的观测值进行判别。与聚类分析相同的地方是，判别分析也是利用距离的远近来把对象归类的。

参考文献

[1]温美琴．统计分析方法在我国政府绩效审计中的应用[J]．统计与决策．2006（23）

篇8

【关键词】泌尿系结石危险因素；病例对照研究；多因素分析

【文章编号】1004-7484（2014）06-3537-02

A study on risk factors of patients with urolithiasis in northern Guangzhou

XI Ming，Cheng Lu ，Wan Yueping，Hua Wei，Yang Guilian

（Department of Urology， Huadu Poeple’s Hospital Affiliated to Southern Medical University， Guangzhou 510800，China）

【Abstract】Objective：To explore the main risk factors of urinary calculi in northern Guangzhou， and provide scientific basis for prevention and treatment of patients with urinary calculi. Method：We selected 130 cases of hospitalized patients with stones as the case group， 140 cases of non gallstone patients as control group. Using non conditional logistic regression analysis of 42 research variables. Result：Non conditional Logistic regression analysis showed that 16 factors were statistically significant single factor analysis， finally selected 7 related factors by multivariate logistic regression， these factors are whether love spicy salty food， mental tension， often take part in exercise， drinking water， drinking water， family day type edible oil type. Conclusion：Urolithiasis is mainly affected by the dietary habits and nutritional factors， personal factors can not be ignored.

【KEYWORDS】Risk factors of urinary system； calculus Logistic Case-controlstudy； multivariate conditional Logistic stepwise regression

泌尿系结石是指在泌尿系统内形成的数目、大小、成分和形状不等的固态物质，是泌尿系统常见病之一。我国年发生率为101例/10万人，近年来发生率呈上升趋势[1]。我国是一个多民族国家，不同民族泌尿系结石的发病率不同。我国泌尿系结石发病率民族差异大，广州花都区是泌尿系结石的高发区，本研究通过对泌尿系结石患者危险因素的研究，来为广州北部地区该区开展泌尿系结石人群预防提供理论依据，同时也为我国的泌尿系结石人群预防提供借鉴。

1对象与方法

1.1 研究对象病例组：选取广州市花都区人民医院2006年3月～2013年130例住院结石患者。泌尿系结石诊断标准：全部病例均经肾脏 B 超或/和 X 线确诊为泌尿系结石。纳入标准确诊的泌尿系结石患者，并且广州北部居住年限大于 10年。排除标准为伴有严重肾功能不全，尿路畸形、梗阻、感染和甲状旁腺功能亢进疾病。对照组：工作及生活区域与病例组相匹配的同期在该院泌尿外科住院非结石患者为对照组。140例。遵循知情同意，志愿参加原则。

1.2 调查方法采用统一的调查表，以纸质调查表的方式，由由相同测评人员对病例组和对照组成员进行问卷调查。调查的内容为1、基本情况：性别、年龄、职业、文化程度、身高、体重。2、生活习性：吸烟，体育锻炼，精神紧张度等3、饮食习惯：饮水量，饮水类型、喜食海鲜、喜饮酒、喜食动物内脏、喜欢甜食等情况。

1.3 研究方法根据收集数据，对其中可能的危险单因素非条件 logistic 回归分析，以及多因素 logistic 回归分析。

1.4 统计学方法采用SPSS 15.0软件进行数据处理， x2检验、单因素非条件logistic回归分析，多因素logistic逐步回归分析。

2结果

2.1 两组基本情况 130例病例组中，男性82名，占53.16%，女性48名，占46.84%，平均年龄40.55士11.78岁；140例对照中，男性和女性分别88名和52名，各占56.73%和43.27%，平均年龄42.01士13.12岁。病例组与对照组的性别年龄构成无统计学差异（P>0.05）。

2.2 泌尿系结石危险因素单因素非条件Logistic回归情况：对年龄、婚姻状况、饮用水量以及饮水质量等42个尿石症的可疑危险因素进行变量赋值，且分别行单因素非条件logistic回归分析，结果发现平均饮水量、饮水类型及质量、平时食用油类型、口味偏重偏淡、文化程度、是否经常参加健身运动、是否喜食蔬菜、水果是否喜食动物蛋白、精神紧张度程度、是否有家族史、有无睡前饮水的习惯、是否喜好饮酒、是否喜好熏、淹制食品、是否吸烟等都有统计学意义。其中平均饮水量大、长期饮用纯净水、平时食用植物油、口味偏淡、文化程度高、经常参加健身运动、喜食蔬菜水果、少食动物蛋白8个因素为保护因子。而精神紧张度高、有家族史、家庭食用油以动物类油脂为主、饮食口味重、无睡前饮水的习惯、饮高度酒、喜食熏淹制食品、吸烟8个因素为危险因素。

2.3泌尿系结石危险因素多因素logistic逐步回归分析情况：对42个变量进行逐步logistic回归分析，42个变量中有11个变量进入模型。其中按对尿石症影响的大小危险因素分别是平时每天饮水量少、无睡前饮水的习惯、饮高度酒、饮水类型中的井水、精神紧张等。保护因子是长期饮用纯净水、每周饮酒次数少、偶尔饮用滋补煲汤、少食用含嘌呤多的食物、少食动物蛋白、平时食用植物油、口味偏淡等六个因素。

3讨论

泌尿系结石为我国泌尿外科高发疾病之一，南方诸省中，泌尿系结石患者几乎占泌尿外科住院患者的首位。一个地区的地理环境如气候、降水量、土壤、水质，可以数百年不变，但泌尿系结石发病状况却可在短短几十年内可有非常大变化，因此我们应该重视与之相关的该地区居民的生活、饮食习惯与泌尿系结石发病的关系。本研究结果表明精神紧张度高、有家族史、家庭食用油以动物类油脂为主、饮食口味重、无睡前饮水的习惯、饮高度酒、喜食熏淹制食品、吸烟均与尿石症发病有关。同时饮水类型、是否喜欢口味重的咸食、家庭食用油、食用熏或淹制食品、精神紧张度高、经常参加健身运动、每天的平均饮水量多均与尿石症发病关系密切。

社会心理因素与尿石症关系：本次调查发现精神紧张程度与尿石症有关。在单因素和多因素Logistic回归分析中，精神紧张程度高尿石症发病危险性分别是精神紧张程度低的人群的12.337和4.998倍。美国学者[5]所进行一项研究表明，精神压力大也能促使结石的生成，与本研究结果一致。

尿石症与饮食习惯的关系：近三十年来我国的饮食结构发生了非常大的变化，伴随的是谷物和蔬菜摄入量的迅速减少，而肉类和油脂类的摄入量却迅速增加，饮食虽不是一个独立的危险因素，但在结石病的发病机理中起了重要作用。本研究调查发现饮水量少是尿石症发病的危险因素，另外，经多因素Logistic分析表明，平时不喜欢饮水无条件满足饮水要求的人群发生尿石症的危险性明显大于喜欢饮水人群（OR=0.055）。说明加大日饮水量对预防泌尿系结石的发生具有重要意义，同时有文献亦表明[3]：人体尿液中晶体成分发生异常或者比例不均衡均是泌尿系结石形成的基本条件。同时本研究显示，喜欢口味重的咸食在单因素和多因素Logistic回归分析中，喜欢口味重的咸食泌尿系结石患者危险性分别是不喜欢口味重的咸食的人群的8.998和5.997倍。Cuthan等[6]研究中也发现高钠摄入组比低钠摄入组的相对危险度是1.30（95%CI 1.05～1.62）。本项研究中还发现以动物油作为主要食用油的病例组人数明显高于对照组（P

参考文献

[1] 叶章群.泌尿系结石[M].北京：人民出版社，2 00 3：38-53.

[2] Watts RW . Idiopathic urinary stone disease ： possible polygenic aetiological factors[J].QJM，2009，98（4）：24l-246.

[3] SerioA，FraioliA. Epidemiology of nephrolithiasis [J]. NePhron 2009，81（51）：26.

[4] Leonetti F，Dussol B，Berthezene P，etal. Dietary and uri2 nary risk factors for stones in idiopathic calcium stone formers compared with healthy subjects [J] . NePhrol Dial Trans 2 Plant，2011，13（3）：617.

篇9

回归分析（regressionanalysis）是统计学中一种常用的分析数据的方法，旨在研究一个变量Y与其他若干变量X之间的相关关系，实际应用较为广泛。根据涉及自变量的个数，可将其分为一元回归分析、多元回归分析；根据自变量与因变量之间的关系类型，可将其分为线性回归分析、非线性回归分析。当回归分析中仅包含一个自变量、一个因变量，且二者关系可用一条直线近似表示，该回归分析为一元线性回归分析。当回归分析中包含两个或两个以上的自变量，且因变量与自变量之间是线性关系，则称为多元线性回归分析。回归分析常用于观测数据，目的是获得因果结论。回归分析的结果是最佳拟合直线的数学方程，该方程的用途之一是预测［5－6］。曾宪昌等［7］较早运用通径分析原理对贵州省58头不同年龄、性别的沿河山羊的体尺和体质量关系作出较为系统深入的分析。借助通径图解简明地表达各变量之间的关系，并在区分各自变量在多元回归中的相对重要性后，剔除影响不大的自变量，在偏回归系数显著性检验合格的基础上，建立最优回归方程，直接用体长和胸围估计体质量和屠宰率对山羊产肉性能进行预测。陈永军等［8］运用SPSS14．0分析成年大足黑山羊体尺与体质量的相关关系、体尺对体质量的直接和间接作用以及决定程度，最后建立体质量与体尺的最优回归模型。结果表明：胸宽和管围是影响公羊体质量最主要的体尺指标，胸围是影响母羊体质量最主要的体尺指标。公羊最优回归模型为：Y＝19．630－0．940X6＋4．346X7，母羊最优回归模型为：Y＝－17．942＋0．661X4。（注：Y指体质量、X6指胸宽、X7指管围、X4指胸围）王高富等［9］采用SAS软件CORR对重庆黑山羊成年羊体尺、体质量指标与胴体净肉率进行相关分析，并以成年重庆黑山羊体高、体斜长、胸围、胸宽、胸深、成年体质量为自变量，胴体净肉率为应变量，采用REG过程BACKWARD（后退法）的多元回归分析方法，构建估测重庆黑山羊胴体净肉率的最优回归方程，结果表明：胸围、胸宽和胸深可以作为选择胴体净肉率的间接指标。韩学平［10］采用逐步回归的方法对随机抽测的青海省河南县40只欧拉型藏羊成年公羊和104只成年母羊的体质量和8个主要体尺指标进行回归分析，得到欧拉型藏羊成年公羊体质量和主要体尺指标的最优回归方程为Y＝0．88X2＋13．64X6－4．35X7＋1．28X4－114．51（P＜0．01）（R＝0．889）；成年母羊体尺与体质量的最优回归方程为Y＝0．49X1＋0．46X2＋0．30X3＋0．43X4－43．51（P＜0．01）（R＝0．649）。（注：Y指体质量、X2指体长、X6指管围、X7指尾宽、X4指胸深、X1指体高、X3指胸围）冯平等［11］采用相关分析、通径分析和回归分析的方法研究不同年龄段陕北白绒山羊体尺、体质量、绒长、毛长和产绒量的最优回归模型。结果表明：陕北白绒山羊在4岁时处于最佳生长阶段，产肉和产绒性能最好；产绒量和体尺、体质量、毛长、绒长的最优回归模型为Y＝0．559X10＋0．391X4－0．176X9＋0．196X7－0．169X8。（注：Y指产绒量、X10指绒长、X4指胸围、X9指毛长、X7指管围、X8指腰角宽）陈碧红等［12］运用SAS软件分析戴云山羊体尺与体质量间的相关、体尺对体质量的直接和间接影响以及体尺对体质量的决策程度，最后建立体质量与体尺的最优回归模型。结果表明：各体尺性状因素都在不同程度上影响戴云山羊的体质量。选育戴云山羊时应以胸部为主并兼顾体高，以取得较好的选育效果。

2主成分分析

主成分分析（principalcomponentanalysis）是由K．皮尔森对非随机变量引入的，用于分析数据及建立数理模型，尔后H．霍特林将此法推广应用于随机变量中。主成分分析又称主分量分析，是将多个变量通过线性变换以选出较少个重要变量的一种多元统计分析方法。在实际课题的研究中，为了全面系统地分析问题，常会涉及众多与此有关的变量，每个变量在不同程度上反映该课题的部分信息。信息的大小通常用离差平方和或方差来衡量。主成分分析可设法将原来变量重新组合成一组新的互相无关的几个综合变量，同时根据实际需要从中取出几个较少的综合变量尽可能多地反映原来变量的信息，是数学上处理降维的一种方法。主成分分析是多元统计中的重要内容，是当前许多研究的主题，其原则是将多个相关指标简化为少数不相关指标，它能够在不损失过多遗传信息的基础上进行多性状的方向性选择，同时提高选择效果［13］。近年来，该方法已被广泛应用于牛、羊、猪等家畜性状的选育工作中。姜加华［14］于2004年对波尔山羊杂交二代（F2）羔羊各阶段体质量和体尺指标进行主成分分析，建立F2的生长模型，为制定新品种培育方案、饲养管理方案提供理论依据，为确定综合选育指标奠定基础。刘铮铸等［15］采用主成分分析法，分析波尔山羊与唐山奶山羊的级进杂交三代羔羊不同年龄阶段体高、体长、腿臀围、胸围和体质量等与生长相关的性状，综合为几个主成分，并由此确定衡量波唐三代羔羊生长发育性状的指标，探讨评估个体羊的生长发育状况。结果表明，在波唐三代羔羊l周龄时，体质量对主成分影响最大，随着年龄增长，在1月龄、2月龄和4月龄对主成分影响最大的是体长和腿臀围，在1月龄和2月龄，第二主成分主要反映羔羊的体高信息。白俊艳等［16］对成年大尾寒羊的体长、体高、体质量、胸围、尾长、尾宽进行测量，利用SPSS软件对以上6个体尺指标进行主成分分析。结果表明，第一主成分的贡献率较高为59．043％，其中高载荷的指标有体高、体长，这些体尺决定大尾寒羊体形的长短高矮，将其命名为高度因子。第二主成分的贡献率为16．919％，其中高载荷的指标有尾长、尾宽，其反映大尾寒羊尾巴形状的变化特征，将其命名为尾形因子。第三主成分的贡献率为11．081％，其中高载荷的指标有体质量、胸围，这些体尺与大尾寒羊体形结构均衡性密切相关，反映大尾寒羊躯体大小程度，将其命名为躯体因子。若取前3个主成分，其特征根值可使累积贡献率达到87．043％，即用这3个主成分可解释6个体尺指标总体信息，且信息损失部分较小，信息损失仅占12．957％。

3因子分析

因子分析（factoranalysis）是研究从变量群中提取共性因子的统计技术。因子分析的模型最早由J．Penrson和C．S．Pearman提出，首先应用于心理学研究。由于这种研究收到较好的效果，因而引起科学界的注意。数十年来许多统计学家以及其他科学工作者在因子分析的理论、方法和实际应用等方面做大量的工作，使因子分析不断得到充实并成为多元统计学的重要组成部分。与此同时因子分析的应用也逐渐推广到心理学以外的其他学科，如经济学、生物学、植物学、地质学、化学等［17－18］。因子分析与主成分分析都有清理多个原始变量内在结构关系的作用，但主成分分析重在综合原始变量的信息，而因子分析重在解释原始变量间的关系，是比主成分分析更深入的一种多元统计方法［19］。因子分析旨在从许多变量中找出隐藏的具有代表性的因子，并将相同本质的变量归入公因子，通过建立公因子与原变量之间的数量关系来预报公因子的状态，帮助发现隐藏在原变量之间的某种客观规律性。因子分析可减少变量数目，还可检验变量间关系的假设。在因子分析过程中，因子数的准确确定是极其重要的。由于分析数据（通常由试验测得）存在误差，这就给确定因子数带来很大困难。如何在掺和误差的试验数据中准确地找出影响原始分析数据的因子数，是因子分析研究中的一个特别重要也很困难的研究课题。多年来，不少致力于因子分析理论研究的工作者在这方面作了很大的努力。然而，迄今还没有现成的准确确定一套试验数据中有多少有意义的因子的严格的方法。不过，已有不少判据在确定因子数时是行之有效的，其中被应用得较多的有E．R．Malinowk等提出的判据（如RE、IND等），用交互校验和频串分布等方法确定因子数也是相当有效的，这一方面的研究尚有待进一步的深入［17］。叶昌辉等［20］应用主因子分析的方法对广东省96头雷州山羊成年母羊的8个主要体尺性状进行研究分析，结果显示，雷州山羊成年母羊的8个体尺性状之间的相关系数均为正值，为正相关，可区分为相对独立的3个主因子。其中，第一主因子的贡献率最大，为60．00％，其中腰角宽、胸宽、胸围和胸深的因子载荷值较高，考虑其生物学意义，称第一主因子为躯体因子。同时，山羊躯体大小与屠宰率相关联，故躯体因子是山羊产肉率的一个间接指标。此外，第二主因子的贡献率为16．59％，称为高度因子；第三主因子的贡献率仅为7．64％，称为肢体因子。第一主因子的方差解释量最大，是雷州山羊变异的主要来源，故在今后的选育工作中应给予足够重视，以主因子为单位进行选种，结合其他性状的选择，提高雷州山羊的选育效率。

4聚类分析

聚类分析（clusteranalysis）又称集群分析，它是研究“物以类聚”的一种数理统计方法。聚类分析可将一些观察对象依据某些特征加以归类，在生物学和医学分类问题中有着广泛的应用［21］。聚类分析的基本思想是：所研究的样品或指标之间存在着程度不同的相似性。于是根据一批样品的多个观测指标，具体找出一些能够度量样品或指标间相似程度的统计量，以这些统计量为划分类型的依据，将相似程度较大的样品聚为一类。聚类分析的目标就是在相似的基础上收集数据并分类，关系密切的对象聚为一个小的分类单位，关系疏远的对象聚为一个大的分类单位，最终把所有的样品或指标聚类完毕，即可形成一个由小到大的分类系统。聚类结果体现数据的分布特征，聚类方法多种多样，针对不同的问题应该采取不同的方法［22］。聚类分析有不同的分类［23－24］：按聚类变量可分为样品聚类（caseclusteranalysis，又称Q聚类），和指标聚类（variableclusteranalysis，又称R聚类）；按聚类方法可分为系统聚类（joiningclusterprocedures）和动态聚类（iteractivepartitioningprocedures）；按数据的欧几里得距离的远近进行分类分析，常用的有谱系聚类法（hierarchicalcluster）和分类聚类法（disjointcluster）。赵宗胜等［25］对3种不同类型杂交肉用羊的体尺指标进行聚类和主成分分析，将所分析的17项体尺指标分为三大类：特征类、围度类、高长度类。运用这两种方法，所得结果基本一致，但对于不同的杂交组合，结果有一定的差异。根据3种杂交组合的体尺与主成分分析结果，3种羊的第一、二主测指标略有不同，表明其对于不同类型杂交系各种指标的度量应有不同的侧重点。从而揭示出不同类型杂交肉羊体尺差异性的规律，为今后的肉羊品种选育、鉴定、评价提供新的思路和依据。侯洪梅［26］采用SPSS软件对62只7月龄青海加什科公羔体尺和体质量指标进行聚类分析，分为4类，并对各类羊只的各项指标计算类内均值和标准差，根据均值差异确定4类各项指标区间，得出更具操作性和实用性的加什科羊品种鉴定结果。

5判别分析

判别分析（discriminantanalysis）是在分类确定的条件下，根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。进行判别分析时通常根据已知样本的分类及所测的指标，筛选出能提供较多信息的指标，从而建立判别方程，使其错判率最小。其基本原理是按照一定的判别准则，建立一个或多个判别函数，用研究对象的大量资料确定判别函数中的待定系数，并计算判别指标。据此即可确定某一样本属于何类。判别分析的目的是建立一个判别函数式，建立判别函数式的法则主要有Fisher判别准则和Bayes判别准则。根据已知分类的数目、是否筛选变量和变量间是否有共线性，判别分析可分为二类判别、多类判别、逐步判别和典则判别分析［27－28］。敖学成等［29］经3个点抽样测定，用体尺、体质量性状指标对四川省美姑县58只成年母羊的遗传多样性进行聚类分析和判别分析，表明美姑县高繁山羊类群中存在大、中、小类型，具有选择高产肉用山羊的基础，得出从当前羊群综合性状结构的多样性特点开展有计划的选育十分必要。提出并分析母羊分类的三个判别函数式，其中体高、十字部高、体长、胸围、胸深、胸宽、体质量等性状类别间组内均值相等性检验均达到极显著和显著水平，可从表型值作出判定，因此可作为当前选育的参考依据。陈暖等［30］用SPSS软件对崇明白山羊、海门山羊、徐淮山羊、关中奶山羊的17个体尺指标进行典型判别和逐步判别分析，提供一种基于体尺指标的山羊不同品种和地理类型的量化分析方法。结果表明：该方法总体判别率可达到95．5％，当要求交叉验证正确率＞90％时，至少需要9个体尺指标；在品种间两两进行比较时，对判别贡献率最大的指标因品种不同而异。在该研究范围内，角型和胸宽是崇明白山羊区别于其他山羊的两个最具区分度的体尺指标。

6相关分析

相关分析（correlationanalysis）是研究变量之间密切程度的一种常用统计方法。两个变量之间的变化关系，既表现在变化方向上，又表现在密切程度上。相关分析旨在研究变量之间是否存在某种依存关系，且对存在依存关系的变量探讨其变化方向、密切程度。若两个变量变化方向一致则为正相关，若两个变量变化方向相反则为负相关。简单相关系数（由KarlPearson提出，有时也称作Pearson相关系数）用来度量变量间的线性相关关系的强弱程度。相关系数的符号（＋或－）代表着变量间相关关系的方向（正相关或负相关）［31－32］。狄江［33］对中国美利奴羊（新疆型）体大品系育种群的2岁母羊进行体尺与主要性状的相关及通径分析。结果表明，体大品系羊体长、胸围与体质量呈显著的正相关（P＜0．01）；体高、体长、胸围通过提高净毛率而间接增加净毛量；毛长对污毛量、净毛量无直接影响；净毛率与污毛量是极显著的负相关（P＜0．01）。刘金福等［34］在昌黎和卢龙两地测定89只唐山奶山羊成年母羊的体尺和体质量，并利用国际上通用的SAS统计分析软件对所测的各项资料进行统计分析，得出唐山奶山羊成年母羊体质量和体尺性状间的生长发育存在着较强的内在联系，在性状的选择方面可以利用这些较强的相关关系达到育种目的。贾存灵等［35］运用SAS软件分析萨福克×（无角陶赛特×小尾寒羊）三元杂交组合3月龄公羔体尺与体质量间的表型相关、体尺对体质量的直接和间接影响，并建立最优回归模型。萨福克×（无角陶赛特×小尾寒羊）三元杂交组合3月龄羔羊体尺各指标均与体质量有极显著的相关关系（P＜0．01），其中胸深和胸围是影响三元杂交公羔体质量的主要因素。在选择三元杂交公羔体质量的同时，应加强对胸深和胸围的选择力度。吴平等［36］采用MicrosoftExcel2007和SPSS16．0软件进行基本处理和相关分析，用全回归法（Enter）对体质量和体尺指标进行回归分析。研究主要针对关中奶山羊羔羊在3月龄内的体质量与体尺的生长发育情况而进行。研究表明，从初生到4月龄，羔羊生长发育迅速，尤其表现在初生后的前2个月左右，而此时也是母羊泌乳的最高峰期。通过对体质量与体尺之间相关性的研究得知，体质量与体长、胸围、体高之间都存在极显著的相关。在进行饲养培育时这3个指标都很重要，可作为此阶段选育的依据。

7综合分析

综合分析是指同时引用多种多元统计方法进行分析。较常见的是相关分析和回归分析的综合运用。扎西卓玛等［37］应用相关分析的方法，对83只柴达木绒山羊（互交羊）周岁母羊的胸围、抓绒前体质量、绒层厚度、粗毛量4个性状与产绒量性状的关系进行分析。结果表明这4项性状与产绒量均具有显著的相关性，用这4项性状估测产绒量的回归方程：Y＾＝114．7689－3．3302X1＋5．6125X2＋0．1935X3＋1．1142X4。经F检验得该回归方程具有一定的可靠性。（注：Y指产绒量、X1指胸围、X2指抓绒前体质量、X3指绒层厚度、X4指粗毛量）王欣荣等［38］采用多元逐步回归分析方法，对随机抽测的甘肃省甘南州草地型藏羊225只成年公羊和290只成年母羊的体质量和主要体尺指标进行相关性分析。结果表明：甘南草地型藏羊成年公羊体质量和主要体尺指标的最优回归方程为Y＝0．118X1＋0．652X3＋0．196X4（R＝0．901，0．01＜P＜0．05）；成年母羊体质量和主要体尺指标的最优回归方程为Y＝0．111X1＋0．186X2＋0．626X3（R＝0．849，P＜0．01）（注：Y指体质量、X1指体高、X3指胸围、X4指管围、X2指体长）。回归模型显示，胸围和体高是影响甘南草地型藏羊体质量的主要体尺指标，建议在今后的选育工作中加大对胸围和体高的选择力度，以提高藏羊的平均体质量。梁学武等运用SPSS13．0软件［39－40］，分别用Logistic、Bertalanffy和Gompertz模型对波尔山羊的体质量性状进行非线性拟合，并对体质量与体高、体长、胸围的相关性进行分析［41］。得出波尔山羊生长曲线采用Logistic模型拟合效果最佳，公母羊生长模型分别为：W＝51．59×（1＋6．15×e－1．82）－1（R2＝0．9815）和W＝52．56×（1＋7．15×e－2．08）－1（R2＝0．9834）（注：W指体质量）。公羊的生长拐点为14月龄，体质量25．80kg，成熟体质量为51．59kg；母羊的生长拐点为16月龄，体质量26．28kg，成熟体质量为52．56kg。在山羊的生长拐点前，加强饲养，可充分发挥其生长潜力，提高生产性能。波尔山羊体质量与胸围性状呈极显著正相关（P＜0．01），与体高性状呈显著正相关（P＜0．05），体质量与体高及胸围的二元回归方程为：Y＝0．279Btg＋0．893Bxw－19．28（注：Y指体质量、Btg指体高、Bxw指胸围）。生产实践中，可利用此回归方程估测体质量。

8小结

篇10

随着社会的快速发展以及现代校园文明的不断变化，加入学生组织已经成为现代大学生的必然选择。然而，各学生组织凝聚力具有显著差别。本文针对目前学生组织凝聚力的现状，就学生组织凝聚力的影响因素在三个层面，八个维度进行初步研究，以分析各个因素对学生组织凝聚力在人口统计学角度的影响程度。研究结果表明：学生组织凝聚力特征在性别、年级两个人口统计学变量上存在一定的显著性差异，而在学生干部经历人口统计学变量上并不存在显著性差异。

【关键词】

学生组织；凝聚力；影响因素

1 研究背景及目的

1.1 研究背景

随着社会的快速发展以及现代校园文明的不断变化，加入学生组织普及化。目前国内外对凝聚力的研究群体主要针对运动团体和军事团体，学校团体较少涉及。对于影响因素涉及了人际关系、凝聚力结构、组织情境、心理满足等内外部因素。而这些结论较多采用定性的研究方法获得，其科学性有待进一步提高。大学生对学生组织凝聚力的认知直接影响其增强组织凝聚力的行为，进而影响学生组织的整体精神面貌和学生组织的成长与发展。因此，本文选择学生组织凝聚力的影响因素进行研究，通过探讨大学生对于学生组织凝聚力的认知，进一步提出改进建议。

1.2 研究目的

在前面研究的基础上，进一步探讨不同类型学生组织凝聚力特征上的认知差异，以不同人口学统计学变量（包括性别，年级，是否担任学生干部，组织类型）为自变量，学生组织凝聚力为因变量，探讨基于大学生评价的组织凝聚力总体及各特征维度在人口统计学变量上的差异。具体分为以下八个维度：个人动机、领导者、组织管理、组织规模、组织文化、进入组织难度、外部竞争、学校支持。

1.3 数据收集

我们选取北京林业大学在校登记的7个学生组织作为研究对象，进行分类。纵向选择校际和院级组织，横向选择涉及大学生学习、工作、生活、娱乐组织的学生组织作为样本。采取整群抽样的方式进行调查。发放问卷300分，收回276份，回收率92%。其中有效问卷247分，有效率为总问卷数82.3% 。

2 文献回顾

对于影响凝聚力的因素，国外学者主要把它归结为三大方面：一是影响凝聚力的人际因素，二是影响凝聚力的结构因素，三是影响凝聚力的组织和情境因素。此外，Hogg（1992）在回顾文献后，总结凝聚力影响因素包括：个体特征及其一致性、互动、群体氛围、外部威胁、成功/奖励等。国内学者关于影响群体凝聚力因素研究结论较难统一。如王重鸣（2001）指出，影响群体凝聚力主要取决于群体的构成与规模、群体领导方式和外部竞争以及群体内聚力与生产率等方面。杨士魁（2003）指出，影响凝聚力的因素主要有群体目标的一致性、管理模式的科学性、群体地位的影响性、互相交流的经常性。李海（2009）分析得出影响组织凝聚力的因素包括个体、团体、组织和社会四个层次。可以看出，国内外学者对凝聚力影响因素的认识是一个由单一到全面，逐渐完善的过程。

3 问卷信度和效度

3.1 问卷信度分析

在李克特态度量表法中常用的信度检验方法为“Cronbach a”系数。如果一个量表的信度愈高，表示量表愈稳定。结果见下：

综合国内外学者的观点，可以发现，总量表的信度系数最好在 0.75 以上，问卷具有良好信度。因此本问卷具有较好的信度。

3.2 问卷效度分析

问卷的效度是指测验或量表的题具有适当性与代表性，即测验内容能反应所要测量的心理特质。本问卷的题项，来源于文献分析和访谈法，采用专家评判法对其内容效度进行有效鉴定。最后，在预测后还通过项目分析和因素分析，验证题项。因此，本问卷的效度是有保证的。

4 数据分析

4.1 基于大学生评价的学生组织凝聚力总体特征的描述

由表可知：

大学生对学生组织凝聚力在个人动机，领导着，组织管理，组织规模，进入组织难度，组织文化，学校支持得分均>3，外部竞争微

4.2 不同性别大学生对学生组织凝聚力特征的描述

（1）男生在个人动机，领导者，组织管理，组织规模，进入组织难度，和外部竞争六个维度，均值均大于女生，说明男生更加重视以上维度。而女生则对组织文化和学校支持更为看重。

（2）男生在以上八个因子的标准差均大于女生，说明男生的集中趋势弱，个体差异强，存在显著性差别。

4.3 不同年级大学生对学生组织凝聚力特征的描述

由表可知：

对比高年级学生，新生在个人动机，组织规模，进入组织难度程度，组织文化，外部竞争和学校支持六个因子均值较大，而对于领导者和组织管理均值较小。深究原因，发现，在经过大学一年级过后，学生对于组织规模，进入组织难度，外部竞争，和学校支持的重要性降低，而更为重视组织的管理和领导者。

4.4 是否担任干部大学生对学生组织凝聚力特征的描述

由表可知：

是否担任干部对于学生组织凝聚力的看法影响不大，不存在显著性差别。

5 研究结论

由上述分析可知，学生组织凝聚力特征在性别、年级两个人口统计学变量上存在一定的显著性差异，而在学生干部经历人口统计学变量上并不存在显著性差异。

（1）性别差异：本研究发现男生在班级凝聚力总体评价均分高于女生，且存在显著性差异。表明男生相对于女生更重视通过参与集体活动来增强班级凝聚力。唐颖（2008）在研究中认为影响心理健康的社会支持因素男生比女生更多存在团体参与、自尊实现、对前途的信心、朋友的数量等因素，这在一定程度上也说明了男生对集体参与有更重要的认知。

（2）年级差异：本研究发现不同年级大学生在班级凝聚力总体及各个子维度评价上存在显著性差异，这种差异主要体现在一年级大学生评价得分明显高于其它年级大学生。唐燕（2007）年在研究中提出随着年级的升高，参加活动的积极性逐渐减少。本研究认为，但是随着年级的升高，学业开始加重，学生的重心由参加活动转移到学业上。

（3）学生干部经历差异：本研究发现学生干部大学生在管理支持和团队业绩维度上的评价均分不显著性差异。与以往研究不同。可认为在现阶段，学生干部对学生组织凝聚力无显著影响。

【参考文献】

[1]LEWIN K A.Dynamic.1935. Theory of Personality [M]. NewYork： McGraw-Hill，118.

统计学变量类型范文

篇1

篇2

篇3

篇4

篇5

篇6

篇7

篇8

篇9

篇10

热门标签

相关文章

相关期刊

江苏统计

青海统计

山西统计

上海统计

精品范文