关于对诊断一致性Kappa系统的探讨

时间:2022-03-18 07:49:00

导语:关于对诊断一致性Kappa系统的探讨一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

关于对诊断一致性Kappa系统的探讨

【关键词】诊断试验;,,一致性检验;,,kappa系数,,,

摘要:对诊断一致性的简单Kappa系数、加权Kappa系数以及总Kappa系数进行了分析和说明,由于Kappa系数仅适用于行数和列数相等的方表,针对Kappa检验的这一局限性,给出了行数和列数不一致时使用SPSS软件实现Kappa检验的方法。

关键词:诊断试验;一致性检验;Kappa系数

在诊断试验中,研究者希望考察不同的诊断方法在诊断结果上是否具有一致性。诊断试验的一致性检验经常用于下列两种情况[1]:一种是评价新的诊断试验方法与金标准的一致性;另一种是评价两种诊断试验方法对同一个样本(化验对象)的化验结果的一致性、两个医务工作者对同一组病人的诊断结论的一致性、同一医务工作者对同一组病人前后进行两次观察作出诊断的一致性等。1960年Cohen等提出用Kappa值作为评价判断的一致性程度的指标。实践证明,它是一个描述诊断的一致性较为理想的指标,因此在临床试验中得到广泛的应用。

本研究分别给出三种Kappa系数,即简单Kappa系数,加权Kappa系数和总Kappa系数及标准误和检验统计量的计算公式,并针对Kappa系数仅适用于行数和列数相等的方表的问题,给出了用SPSS软件实现对行列数不等资料的Kappa检验方法。

1简单Kappa系数的计算公式[1]

K=P0-Pe[]1-Pe(1)

其中P0=∑ipii,称为观测一致率,Pe=∑ipi.p・i,称为期望一致率,即两次检验结果由于偶然机会所造成的一致率,其中pi.=Ri[]N,p・i=Ci[]N,Ri,Ci分别为第i个格点所对的行合计和列合计,N为总例数。当两个诊断完全一致时,P0=1,此时Kappa值为1。当观测一致率大于期望一致率时,Kappa值为正数,且Kappa值越大,说明一致性越好。当观察一致率小于期望一致率时,Kappa值为负数,这种情况一般来说比较少见。根据边缘概率的计算,Kappa值的范围值应在-1~1之间。Kappa≥075两者一致性较好;0.75>Kappa≥0.4两者一致性一般;Kappa<0.4两者一致性较差。

Kappa系数标准误的计算公式为:

S=Pe+P2e-∑ipi.p・i(pi.+p・i)[](1-Pe)N(2)

其95%的置信区间为:

(k-1.96S,k+1.96S)(3)

由于Kappa值是一个样本统计量,作是否有统计学意义的假设检验时,应选用统计量:

U=Kappa[]S(4)

2加权的Kappa系数[2]

加权的Kappa系数是简单Kappa系数的推广,是用加权的方法对两个评价结果进行量化。对于四格表来说,简单Kappa系数与加权的Kappa系数是相等的,对于一般的行列表,加权的Kappa系数的计算公式为:

Kw=P0(w)-Pe(w)[]1-Pe(w)(5)

P0(w)=∑i∑jwijpij

Pe(w)=∑i∑jwijpi.p・j

其中0≤wij=wji<1,i≠j,wij=1。

加权Kappa系数的标准误计算公式为:

Skw=∑i∑jpi.p・j[wij-(i.+・j)]2-P2e(w)[](1-Pe(w))2N(6)

95%的置信区间为:

(kw-1.96Skw,kw+1.96Skw)(7)

假设检验的统计量为U=kW[]Skw(8)

Kappa的权系数一般使用CicchettiAllison和FleissCohen两种权值类型[2],CicchettiAllison的计算公式为:

wij=1-|Ci-Cj|[]Ck-Ci(9)

FleissCohen的计算公式为:

wij=1-(Ci-Cj)2[](Ck-Ci)2(10)

其中,Ci表示第i列的评价分值,k表示列数。如果是数值型变量,评价分值Cij就是第i行第j列对应的具体数值;如果是分类变量,可按照相应级别进行赋值。由于wij=1,而当i≠j时,0≤wij<1,所以由Kappa系数的计算公式可知加权的Kappa系数大于简单Kappa系数。

3总Kappa系数

假设列联表为多向列联表(我们不妨设有q个方向),且每个变量有两个水平,即为2×2×…×2列联表,令ki表示第i个变量的Kappa系数,Ski表示第i个Kappa系数的标准误,则总Kappa系数的计算公式为:

K总=∑q[]i=1ki[]Ski/∑q[]i=11[]Ski(11)

若要检验各变量Kappa系数是否都相等,可采用自由度为q-1的χ2检验,计算公式为:

χ2=∑q[]i=1(ki-k总)2[]Ski(12)

(11)、(12)两个公式均适用于加权的Kappa系数。

4行列数不等时Kappa系数的计算

Kappa系数的计算适用于两个评价人分级水平数相同的情况,即数据格式为行数和列数相等的方表。而在实际操作中,经常会出现分级水平数不一致,即行列数不等的情况。我们来看一个实例:两名医生按照某项指标的1~4个等级来评价8个病人。一个医生用全部4个等级进行评价,而另一医生只有3个等级进行评价。此时,对于两个医生来说,他们评价的级别范围不同。数据见表1。

表1甲乙两医生对病人的评价(略)

下面我们使用SPPS软件获得Kappa值及检验结果。SPSS110或更低的版本在这种情况下均无获得Kappa统计量。SPSS115以上的版本可以计算出Kappa值。首先进入数据编辑器并给甲医生添加额外的观测值0001。数据录入见图1。选择Analyze→DescriptiveStatistics→Crosstabs,将变量甲,乙分别放入对应的行列框内,选择Statistics按钮,得到如下对话框(图2),选择Kappa复选框,按continue即可输出Kappa值、标准误和P值。

相应的结果为:

Kappa=0.810,P=0.001,S=0.176。

5讨论

在诊断试验的研究中,数据资料多为双向有序的列联表资料,即两个变量都是有序变量,而且属性相同。属性相同分为三种情况,一种情况是属性、分级水平数和分级水平都完全相同。如甲医生和乙医生都把病人的检查结果分为1、2、3、4四个等级。此时可直接作Kappa检验。当这两个变量都只有2个水平时,就成为配对设计的四格表资料,可使用配对χ2检验,即McNemar检验。第二种是属性相同的分级水平数相同,但分级水平不全相同。如甲医生和乙医生都把病人的检查结果分为四个等级,但甲医生的分级为1、2、3、4,而乙医生的分级为2、3、4、5。在这种情况下,由于列联表的行数和列数仍然是一致的,即列联表仍为方表,所以也可计算出相应的Kappa统计量。第三种是属性相同,但分级水平数和分级水平不全相同。这种情况就是我们所说的列联表的行列数不一致。由于收集上来的数据不能轻易删除掉,所以我们考虑添加行或列使联表成为方表。如行数为n,例数为n-1,则我们只需要添加第n列,在第n行第n列的格点中添加权值0001,而第n行的其它格点均设为0,就可以命名其成为方表,并计算Kappa统计量了。由于权值系数很小,所以不会影响Kappa值的计算结果。

另一方面,如果两个变量中有一个变量是金标准,那么我们不但能分析出检验结果的一致性,还可以计算出敏感度、特异度、误诊率和漏诊率等指标。如果有不同的诊断分界点,还可以绘制出ROC曲线。

诊断试验的评价[3]在医学研究中具有十分重要的意义,目前大多数文献都使用Kappa统计量来检验结果的一致性。所以本研究主要是对Kappa系数作一个探讨和分析。诊断试验评价的统计学方法还会随着更多问题的提出和解决而不断得到发展、修正和扩展。

参考文献

1马斌荣,主编医学科研中的统计方法北京:科学出版,2005,3

2SAS91软件说明书(英文版)

3宇传华译诊断医学统计学北京:人民卫生出版社,2005,3