统计数据质量改进的对策探讨

时间:2022-03-30 02:56:00

导语:统计数据质量改进的对策探讨一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

统计数据质量改进的对策探讨

论文关键词:统计数据,数据质量,理论研究,经验证据

论文摘要:本文在回顾现有文献基础上,指出要从根本上解决我国政府统计数据失真问题,还得从改革现行的统计管理体制入手,摆脱地方政府干扰,确保统计独立性,同时认为在现行框架下增加诸如消费价格指数权重、房屋销售价格及房价指数、固定资产投资等指标的统计透明度可以在很大程度上避免当前很多对中国政府统计数据不必要和不公正的质疑。

近年来,中国政府数据统计质量问题日益受到国内外学者的关注,相应的研究文献大量涌现,研究主要集中在统计数据质量的含义和衡量标准、统计数据失真的作用机理、统计数据质量控制技术、评估方法和管理理论,同时还有针对中国统计数据质量进行实证方面的评估以及改进统计数据质量的政策建议方面的讨论。

一、引言

2010年2月25日,国家统计局的《2009年国民经济和社会发展统计公报》显示,2009年全国70个大中城市房屋销售价格上涨1.5%。而根据2010年1月19日国家统计局公布的2009年全国房地产市场数据,相比前一年均价上涨约24%。

改革三十多年来,中国的统计体系已经发生了很大的变化,统计部门也做出了很多努力。但总体看来,统计体系严重滞后于经济发展现实,统计工作显然还有更大的改进余地,而且当下更显迫切。中国下一步要改善经济增长质量、改善宏观经济决策、进一步深入改革和完善市场经济体制,其中一个很重要的环节就是要改革现有的经济统计体系,这就必须要涉及到统计部门的改革。由于现有的关于这个主题的文献很多,评述所有学者的贡献几乎是一件不可能完成的事情,因此,笔者只回顾了其中极具影响力的文献(当然,疏漏也在所难免),根据“理论--实证--政策”这一主线对其进行梳理,希望本文能够引起学界和业界对中国统计体系的关注及其改革方向和对策的讨论。

本文余下部分结构安排如下:第二部分研究了统计数据质量理论方面的内容,第三部分研究了统计数据质量评估的经验证据,第四部分研究了改进统计数据质量的对策,第五部分是一个简单的小结。

二、统计数据质量的理论研究

目前国际上针对统计数据质量还没有一个统一的定义,不同的学者也有各自不同的定义。总的来说,从用户、生产者和被调查者三个角度考察,衡量统计数据质量的标准共有11个,即适用性、准确性、及时性、可比性、可衔接性、可取得性、可解释性、客观性(或诚信)、方法专业性(或健全性)、有效性、减轻调查负担。

(一)统计数据失真机理

统计部门的行为会直接影响数据质量,如统计数据搜集整理过程中出现的设计误差、调查误差、汇总误差等(王强,1990;颜德纶,1990)。统计主体间的博弈是产生数据质量问题的重要诱因,如企业和统计部门、上下级、区域间基于利益的博弈(朱秀君,2000;卢冶飞,2003;朱文兴、张继良,2005);官员业绩博弈、干预基层博弈和干预统计博弈(林勇、杨言勇,2008);地方官员在经济竞争当中的政治晋升博弈(周黎安,2004)。

以上文献主要从统计部门、统计体系和统计外部体制环境三个方面分析了中国统计数据失真的原因。事实上,三个方面是相互影响的,尤其是外部体制环境对统计部门的影响这一因素在中国尤为显著。很多时候,统计部门受到地方政府的干扰以及同级部门之间源于考核指标的竞争,而牺牲了统计数据的真实性。尤其是地方政府源于升迁和争取中央政策支持而产生的数据攀比和赶超,不能不引起公众对其所公布的统计数据真实性的怀疑。

基于对以上三个方面因素作用机理的理解,国内外学者主要从统计数据质量控制、统计数据质量评估、统计数据质量管理三个方面出发,进行了大量的理论研究,给出了控制、评估和管理方法。

(二)统计数据质量控制

统计数据质量的控制,主要是数据搜集和整理过程中对误差的控制,针对统计误差所开展的理论研究,涉及测量误差的统计分布和检验、抽样误差以及非抽样误差、缺失数据的统计处理方法、汇总数据的误差等。基于这些研究,产生了抽样调查方法和非抽样误差控制技术(金勇进、陶然,2010)。Neyman(1934)关于分层抽样最优分配及回归、比率估计的研究是统计数据质量研究的一个重要里程碑。

(三)统计数据质量评估

统计数据质量评估一方面可以检验所搜集到的数据本身的质量,另一方面还可以检验数据搜集过程中质量是否得到有效控制。

刘孝新等(1997)运用事后预测和反常结果判断法对统计数据质量进行了评估和推断。成邦文和董丽娅(2002)从一致性误差和非一致性误差两个方面分析了社会经济统计数据误差,关于前者的分析内容有趋势性分析、机构对比分析和相关指标关联分析,而对后者的分析则包括分布形态一致性检验和异常数据的识别。刘洪和黄燕(2007,2009)先后运用趋势模拟评估法和相关指标分析法,对统计数据质量进行了定量评估。张德然(2003)给出了根据各数据点的跳跃度所提供的信息来检验异常值的方法。

可以看出,在数据质量的评估方面,国内学者的关注点是(政府)统计数据(statistics),而国外学者提出的方法则针对的是一般意义上的数据(data)。因此,将国外的研究方法引入国内来评估政府统计数据质量是可行的,同时还需结合数据体系的特点和兼容性进行具体的评估分析。

(四)统计数据质量管理

在对统计数据质量进行有效控制和评估的同时,建立统计数据质量管理体系是实现统计数据质量持续改进和统计工作全过程质量提高的有效途径(金勇进、陶然,2010)。颜德纶(1990)将质量管理学中的PDCA循环理论与统计工作相结合,提出了覆盖统计工作全过程的统计数字质量全面管理的思想;傅德印和刘晓梅(1994)分析了在我国贯彻IS09000系列标准,建立数据质量体系的可行性,给出了统计数据质量体系的结构和要素及其建立和实施步骤。

国外关于数据质量管理体系的研究,很多基于全面质量管理(TQM)的原则、方法、指南,也继承了IS09000系列标准的框架(Wang,StoreyandFirth,1995;Wang,1998;Wang,AllenandHams,2003)。Ryu和Park(2006)构建了数据质量管理成熟度模型来评估组织数据质量管理能力,共分为初始、已定义、已管理和优化数据管理级四个等级。如同数据质量评估,国外关于数据质量管理的研究也是针对一般意义上的数据(data)。

三、统计数据质量评估的经验证据

理论层面上关于统计数据包括失真机理、质量控制、质量评估和质量管理的研究给出了一般性的研究基础、研究方法和研究框架,针对中国官方统计数据质量问题,国内外学者也进行大量的实证层面的研究,而且这些研究绝大多数直指国际上争议颇大的GDP及其增长率的准确性问题。

(一)来自国外的证据

国外关于中国经济增长统计数据质量问题的正式研究成果,大多数认为中国政府公布的经济增长率一定程度上偏高。这些研究从统计口径和统计方法的角度提出了对中国政府统计数据质量的质疑。

1997年的世界银行研究报告认为,中国在1978~1995年期间经济增长率实际应为8.2010。Maddison(1998)研究表明,这一时期中国经济年均增长率应为7.5%,而同期国家统计局公布的增长率为9.9%。

不过,余芳东(2004)指出世界银行按汇率转换的中国GDP数据一定程度上低估了中国实际经济规模,而由于受资料来源和计算方法的限制,世界银行公布的购买力评价结果明显高估中国的实际经济规模,不能反映现实的支出结构、消费结构和商品价格水平。

根据中国官方数据,农村贫困人口从1978年的31%下降到了2000年的3%,Park和Wang(2001)认为这一数据低估了农村贫困率,高估了贫困减少速度。Scharping(2001)也分析了人口数据,指出计划生育政策和人口流动性的增强导致中国的人口统计数据存在严重问题。这一分析是符合中国实际的,由于中国人口统计体系统计项目和统计标准的不完善,导致了很多农村人口和贫困人口的漏统。

Klein和Ozmucur(2002)利用中国1980~2000年的年度数据,根据包括电力、煤炭、货运等在内的15个基本经济变量来解释GDP的增长,结果表明这些变量与中国官方的GDP增长之间的相关关系是符合经济规律的。

中国官方数据显示,1997~2001年中国进口额增长了70%,财政收入增长了90%,Lardy(2002)通过解释这两个经济指标数据不可能被高估的原因,认为中国官方的1997~2001年GDP增长率为7%以上是可信的,并没有被高估。

利用价格指数法,Szirmai和Ren(2005)发现1980~1987年间工业总产出高估了1个百分点;在1986~1994年间,CDP的增长率高估了3.8个百分点(Ren,1997)。

利用生产指数法,Wu(1997)发现1978~1994年间工业增长高估了3.4个百分点,1978~1997年间高估了3.3个百分点;Maddison(1998,2001)发现1978~1994年间GDP增长率高估了2.4个百分点,而1995~1998年间高估了2.1个百分点(官方数据为8.7%)。

需要指出的是,价格指数法和生产指数法是国际上通用的计算增长率的两种方法,前者对于工业增长率和服务业增长率的计算都是适用的。而后者则主要适用于工业增长率的计算,对绝大多数的服务业增长率并不适用。

(二)来自国内的证据

近年来,关于中国宏观经济统计数据质量的讨论在国内也相当热烈。国内学者主要从微观角度进行了评估和检验。

孟连和王小鲁(2000)通过168种工业产品产量指数,货物运输业增长、电力和能源消费量增长各自与工业增长之间的相关分析,以及生产函数分析三种方法,得出结论:改革前的1953~1977年间和改革后的1978~1991年间,工业增长率没有明显虚增,但1992~1997年增长率明显过高,应从16.2%调整到12.2%。GDP增长率在1953~1977年期间可能有2.2个百分点的虚增,在1978~1991年期间可能有1.0个百分点的虚增,在1992~1997年期间可能虚增了2.5个百分点。

成邦文、董丽娅和杨峻(2000)采用对数正态分布检验法,对1998年研究与开发机构的人员、经费、资产、活动、成果、技术交易六个方面共86个指标数据进行评估,结论表明在5%的显著性水平上数据质量是比较好的。同时,在对全国4806个研究院所的统计数据评估中,86个指标有65个在1%的显著性水平上通过了检验(占76%,包括主要指标),表明全国研究与开发机构主要调查指标数据的质量也是比较好的。

不同文献使用的方法的不同可能会导致评估结果的差异,当然我们也应看到这些方法的适用性及优缺点,但不可否认的是,国内外学者大量的实证研究从多个角度证明了中国政府统计数据质量问题的确存在。那么如何解决现有问题,改革现有统计体系?

四、统计数据质量改进的对策探讨

针对统计数据质量问题,中国政府统计部门已经采取了一系列措施,并取得了初步成效。如改革统计调查方法、统计汇总方法、工业不变价增加值计算方法及扩充统计调查范围等,逐步细化统计的产业部门分类(特别是规模以下工业)和支出项目分类,建立经常性的服务业统计调查制度(特别是新兴服务业),建立各专业分季度统计调查制度,完善价格统计,弥补未被观测的统计缺口,建立相对独立的统计管理体制来完善GDP核算(许宪春,2002)。

在具体指标数据准确性方面,中国人民银行武汉分行、国家统计局湖北调查总队联合课题组(2006)认为中国应当尽快建立剔除了自然因素、行政控制、垄断定价等影响的CPI指数即核心CPI,以反映消费价格的中长期走势,并由国家统计局按月编制,定期,更好地为制订中长期经济发展战略和宏观经济调控服务。任若恩(2002)则认为提高中国经济增长率的准确性,最终要依赖于国家统计局所使用方法的改进和日常工作中测量中国增长率所使用的数据来源的改善。

五、结语与展望

本文通过对国内外关于政府统计数据质量的研究文献进行梳理,介绍了统计数据质量的含义和衡量标准、统计数据失真的作用机理,统计数据质量控制技术、评估方法和管理理论以及一些实证研究结果和学者们关于改善统计数据质量的政策建议。

纵观研究我国统计数据质量的大量文献,关于宏观经济数据失真的机理分析已相当充分,指出了问题的症结即制度性因素,切合中国实际;统计数据质量控制技术则偏向于理论和方法的介绍,相对于评估方法和管理理论,在与实际问题的结合方面比较欠缺;在通过实证研究指出失真问题的存在性和失真程度之后,政策建议则侧重于战略角度,缺乏实用性。