数据统计分析范文

时间:2024-02-18 17:58:36

导语:如何才能写好一篇数据统计分析,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

数据统计分析

篇1

【关键词】IPTV;收视数据;统计分析;图表呈现

1.收视数据统计分析的必要性

1.1 IPTV的技术特点

IPTV以电信运营商提供的宽带物理网络为基础,采用通信、广播、计算机、互联网和多媒体等技术,传送数字音视频等多媒体信息到多种终端,并实现业务管理和控制IP化的系统和业务,具有如下特点:

(1)交互性:IPTV是建立在通信网络上的互动性视频服务,可以非常灵活地实现电子菜单、节目预约、实时快进、快退、节目编排等。

(2)内容丰富:除了提供类似电视频道制视频直播之外,利用互联网信息资源的优势,IPTV还可提供包括远程教育、网上购物、视频电话、网络游戏、互联网浏览等在内的交互式多媒体信息服务。

(3)可开发性强:在改动量小的情况下支持不同的视频编码标准。

1.2收视数据统计分析的必要性

IPTV的双向性,使得用户需要观看某一个节目时,必须向服务器发送请求命令,利用这一特点,通过数据采集系统,形成了IPTV独有的收视数据。IPTV的收视数据是客观的、真实的,对其进行统计分析,有着重要意义。

1.2.1准确收视统计,提供决策参考

电视收视率既反映一个电视台电视节目的质量和水平,也反映观众的欣赏要求。及时准确的收视率调查,不仅可以动态观察观众收视动向,发现节目编排问题,为电视台领导决策提供依据,给节目编导改进节目提供方向,而且为广告商确定各时段的广告价位和企业选择时段做广告等提供了重要参考。

1.2.2收视偏好分析,客户分群关怀

从客户收视行为角度出发,对IPTV收视数据进行统计分析,可以得到开机率、到达率、占有率、活跃度等多项指标,以及对收视内容的偏好等。根据客户的基础业务观看时长和增值消费情况,客户群主要分为高端、中端和低端三类,针对不同客户价值,可以进行不同的关怀措施。对于沉默客户、流失客户均可制定相应的关怀举措,达到唤醒、挽留的目的。

1.2.3深度商业挖掘,精准数据营销

在对客户价值分群的基础上,把握消费者对IPTV的个性化消费需求,可做到更细致、更精准的数据库营销。例如,结合智能推荐引擎,生成个性化的点播单、为客户推荐具有高度相关性的其他节目;基于客户偏好和观看历史的学习,在客户不知道看什么节目的时候,为其推荐最符合偏好的节目;结合年龄、性别、教育程度、收入情况等,综合分析收视偏好,其结果对于运营商开展IPTV客户数据库营销亦具有启示意义。

2.收视数据统计分析系统功能需求

2.1数据获取

IPTV收视数据以Log文件的形式存储在电信运营商的FTP服务器上,并且进行了压缩处理,以日期作为文件名,存储当天的增量收视数据。系统首先要定时,例如每天的凌晨4时,将收视数据从运营商的服务器下载到本地服务器,进行解压缩,还原成原始Log文件,以备进行后续处理。

2.2数据转换

数据转换是将收视数据从Log文件转换进入数据库的过程。在转换之初,所有的字段都是以字符的形式存储,对于收视开始时间、收视结束时间等非字符型的字段,要进行相应的类型转换,形成数据库版的原始收视数据。由于每次转换的是一天之内的增量收视数据,需要对转换操作进行日志记录,防止遗漏和重复的发生。

2.3数据筛选

原始收视数据中存在着一些不合法的和无意义的数据,例如只有收视开始时间没有收视结束时间,缺少收视频道等都属于不合法数据,收视时间间隔小于5秒(可以由用户自己定义)被视为是用户调整频道,为无意义数据。原始收视数据是海量的,必须对不合法的和无意义的数据进行过滤。

2.4数据校验

电信运营商除了提供每天的增量收视数据以外,每月还提供一次收视汇总数据,同样以压缩Log文件的形式提供。利用月收视汇总数据与每天的增量收视数据进行校验,形成最终的当月收视数据。

2.5统计分析

从用户维度、内容维度、产品维度定义多种指标,对收视数据进行业务逻辑统计和客户端呈现;对于常用指标如收视率、总收视率、平均收视率、开机率、占有率、到达率、转台数、收视时间等进行统计分析;可以在不同的周期下(天、周、月、季度、年)统计收视数据;不同内容在相同周期内的横向比较,相同指标在不同周期的纵向比较;多种形式呈现统计结果,多种渲染设置美化呈现效果。

3.收视数据统计分析系统功能实现

针对收视数据统计分析系统功能需求,从以下几个方面加以实现。

3.1后台服务程序,自动实现数据获取

(1)后台服务程序功能:登录电信运营商的FTP服务器,查找指定目录,下载当天原始收视数据,对原始收视数据进行解压缩,把解压缩后的原始收视数据Log文件拷贝到本地指定的目录下,调用数据库存储过程,进行数据处理。

(2)后台服务程序设置:服务程序启动之前,可以通过配置文件对其进行设置,包括:电信运行商FTP服务器地址、登录用户、登录密码、原始数据存储路径、本地数据存储路径、执行方式(在每天的指定时间点执行一次或在指定时间间隔到达后执行多次)、是否删除FTP服务器原始文件、是否删除本地下载文件等。

3.2编写数据库存储过程,完成各项数据处理

收视数据最大的特点是数据量大,在后台进行数据处理非常必要。存储过程可以接受参数、输出参数、返回单个或多个结果集以及返回值,运行速度比较快,运行比较稳定,是后台数据处理最好的选择。对于功能需求中的数据导入、数据转换、数据筛选、数据校验等操作都通过编写存储过程得以完成。

重点说明一下数据导入存储过程,SQL Server数据库提供了一个BULK INSERT命令,可以将具有特定格式的外部文件快速加载到数据库表或视图中,在此发挥了重要作用。

3.3前台应用系统,呈现统计结果

因为延续微软开发体系,前台统计结果呈现使用MSChart控件。MSChart是微软的一个免费的画图控件,为图形统计和报表图形显示提供了很好的解决办法。在图形效果方面,本系统实现的功能包括:

(1)图形标题:根据统计时间、指标名称,生成默认图形标题,默认标题可编辑。

(2)图形种类:折线图、曲线图、阶梯图、柱形图、条形图、饼形图、环形图、面积图、点状图、堆积图等多种图形种类选择。

(3)图形背景:多种颜色背景选择,即选即变。

(4)图例位置:顶部、底部、左侧、右侧、不显示等。

(5)坐标选项:坐标始于0,适合数值相差不大情况,坐标不始于0,适合数值相差较大情况。

(6)数值选项:是否在图形上显示每一结点的数值。

(7)3D选项:是否启用3D图形效果,启用时,X轴、Y轴角度可调节。

(8)特殊渲染:是否启用图形渲染,对部分图形种类有效。

(9)强调显示:适用于饼形图和环形图,突出显示某一比例。

(10)图形尺寸:默认图形尺寸可调整。 IPTV收视数据统计分析系统已经开放完成,收视数据日积月累在不断增大,系统优化需求在较长的时期内会一直存在。 [科]

【参考文献】

[1]中国电视视像行业协会.解读数字电视.北京:人民邮电出版社,2008,1.

篇2

【关键词】数据统计分析;港口管理;重要作用

一、前言

在港口的日常管理中,考虑到货物的流动性较大,并且货物种类较多的特点,要想保证港口的日常管理取得积极效果,满足港口管理需要,就要在港口日常管理中积极引入数据统计分析手段,实现对港口货物的有效统计,保证港口管理能够有第一手的数据作为支撑,为港口分析整体效益和制定经营策略提供有力保证。从这一点来看,港口管理中应对数据统计分析引起足够的重视,应从港口管理实际出发,分析数据统计分析对港口管理的重要作用和意义,将数据统计分析作为重要的管理手段,提高港口管理的整体效果。

二、数据统计分析手段在港口管理中的应用

目前来看,数据统计分析手段在港口管理的应用主要表现在以下几个方面:

1.数据采集与数据传输。目前各港货物吞吐量的统计已基本实现了数据采集的信息化,做到数据文件传输的准确及时。如厦门港已开发了港口生产统计管理系统,各码头公司也相应拥有自己的统计系统,数据源直接可以通过码头一线操作系统传入码头公司内部统计管理系统,加工处理后,再和管理局的生产统计系统对接。

2.数据存储。由于要做到详细掌握每条船每批次货品的具体数量和储存情况,每月每年累计下来,将会形成大量的基础数据,因此必须配备专门设备进行存储。厦门港已在港口生产统计管理系统投入使用后,配套配备了专门的存储器进行处理和存储,并进行定期的维护。

3.数据分析应用。该层可以进行统计查询、统计服务,通过对数据库中的各种数据进行分析、统计、建模、归类等工作,?可以为管理人员提供决策支持,帮助管理人员做出好的决策,提供了联机分析处理和数据挖掘服务。

三、数据统计分析对港口管理的重要作用

从数据统计分析手段在港口管理中的应用来看,数据统计分析对港口管理的重要作用主要表现在以下两个方面:

1.数据统计分析能够综合分析港口的吞吐量。数据统计分析的具体做法是对港口货物的种类和数量进行全面计算,并最终形成每日或者周期性的通过图表等形式反映出来的吞吐量完成情况,为港口日常管理提供直观的数据支撑。所以,数据统计分析对分析港口吞吐量具有重要作用。

2.数据统计分析能够正确计算港口的整体效益。在数据统计分析中,不但能够计算港口的吞吐量,还能计算港口的整体经营收入。通过固定的收费项目和收费标准,计算出港口的基本收入情况,进而验证港口的实际收入是否存在出入,形成对整体经营管理效益的合理核算。所以,数据统计分析手段对港口的日常管理具有重要的促进作用。

四、数据统计分析对港口管理的重要意义

考虑到数据统计分析的作用及其在港口管理中的应用,数据统计分析手段对港口的管理具有重要意义,具体表现在以下几个方面:

1.数据统计分析对提升港口经营管理水平具有重要意义。港口作为重要的交通货运枢纽,其经营管理水平不但关系到港口的整体效益,还关系到港口的未来发展。为此,通过港口数据统计分析直接反映港口的实际经营情况,对提升港口经营管理水平具有重要的促进作用和指导意义。

2.数据统计分析对促进港口持续健康发展具有重要意义。考虑到数据统计分析的重要作用,在港口日常管理中,数据统计分析手段得到了充分应用。由此可见,数据统计分析为促进港口持续健康发展具有重要意义。

五、结论

通过本文的分析可知,在港口日常管理中,数据统计分析作为一种基础手段应该得到应有的重视。为此,我们应立足港口管理实际,认识到数据统计分析在港口管理的中作用和意义,重点做好统计分析工作,满足港口管理需要,为港口发展提供有力的支持。

参考文献:

[1]白雪洁.中国港口经营与管理发展特征和趁势[J].港口经济, 2009年04期

[2]高素争.港口统计数据质量的评价分析[D].大连海事大学, 2010年

[3]黄始坚.完善企业统计制度促进施工企业发展[J].企业科技与发展,2011年14期

[4]黄杰.沿海港口吞吐量与国民经济关系研究[D].大连海事大学,2011年

篇3

关键词 计量统计;数据库;动力能源;供给;事件管理

中图分类号:TP2 文献标识码:A 文章编号:1671-7597(2013)12-0124-01

企业动力能源保证是企业生产的基本条件,动力能源管控系统的平稳运行保证着企业产品的质量和企业的经济效益。随着电子技术的快速发展,电控技术突飞猛进,我们企业通过技术改造项目实施,在电气控制中引进新产品、新技术,使设备性能和生产能力都有了飞跃性的提升。动力能源车间对设备管控技术有了崭新的突破,实现与制冷机、空调机组、空压机、冷干机以及供水系统数据通讯、智能联控调节,锅炉、变配电设备远程监测。原来设备大都停留在单机运行、手动操作的阶段,车间人员配置较多,数据的统计与计量全靠人工手抄和手工计算,设备、能源管理等也停留在经验与估算的基础上,在动力能源数据管控、统计与分析、管理方面呈现基础薄弱、技术水平低下的特点。目前结合车间动力能源管控系统的开发与完工,我们具备了一套功能完备、技术先进、易于操作、便于维护的动力能源管控于一体的信息集成系统,实现电力能源供应、空调机组、制冷机组、空压机组、真空泵机组、变配电、锅炉供热、给排水及污水处理配套设施全面自动化控制和信息化采集,系统通过遍布在全厂的能源监测点,全面控制、调节和管理各设备,为生产调度提供准确和实时的数据,对全厂的水、电、蒸汽、真空、压缩空气等能源监测点进行计量与监测;对重要工艺设备的水、电、气和汽用量与质量指标进行监测,保障设备正常运行,保证企业生产的正常开展。

动力能源管理系统,是基于计算机网络和数据库技术的应用,实现了网上并行工程处理和数据共享以及同其它应用程序的动态数据交换,保证计量和管理信息准确及时。动力能源设备通过底层设备控制器及PLC从各个采集点搜集数据,实时监控各生产设备运行状态、开停情况、故障次数、故障原因等运行情况;把不同的数据传输至管理系统SQLSERVER数据库中;相应数据再次经过SQLSERVER数据库的处理,将数据用关系数据库的模型以表的形式存贮在 数据库中;SQLSERVER数据库中的数据不仅可以在控制网络中得到,也可以在其他数据库中或其他的管理系统中通过网络读取数据。

动力车间首要工作是保持动能设备平稳运行,稳妥供给企业水电气汽需求。通过精准计量统计分析,杜绝资源浪费,合理调配动能设备投入量,节约能源消耗。我们基于动力能源管控系统平台可以顺利实现有效设备管理、管路泄露和动能消耗计量统计,通过客户机终端登录管理系统,查询到所需要的数据,访问所需相应模块,输出各种报表,并建档保存;为提高设备的作业率和设备操作人员的工作效率,就要将动力车间的各种设备的运作效率、设备运行情况以及设备的故障情况等各项指标进行完整的记录和详细的分析,将这些信息经行完整有效的规范化管理。

设备管理与备件消耗统计,进入设备管理模块,通过机械设备故障数据的收集和分析,加强设备维修管理,开展预防性维修,提高设备运行可靠性、降低设备突发故障率,提升维修预知性,准确统计设备维修成本,以及维修费用阶段性变化,有效组织单机设备的维修计划,准确下达项修、大修任务。对设备进行检修或排除设备故障的同时,维修人员通过填写统一格式的维修记录,一方面可以整理维修思路和经验,便于技能素质的提升;另一方面通过维修工单的数量掌握每一位维修人员工作量,通过维修工单内容维修效果分析维修人员的个人技术能力。对设备维修施工数据的统计存档,利于掌握设备全寿命周期内历史事件查询,固定资产审核保存记录。

水、气、汽管路节点计量统计,首先通过动力能源管控系统平台数据的收集,提供管路分布数据,统计各个分支管路消耗数据指标,掌握某个部门或某个工艺设备用能消耗情况,分析数据可以发现是否有异常浪费,是否动能供给量过剩与不足,调整动能设备的投入;经过某段管路的计量信息统计,分析是否异常泄露情况,维修人员检查确认,可以判定接头、法兰、弯头、阀门等管件的泄露情况。

能源计量统计,主要是电力和天然气消耗,以高压配电计量统计为例,计量统计数据为上位监控每半个小时自动采集发送。选择“查询内容”为“查看用量值”,通过选择“统计类型”可查看每个时间段,每日,每月,每年的用量值,若选择“查询内容”为“查看表码数”,可查看计量表各时间段的表码数。通过导出统计汇总表查阅某时段内各个线路的用电量,分析部门、车间、设备用电结果;统计各车间部门用电功率并统一汇总存档,为日后的能源消耗考核提供参考数据。部门的详细用电功率汇总表分别列出生产用电部分的用电功率和照明用电部分的用电功率,明细部门用电情况。

基于生产数据的统计报表数据,要从生产数据中按照科学的运算模式抽取需求数据,把各种业务数据相关联起来,层层数据挖掘、分析,并通过实时数据获取、报警与事件管理数据的处理,进而完成实时数据存储与历史事件追溯查询功能,利用SPC分析等技术,对车间工作安排和下一步团队发展,提出建设性的指导建议,为车间管理工作提供更加强有力的帮助。

参考文献

[1]崔坚.西门子工业网络通讯指南[M].北京:机械工业出版社,2005.

[2]阳宪惠.现场总线技术及运用[M].北京:清华大学出版社,2001.

篇4

网络问卷应用优势

1.省时省力

在局域网或互联网上发问卷,整个操作过程无纸化,问答方便,回收过程快速,可及时反馈,节省人力、财力。

2.问卷填写时间自由

在一定时间段内,可以自由回答问卷,不限人数;网络环境可以多人同时填写,大大提高工作效率。

3.保证数据录入有效性

在网页和Excel中均可设置填写有效性检查,通过命令限制,防止漏填或不符合规范的数据录入。如输入身份证号时,若位数不够,将提示重新输入,否则不允许继续录入,保证数据录入准确。

4.数据统计快速、准确

由于网络问卷采集的是数字化数据,进行统计分析快速高效。如在Excel中进行运算和统计,一条命令几秒钟可抵上手工几小时甚至几天的工作量。

5.题型多样,统计方便

网络问卷可采用单选、多选、判断题、简答题等形式调查。前三种可用字符统计命令快速统计结果,而简答题汇总时,由于是电子形式,可大大节省后期录入的时间和精力。

6.安全性强

纸质问卷回收过程中,涉及回收环节较多,而且不少被调查者不愿意被其他人看到自己的回答内容。若采用网络问卷的形式,只有网络后台管理人员和问卷组织者才有权限接触到数据结果,减少了中间环节。

数据采集方法

随着技术的不断发展,数据收集和统计的方法多种多样。中小学校可以利用现有条件,在学校局域网或互联网上通过Excel表格方式调查,利用学校网站进行互联网调查,或通过专门的在线调查网站进行问卷调查。

1.利用Excel在机房内收集数据(局域网环境)

传统汇总学生信息,通常是教师将学生的数据收集起来,然后一条一条输入汇总为一个表格。由于一些统计数据过细过多,输入的工作量很大,费时费力。而在网络机房进行调查反馈,可多人同时填写一张Excel表格,既减轻了人工输入的压力,还节省时间。采集的数据信息集中在一张表上,可快速高效地完成相关调查反馈。要完成此操作,只需正常网络设置的学校机房,安装Excel软件,通过对Excel文件及所在文件夹进行一些设置,就能完成数据采集。方法如下:

设置文件夹共享:首先在网络教室中教师机(Windows XP或Windows 2003系统)上建立一个共享文件夹,然后在文件夹上右击,执行快捷菜单命令【共享和安全】,打开文件夹【属性】对话框,在【共享】标签上选择【共享此文件夹】选项,点【权限】按钮,打开权限设置对话框,选中“允许”列的所有选项,点【确定】按钮,这样就将文件夹设为“完全共享”,局域网内其他人就能访问了。

设置工作簿共享:将Excel文件(成绩单.xls)复制到此完全共享文件夹,打开Excel文件,点击菜单【工具】|【共享工作簿】命令,打开【共享工作簿】对话框,选取【允许多用户同时编辑,同时允许工作簿合并】选项(有对勾),点【确定】按钮,这就完成了工作共享。

编辑应用工作簿:在学生机上,双击桌面上的【网上邻居】,在打开的窗口左侧单击【网络任务】列表中【查看工作组计算机】,在右侧窗口找到教师机,双击打开,能看到共享文件夹,双击打开Excel文件,按自己序号输入相应内容后保存。所有学生输入数据后,保存Excel文件。教师在教师机上点击【保存】按钮,这就得到全班的数据(成绩)汇总表,然后就可以通过Excel命令对收上来的数据进行分析处理了(提示:在学生机打开Excel文件后,此时可以看见标题栏的文件名右边有“共享”提示,若标题栏文件名右侧提示为“只读”,则需要重新打开)。

说明:局域网内共享Excel方式简单易行,但受到机房环境的限制,若调查人数较多还是不方便。解决办法是可以通过互联网共享Excel文件方式进行,如利用EditGrid网站(),新建或上传已有Excel表格文件,为不同用户设置相应的浏览权限,其他操作都如在Excel软件中操作一样。利用EditGrid网站可以不受时间、空间和人数限制地进行数据调查。

2.利用ASP程序在互联网上采集数据

由于同区域学校间网络可以互访,因此,可在学校任意一台计算机(无论是Windows XP 或Windows 2003系统均可)中安装IIS(互联网信息服务),正确配置一个ASP程序运行的环境,再到网上下载一个问卷调查程序,修改成自己问卷内容即可,操作过程如下。

下载:上网搜索ASP问卷调查源程序,选择题型与自己问卷要求一致的,如凌云有奖问卷调查ASP问卷,将其下载、解压、复制到IIS网站目录下,通过网页浏览器,运行无误后,就可进行修改操作了。

修改:一个问卷调查系统一般包括问卷输入、问卷保存、答案查看等多个网页文件,只需修改两个网页和一个数据库文件。

步骤 1,通过FrontPage或Dreamweaver等网页编辑软件,打开问卷录入网页(dati.asp),将原网页问卷内容修改成新问卷调查内容。再切换到“拆分”视图,如右上图所示,将按钮名称和选项对应。主要是修改每个答案的代码,如在语句中,type说明题目类型为单项选择题,每一题各答案中name后的名称要相同,它对应数据库中的字段名称,value后是输入数据库中需要统计的内容。

篇5

文献标识码:A 文章编号:1672-7800(2015)005-0098-02

作者简介:陈冠星(1984-),男,广东揭阳人,硕士,海南软件职业技术学院网络工程系助教,研究方向为数据库、网络技术与物联网。

1 数据仓库简介

数据仓库(Data Warehouse,DW)是随着关系数据库、并行处理和分布式技术的飞速发展而产生的[1], W?H?Inmon出版了《Building the Data Warehouse》一书,给出了数据仓库的定义:数据仓库是一个面向主题的、集成的、非易失的、随时间变化的用来支持管理人员决策的数据集合[2]。数据仓库包含的是整个企业视图的粒度化数据。

数据仓库系统通常对多个异构数据源有效集成,集成后按照主题进行重组[3]。存放在数据仓库中的数据通常不再修改,用作进一步的分析型数据处理。

数据仓库系统的建立和开发以企事业单位的现有业务系统和大量业务数据的积累为基础 [4],其开发是一个循环迭代过程,通常需要企业有一定的业务数据积累,开发人员将这些历史数据通过ETL输入到数据仓库中,进行分析和统计,以建立决策支持辅助系统,为企事业单位管理者提供决策支持。

2 保险业需求分析

随着保险业发展及保险市场竞争的加剧,保险公司在管理和运营方面面临着更高的要求,来自监管、竞争、技术更新及全球化等各方面的压力不断考验着保险企业。保险业发展的核心动力表现在以下几个方面:①进入新分市场及提高业务质量;②巩固客户忠诚度,适应客户多变的需求;③高效的运营;④精确的风险及成本控制;⑤消除各种技术壁垒。

要做到上述目标并不容易。对高层管理者来说,由于统计口径的关系,很难获取一致性数据进行比对,很难及时监控到业务状况,不能有效地进行决策支持。对于业务部门主管与业务分析员,所需报表难以及时获取,即使取得的数据也难用于多视角、全方位地分析业务问题。对于IT部门来说,要不断帮助业务部门制作报表,时间相对较长,而且开发的报表越多,特别是分析型的报表越多,业务系统性能越受影响。

以某人寿保险有限公司为例,该公司的数据支持情况如下:

(1)保单管理系统中大致有50张左右的报表在运行,但随着公司业务的发展,数据分析及用于日常管理的制式报表与日俱增,报表数量将很快无法满足业务发展需求。

(2)各业务管理部门有各自的制式报表及统计需求,但在将数据汇总时,时常出现因统计时点不同、指标定义的理解差异等原因造成数据不一致,导致额外的数据校验工作。

(3)当前报表的IT实现基本上是按照单个报表需求来设计的,造成IT设计无法复用,报表开发缺乏整体规划,呈一种临时性状态,随着报表及统计需求的增加,IT相应的工作将与日俱增。

(4)因当前报表及数据统计都在保单管理系统中运行,随着需求数量的增加,保单管理系统将面临沉重的夜间批处理压力并严重影响日间日常业务操作的效率及稳定性。

针对上述系统现状,在建设中决定采用数据建模、ETL、数据分析以及数据展现等技术,实现风险管控分析、客户服务分析、客户维持分析、市场销售分析、综合分析和综合管理6大功能,达到以下目标:①代替原有手工报表方式,为业务人员节省时间;②提供精细的分析数据。业绩分析可以从营业部,钻取到营业组,甚至每个FC(理财顾问),保全分析可以分析每种保全项目的明细;③统一的分析口径。各部门统计指标,可以在统一的时间点上进行公司级汇总;名称一致的统计口径,可以唯一定义一种统计方式;④唯一的报表平台。从报表需求获取到报表需求分析以及最后的实现都在一个体系下完成,公司数据分析工作逐步系统化和实用化。

3 系统设计

统计分析系统采用灵活架构,在构建一个统一、稳定的企业级数据仓库基础上,分步构建各个独立的分析应用数据集市,满足灵活性、扩展性要求,系统架构如图1所示。

保险数据仓库是一个中央的知识数据库,包含来自寿险系统、团险系统、短期险系统和电话销售系统等源系统的源数据,数据模型分为3层:

(1)数据准备层(Staging Layer): 采用同源系统相似的数据结构存储源系统的每日增量数据。

(2)保险企业模型层(Insurance Enterprise Models Layer): 作为保险数据仓库的核心,相应的保险企业模型部署在该层。根据保险行业的业务视图,保险企业模型分为10个主题,根据保险信息的特性而非事务处理的目的来设计,企业级上所有保险业务信息根据历史版本进行记录。在数据准备层通过ETL(数据抽取转换装载程序)进行数据批处理,采用增量机制装载进入保险企业模型。

(3)分析数据模型层(Analysis Data Models Layer): 各种各样的数据分析需求归类到不同的数据集市,如市场及销售数据集市、运营效能数据集市、风险管控数据集市等。分析数据模型即为满足数据集市需求而采用维度建模方法特别设计的模型。分析数据模型从保险企业模型衍生而来,数据通过ETL 批处理,采用增量机制装载进入保险企业模型。

ETL采用增量机制,每日从源系统抽取变更数据至Staging层,接着将Staging层数据转换至企业模型和分析模型。在ETL批处理完成后,系统运行报表批处理生成报表并到相应的报表文件服务器上。

OLAP元数据管理工具: 提供OLAP 元数据管理工具,用于管理所有OLAP 业务元数据,包括指标定义、维度层次定义、指标与维度的关系及分析需求。通过使用这个工具可帮助保险企业统一KPI 定义及促进企业标准化管理,同时其管理的内容可作为统计分析系统所支持的知识库来使用。

OLAP平台:选择微软的SQL Server 2008作为OLAP平台。OLAP 工具支持分析的类型包括管理仪表盘、平衡记分卡、制式化管理报表、临时查询、数据挖掘等。

4 系统实现

4.1 ETL实现

ETL采用SQL Server集成服务来实现。Microsoft Integration Services 是一个可以生成高性能数据集成解决方案(包括为数据仓库提取、转换和加载ETL包)的平台。Integration Services包括生成和调式包的图形工具和向导;执行工作流函数操作和执行SQL脚本等任务;提取和加载数据的数据源和目标;清除、聚合、合并和复制数据的转换;管理包执行和存储的管理服务,即Integration Services;用于Integration Services对象模型编程的应用程序编程接口(API)。

4.2 多维数据实现

创建报表之前,需要通过SQL Server分析创建多维数据模型。之所以使用SQL Server分析服务创建多维模型,主要是为了实现对业务数据的即席查询。系统开发人员创建多维数据集以支持快速响应,并提供单个数据源以进行业务报告。商业智能的重要性不断提高,使用单一的分析数据源可确保将差异减到最小(如果无法完全消除差异)。

4.3 报表系统实现

报表系统实现使用了SQL Server报表服务,报表服务包含一整套管理报表的工具。报表工具在微软的开发环境中工作,并与SQL Server无缝衔接。通过报表服务,可以从多种不同的数据源创建各种不同样式的报表。

5 应用效果

该系统目前已经在某人寿保险有限公司正式投入使用,结果显示,该系统使业务数据的分析效率、分析能力大大提高,在一定程度上简化了业务人员数据统计工作,对公司决策支持起到很大的帮助作用,系统良好的应用价值体现在以下几个方面:①数据集成。数据仓库能够把来自多个不同子系统的数据进行有效集成,提供统一的、一站式的业务报表系统;②查询灵活方便。统计分析系统能够根据不同的需求进行条件过滤,并支持数据向上向下钻取,数据查询方式更加灵活,追溯更加简单直接,为业务分析人员提供了很大的便利;③安全性高。为了保证数据的安全性和可靠性,对数据仓库中的数据实行统一管理;④降低成本。统计分析系统的建立,可以代替原来的手工汇总操作,一次创建,只需要进行简单的维护就可长期使用。

6 结语

本系统开发及系统运行工作得到如下经验及启示:

(1)理念的转变。在数据分析上,需要从清单和简单汇总上升到数据分析,从单个部门分析到全局分析,从数据库到数据仓库进行分析设计。

篇6

关键词:政府数据;质量成本;分析

0.引言

构建资源节约型、环境友好型的“两型社会”是当前我国的一项建设目标,在建设社会主义和谐社会的进程中,需要把资源节约型社会建设这一理念贯彻其中。节约资源不单单是企业的义务,我国政府的相关在工作中也需要具有节约资源的意识。一直以来,我国政府的数据统计工作都是存在着严重缺乏成本观念以及理性经济的意识,这样是非常不利于政府工作的可持续发展的。由此,政府相关部门需要认识到在确保统计数据统计工作质量的条件下,进行节约资源的重要性。如何更有效地控制政府统计工作的成本,提高政府统计工作的效率是我国政府需要应对的时代挑战。

1.数据质量成本的内涵及其分类

1.1数据统计成本的内涵

人们把在整个统计活动中,为了保证数据取得的质量而花费的费用以及在统计活动、过程之后因为数据没有达到标准而造成的各种损失一起定义为统计数据的质量成本。其中,统计活动的整个过程指的是为了取得数据进行的一次完整的工作流程。因为数据质量不达标而发生的成本指的是对数据重新进行返工、评估造成的成本支出,以及数据使用者对数据不满意造成的各种损失。

1.2统计数据成本的分类

在数据统计的的整个过程中,质量成本涉及的内容大体上可以分为外部质量保障成本以及内部质量运行成本两大块。其中,因为政府统计数据工作的特殊性,数据质量成本保障还需要包括外部保障成本,如为了更好进行统计调查工作而进行的广泛宣传而发生的费用。统计数据中的内部质量运行成本包括了预防、鉴定、内部以及外部损失成本等四大类。其中,预防成本指的是为了取得高质量的数据的保证成本,它的目标是减少、限制数据统计中发生的各种失误并进行及时的纠正。鉴定成本又叫质量控制成本,指的是为了鉴定数据的质量而发生的成本。

2.政府统计数据的细分以及计算

2.1政府统计数据的细分

一般而言,统计工作流程包括了需求研究、调查设计、实施、数据整理、统计分析、数据评估等几个环节。在这几个主要的工作步骤中又涵盖着许多的工作程序,在这些工作阶段中进行中都会相应地产生的统计数据质量保证(预防)成本、数据质量控制(鉴定)成本以及内部损失、外部损失成本等,这些因素的影响程度在政府进行的数据统计工作中又会增大。

其中,政府统计工作中的预防成本包括了对于统计数据进行的需求研究、调查设计、调查数据的收集、分析等造成的成本;数据质量控制成本包括了调查问卷的测试评审、数据质量的评估以及其他质量鉴定等各个事项产生的支出;而内部成本损失指的是调查设计、数据收集、数据整理以及分析中等造成的各种损失;外部成本损失则包括了信息使用者投诉造成的成本以及数据再加工处理产生的各种费用等。

2.2政府统计数据质量成本的计算

正如前文所述,政府统计数据的质量成本包括了确保数据的高质量发生的费用以及在统计工作中因为质量未达标而造成的各种损失两大类。但是在实际的会计入账的时候,发生在统计工作之后出现的因为质量问题而造成的各种损失是不会显示在账面上的。为了更好地与显性质量成本进行区分,可以把这种损失成本定义为隐性成本。

因为在政府统计数据的工作过程中出现了两种性质不同的质量成本,所以在真正进行成本计算的过程中,需要采取不同的方法。可以对于其中的显性成本在会计账簿中进行核算,然后对隐性成本进行另外的统计资料的核算。还有一种做法是不分隐性成本以及显性成本,通过成本数据收集之后将所有的质量成本都汇总,进行总体的核算。

3.政府统计数据质量成本的分析探讨

3.1政府统计数据质量成本分析

通过对政府统计数据的质量成本进行分析,能够发现其中存在的缺点和不足,并在此基础上进行改进,提高数据统计质量工作的效率。

3.1.1时期发展分析

对于统计数据质量成本进行时期分析,总体而言可以分为长期发展分析、短期发展分析。长期发展趋势分析总要是对统计工作的全局战略、整体流程的质量成本进行监测。在统计工作的流程中,质量改进之后的效果需要一段时期才能够显现出来,,因此需要对统计工作的总质量成本的变化进行长期的监测。这时就需要将统计工作的历年成本总值和相应基数的百分比来作为判定的标准,以此来检测数据统计质量成本的改进成效。另外一个就是短期发展分析,将统计工作分为各个流程并制定相应的质量成本改进目标。其检测程序也是先确定一个基数,并对各个类型的质量成本的数值的变化进行分析,在此基础上采取有效措施降低质量成本。

3.1.2帕累托分析

发现数据统计质量成本问题的第二个方法就是进行帕累托分析。该分析方法的主要步骤就是找出对数据质量成本有影响的要素,并依据影响程度的高低进行排列。要想最大程度的减少数据统计质量成本,就需要在影响程度最高的要素上下功夫。只要对要素列表中的各个影响因素进行严格的成本控制,就能达到控制统计数据质量总成本的目标。另外,可以将数据统计的预防成本以及鉴定成本的总值和内部以及外部损失的总值进行对比,进而找出每单位质量的投入对于质量损失减少的程度,有利于提高统计工作决策的正确性。

3.2政府统计数据的质量成本的预测

当对统计数据的质量成本进行了一系列的分析之后,就需要对数据统计工作进行相应的预测、计划。依据对数据统计质量成本进行的预测值、以及经济效益最优的计算制定质量成本和预防工作的合理计划,并规划出统计数据质量成本标准,依据实情进行成本质量的控制。当然,还需要时刻地对数据质量成本进行评估,以便及时发现问题,调整措施。只有对政府统计数据的质量成本进行深入的分析、正确的预测,才能更大程度地提高政府数据统计工作的效率和质量。

4.结语

对政府统计数据质量成本的深入分析,包括时期发展分析以及帕累托分析等,并在数据质量成本分析基础上进行相应预测,不仅对我国建设长效的政府统计工作机制大有裨益,同时有助于切实提高政府统计工作的效率,控制政府统计工作的成本。(作者单位:重庆市江津区油溪中心卫生院)

参考文献:

[1]徐荣华,张英花,成金.美国统计质量控制和评估的经验及对我国的启示[J].中国统计.2012(04)

[2]赵学刚,王学斌,刘康冰.中国政府统计数据质量分析―一个文献综述[J].经济评论.2011(01)

篇7

重庆市第七人民医院,重庆 550004

[摘要] 目的 充分发挥病案统计管理系统的作用,保证统计数据的准确性及科学性,提升数据质量。方法 以我院病案统计管理系统在对各项病案数据进行统计和分析时出现的问题为视角点,寻找和分析对统计数据质量影响的因素,并采取相应有针对性的措施进行处理,总结处理方案。结果 我院的病案统计管理系统在对病案各项数据进行统计和分析的过程中,存在影响统计数据质量的漏洞,设定的数据接口和输入源头数据都会对统计数据的准确性和科学性造成影响,进而降低数据质量。结论 提高工作人员的业务水平,健全完善、科学的数据核对机制是提升统计数据质量的有效途径。

[

关键词 ] 病案统计管理系统;统计数据;质量

[中图分类号] R197.3 [文献标识码] A [文章编号] 1672-5654(2014)08(c)-0045-02

随着社会对医疗需求的不断增加与医院效率的低下已然成为当前社会的主要医患矛盾之一;同时信息时代对人们的影响不断增大,使得医院不得不改变以往的运营模式,继而HIS(医院信息管理系统)开始在各大省、市,乃至区县镇等医院的普及,这大大提升了医院的诊治效率。而病案统计管理系统作为HIS子系统之一,其通过设定的数据接口与HIS系统进行连接和数据传输,保证HIS系统自行收集各项源头数据得以处理和保存,并对接受到的数据进行分析和处理,从而提升医院对各项医疗数据及病案数据的自动化分析及处理,这不仅提升了医院统计报表的效率,也保证数据的准确性和可信性。医院通过使用病案统计管理系统,在很大程度上提升了数据统计和分析效果,也很大程度上避免因人为统计分析造成的误差和数据错误,为医院对病案数据的统计及管理带来了很大方便,但同时也出现了一些新的问题与挑战,导致该系统在处理个别数据时出现差错,对整个统计数据的质量造成影响。现就对我院应用病案管理系统时存在的相关问题进行分析和解剖,探讨如何提升数据质量,并总结了相关措施,现整理报道如下。

1 当前医院在应用病案统计管理系统对数据处理时出现的问题

1.1 HIS收集源头数据多而散,不利于数据的核对

HIS在对医院病案数据进行收集时,其源头数据主要为两处:一处为病案首页;另外一处为流动报表。数据的采集是由门诊部、住院部、医技科室、护士站、医生站以及收费科室等各个部门完成,这些数据采集点呈现一定散乱性。HIS在医院的应用,使得收集大部分病案统计数据的主要来源于,在对HIS相关业务的操作输入过程中而自动生成,再直接将生成的数据传送到病案统计管理系统之中。这很大程度上打乱了各项数据收集步骤的顺序性和归属性,导致数据之间的界限相互交叉,混乱不清。而许多统计人员在对数据进行相关处理时,不容易分清哪些数据属于HIS自动采集,哪些数据属于人工手动输入,这大大增加了工作人员的审核和核查难度。如,医院设定的病区工作日志各项数据的产生就涉及到了收费处、护士站、医生站以及住院部四个部门的业务操作。同样,病案首页收集的信息填写,在一定程度上也会对统计数据质量造成影响。因此,对数据收集的来源进行准确划分,加强对录入数据源头的核查和监控,是提升数据质量的基础保障。

1.2 系统存在漏洞,自身运行中存在的缺陷对统计数据质量造成影响

我院目前使用的病案统计管理系统并不完善,正处于一个逐渐趋于完善的磨合期,这使得HIS在对源头数据进行收集时,在一定程度上不能保证数据的高质量;同时病案统计管理系统的数据接口设置在一定程度上也对统计数据的质量造成了影响。如,在对入出院人数进行统计时,就存在与实际入出院人数不符的情况,病人虽然办理了入院手续,但实际上并未入院;病人虽然出了院,但还没有办理出院手续。若是相关护士未能及时对实际入出院人数与HIS收集的入院人数进行核查和校对,那么就会导致病区工作日志上的统计数据存在差错和指标失真。

1.3 统计工作人员过度依赖系统

在医院对病案数据进行统计和处理的人员拥有一定的统计学知识,但同时能够借助计算机技术以及数据库知识等复合型人才相对较少,因此,大部分的统计人员在对医院病案数据进行统计和分析的过程中只是停留在工作业务的操作表面上,并不了解HIS和病案统计管理系统的实际运行规律及流程,因此不能理清统计数据和相关机制,这导致数据中存在的差错很容易被忽视,甚至认为系统自动生成及传输的数据具有高度可信性,造成对上述数据不及时进行核查和审对,当在系统运行处理环境发生变化后,才发现数据存在差错,而此时寻找数据出错源头极其费力,导致最终的统计数据结果的可信性降低。

2 提升统计数据质量的措施

2.1加大对数据收集源头的监控力度

病案统计管理系统在医院的广泛应用,使得医院对数据统计处理的效率得到提升。然而,系统自动处理生成的数据导致大部分的原始数据存在一定程度的隐蔽性,同样数据收集源头的散乱性也很大程度上加大了数据审查的难度。因此必须要健全完善、合理、科学的数据核对机制,确保统计数据具有高度可信性和可靠性,提升数据质量。可以通过实施“三步核查”机制来对整个数据进行监控和核查:

①“每日核查”:医院在向大众服务的过程中,每天都存在入院、出院以及转科等情况的病人,因此,病区护士应及时将上述数据与病区工作日志上记录的数据进行核查和修改,若是发现录入错误,应及时向统计工作人员,并进行数据修改。病区工作日志作为连接HIS和病案统计管理的桥梁,需要病区护士做好每日核查工作,保证病区日志数据的准确性,这也是统计数据质量的基础保障。

②“每周核查”:统计工作人员在数据进行统计和处理的过程中,应每周对各病区的工作日报汇总表中的数据进行核查,对其中的逻辑关系及平衡关系进行审对,如当天住院的人数应该和前一天的留院人数对等;只有保证每个病区在出、入、转病人的人数都符合逻辑关系和平衡关系,最后汇总出来的数据质量才能得到保证。

③“每月核查”:统计数据人员在借助病案统计管理系统的校验功能对上月的数据进行处理时,应分成两种情况进行,一种是借助病区工作日志的数据对病案数据进行校验,通过对病区工作日志中记录的出、入、转人数、占床情况以及治疗情况等校对指标和病案首页录入数据进行核查和审对;另一种为借助病区工作日志进行自校验,通过对当天住院人数与前一天留院人数进行核查与校验等。若是在进行校验的过程中,出现差错,应该及时进行纠正,只有所有校验都成功,才能保证报表质量的可信性和可靠性。

2.2 规范首页病案填写,实施电子病案

病案首页作为生成统计质量报表的基础数据,其质量的好坏将直接对整个数据质量造成影响。为保证病案首页信息的可靠性及高质量性,应规范首页病案的填写,统计资料必须准确、可靠,录入质量必须得到保障。可实施电子病案,将病案首页的录入归类成四类:收费科室、医生工作站、住院部以及统计室,保证分工明确,落实责任。

2.3 完善病案统计管理系统,培养和储备医院统计复合型人才

在系统运行和使用的磨合期,工作人员应该正确使用软件审核数据的功能,若是在对数据进行处理的过程中,发现存在与统计相悖的设计要求,应及时向计算机管理中心反映,进而对病案统计管理系统进行再次完善,保证以后统计数据的质量。同时,医院还应该加强对统计复合型人才数据的培养和储备,对具备统计学知识,熟悉HIS及病案统计管理系统的人员进行培训,提升其计算机掌握能力,使其熟悉统计数据的整个流程,能及时发现统计过程中存在的问题,并及时进行处理。

3 结语

无论是手工统计还是如今信息自动化统计,都应该保证统计数据质量的高度可靠性和可信性。病案统计管理系统虽然方便了统计人员对医院病案数据进行相关统计和处理,但是同时也提出了新的要求与挑战。统计室人员应该不断加强自身技能学习,提升综合能力,这样才能提升统计数据质量。

[

参考文献]

[1] 王玉贵,明星辰.HIS功能的自主拓展与应用[J].中国病案,2011(2):46-47.

[2] 陈祝萍.病案统计原始数据来源现存问题分析及管理对策[J].中国医院统计,2009(3):243-244.

篇8

关键词:状态采集平台;数据分析;图表

中图分类号:G717 文献标识码:A

1 网络版高职院校状态采集平台动态数据分析系

统建设的必要性

为促进高职院校发展的需要,实现学校管理的科学化、现代化、规范化,提高人才培养质量,江苏省自2008年开始推进《高等职业院校人才培养工作状态采集平台》系统的应用,每年采集一次数据。目前,高职院校的数据采集平台是由上海行健职业技术学院开发的单机版[1],近两年推出了网络版的采集平台,但网络版只有数据采集的功能,没有开发数据分析的功能。

目前状态采集平台的数据分析系统使用的是江苏经贸学院开发的单机版数据分析系统。该系统将全省80多所高职院校的统计数据整合起来,进行分析处理,以人们最能接受的直观的图表方式来呈现。界面简洁,功能相对齐全。但单机版的数据分析系统因为受到各种条件的限制,存在一些缺点。

(1)自动化程度低。单机版数据分析系统的统计数据需要从每个院校的excel表格中获取,获取数据的自动化程度低。各个院校提交到省教育部门的是一个excel文档,其中包括原始数据和统计数据。数据的获取必须将80多个excel文档中的统计数据项提取到一个新的excel文档中,然后通过数据分析系统将这些统计数据以图表的方式呈现。在数据提取的过程中,需要人为干预,耗费大量的时间和精力,容易出现错误。

(2)缺乏状态采集数据的纵向比较。单机版的数据分析系统处理的都是单个年份的数据,只能对各个院校的数据进行横向比较,而无法实现每个高校数据的纵向比较。而对于用户来说,数据分析不仅需要在各个院校之间进行横向的比较,同时也需要纵向比较。在本系统中,增加了纵向比较功能,通过对历年的数据对比分析,以折线图的表现方式直观表现数据的变化,根据图表对未来数据项进行预测。

(3)无法实现资源的统一管理和共享。状态采集平台目前收集了高职院校的大量数据,这些原始数据作为全社会一个公共的教育资源,应该进行统一管理和共享,不仅为教育部门和高职院校提供决策支持,同时让更多的人参与了解高职院校的办学情况、专业状况等,进一步加强舆论监督的力量。在信息化的今天,资源的统一管理和共享显得尤为重要。

随着状态采集平台在全省院校中的应用推广,其作用不仅仅是为了采集数据,更为重要的是对采集到的数据进行统计分析。随着数据量逐年递增,数据分析的重要性越来越突显,分析结果将更具有参考价值。在此情况下,将一些杂乱的大量的没有规律的数据转换为有价值的决策信息,辅助各高职院校以及省级教育部门完善教学质量保障体系。因此建设网络版的省级数据分析系统势在必行。

2 省级状态采集平台数据分析系统的设计

为了增强系统的健壮性,本系统在设计中将状态采集平台的原数据与统计汇总的数据完全分开,一方面使得数据相对独立,另一方面则保证数据分析系统的运行速度。系统的设计框架如图1所示。

图1 系统框架

状态采集平台的数据项以及状态采集平台整个系统还在不断地完善中,每年的数据项、数据的名称等会发生变化,比如数据库表的字段名称会发生变化,数据表会增加,以及数据库中表的名称会发生变化等等。在2013年状态采集平台中,数据项“学校代码”修改为“学校标识码”,“院校名称”改为“学校名称”,“应届毕业生顶岗实习情况的毕业生录用比例(%)”改为“企业录用率(%)”,类似这样的变化的数据项有很多。状态采集平台这些数据项的变化必然会导致数据统计系统的变化。为了使数据分析系统具有稳定性和健壮性,在系统的设计中,我们将统计和分析作为两个独立的系统,数据统计系统的主要功能就是根据数据分析系统中的需要分析的数据项进行统计,将统计结果写入数据分析数据库。数据分析系统则相对独立,根据数据库中的数据对各项指标和数据进行对比分析。

系统的设计具有松耦合性,无论状态采集平台中的数据项如何变化,数据统计系统会将所需要的统计数据导入数据分析系统的数据库中,数据分析系统就负责将统计数据对比分析,以可视化的图表方式呈现给用户。

3 数据准备

3.1 数据来源

收集的数据是否准确,是否真实和充分,决定数据分析的直接结果。省级状态采集平台的数据分析系统作为状态采集平台系统的延续,所使用的数据均来自各高职院校通过单机版或者网络版状态采集平台填报的数据。状态采集平台经过近几年的使用,各高职院校目前都能够熟练使用,并且各级部门和领导也很重视,保证了采集数据的相对准确,从而使得数据分析结果在一定程度上正确反映学校在教育教学等方面的现状和不足,有利于针对性整改,提高教学质量。

3.2 数据选择

高等职业院校状态采集平台中采集的数据非常多,其中包括学校的硬件设施、固定资产、产学合作、招生、就业、经费收入支出、校内专任教师、兼课教师、专业状况、实习实训、学生奖助学情况、学生社团等大概80多个数据表。在实际的数据分析中,不是要对所有的数据全部进行分析,本系统选择一些对能够反映高职院校教学质量情况的数据项进行数据分析。状态采集平台数据分析系统对院校概况、办学条件、监测分析、师资概况等11个大类的数据进行分析。在每个类中都包含了很多的数据项。例如监测分析中包括了高级职称教师占专任教师的比例,生均占地面积,生均宿舍面积等7个数据项。

3.3 数据处理

高职院校状态采集平台虽然具有数据位的校验,数据格式,关联数据校验,报错和提示功能,但是在实际的采集操作过程中,仍然存在不符合规格的数据,因此就需要对数据进行各种处理。数据处理的过程分以下几个步骤:

(1)清理数据

主要清理的数据有两种:不符合格式要求的数据;奇异数据。

不符合格式要求的数据:状态采集平台中采集的数据有的在数据格式中没有限制,比如在收集教师基本信息的表中,有一项是在企业中的时间,有的学校职工在填写中就写了1天,有的写的是1*60,这样的数据格式在统计中是无法进行数学统计,必须对数据进行清理。

奇异数据:所谓奇异数据,是指在采集的过程中,针对同一类数据,个别院校的数据与其他的数据差别很大,一般我们认为相差三个数量级别时,就认为这是个奇异数据,要对其进行核准、处理,从而保证数据分析结果的准确性。

(2)转换数据格式

状态采集平台数据表中的字段基本都是字符型的数据,在数据分析系统中,对数据的统计汇总要通过数学公式来进行计算,字符型的字段无法计算,因此在数据清理完成后,必须将统计汇总的字段转换为数值型。具体的处理方法,用JAVA语言写一个批处理程序,实现对数据字段的批量转换。

(3)数据统计

在将数据准备好之后,就要对选择的数据进行统计汇总。本系统中对数据的统计一般包括总和,均值,百分比等。比如在校生人数,需要统计全省在校生总数和全省在校生均值;高级职称教师占校内专任教师,需要统计的是百分比;院校招生中的实际录取率,实际报到率等,统计的是百分比。数据统计由数据统计系统来完成。

4 系统的数据分析

状态采集平台数据分析系统主要采取图表对比分析的方法。采用图表方式的优点,易于阅读,易于理解,直观。例如各个学校的数据与全省均值的比较,各种类别院校的均值比较,历年数据的对比分析。对比分析主要通过以下几种图表实现:

(1)仪表盘形式。这种仪表盘的对比方式主要适合于各个院校数据与全省均值的对比,仪表盘显示院校的指标数据,全省均值则显示在仪表盘的上方,这样便于两个数值的比较。同时数据分析系统还显示了各院校数据在全省的排名。图2是某个院校的教师数、全省排名以及与全省均值的比较。

图2 仪表盘数据对比分析

(2)柱状图形式。柱状图的图表形式也是我们最常用的一种对比方法。在本系统中主要用于数据各种均值的比较。例如,全省均值,国家示范院校均值,国家骨干院校均值,省级师范院校均值,一般院校均值,综合师范民族类均值等。图3是校内专任教师数量的均值比较。

图3 柱状图数据对比分析

(3)折线图对比形式。数据分析系统中纵向数据的比较适合用折线图对比形式,表现简洁,便于理解,能够明显看出数据项在几年中的变化,从而指导学校的进行科学话管理和决策。由于网络版数据分析系统今年才开始推广,数据项是从2012年开始的,目前折线图的对比方式还没有完全体现出来。

5 结束语

状态采集平台数据分析系统的建设,为省级教育部门的决策咨询提供详实有力的数据,有利于科学合理的制定宏观调控政策,强化宏观管理和指导的针对性,进一步推进高等职业教育的可持续发展;有利于各高职院校查找办学差距和薄弱环节,整合教学资源配置,提高办学治校的科学化水平,不断加强和改善自身的教育教学管理。

参考文献

[1] 陈方辉.高等职业院校人才培养工作状态数据采集平台研究

[J].安徽电子信息职业技术学院学报,2012(1).

[2] 李畅,陈方辉.高等职业院校人才培养工作状态数据采集平台

指标分析[J].江苏经贸职业技术学院学报,2011(6),79-81.

[3] 李果,等.知识管理视角下高职人才培养工作状态数据采集平

台的建设与实施[J].职业技术教育,2013(8):55-57.

[4] 田飞.高职院校人才培养工作状态数据采集平台分析策略研

究[J].才智,2011(36):337-338.

作者简介:

篇9

关键词:高校图书馆;数据统计;借阅比例;利用率

1 引言

图书馆作为高校的教学、科研服务和高校文化传播重地,是重要的教辅单位,纸质图书是图书馆藏的重要组成部分,因其种类多、 专业涉及面广、 信息资源丰富,是重点收藏的文献类型和工作的重点。纸质图书利用情况的统计分析是图书馆管理工作的重要内容之一,同时,也是读者阅读需求最直接的反映,本文真实地统计了广东海洋大学 2010 -2015 年的图书馆纸质图书的馆藏情况、借阅情况和各类读者借阅情况,这对图书馆的工作人员掌握读者的阅读倾向,动态调整本馆的馆藏结构,提高图书馆藏书质量,提升读者满意度等具有重要的意义。

2 图书馆藏和利用情况分析

2.1馆藏图书整体利用情况

为了动态调整高校图书馆馆藏结构,提高藏书质量,进而满足读者阅读需求,图1统计了2011年-2015年自然科学和社会科学类图书的借阅和馆藏变化情况,可以看出:(1)五年来,学校虽然不断加大对图书馆纸本藏书的资金投入,社会科学和自然科学类图书馆藏量逐年增长,但图书流通数量却逐年减少;特别是2015年的减少幅度最大,达50000多册次。归其原因,主要是随着计算机、网络、通讯等高新技术的飞速发展,数字图书馆、移动图书馆、手机图书馆等新型图书馆应运而生,读者获取图书资源的途径越来越广泛,阅读方式发生改变,这对提高高校图书馆纸质文献的利用率带来一定的挑战。(2)该校图书馆社会科学类图书利用率远远高于自然科学类图书,前者是后者的 3倍,由于社科类图书是通读类书籍,是几乎所有高校师生都研读的,但阅读自然科学类图书的读者多受专业限制,为理工科类专业背景的读者。

2.2 22大类图书藏书利用情况

纸质图书利用率的大小与图书资源的更新速度和所购图书资源与读者的真正需求有关,是体现高校图书馆利用价值的重要指标[1],为了能够清楚反应高校读者使用各类图书的情况,通过五年内的统计数据来分析读者对图书的借阅需求和各类图书的利用率,以便动态调整图书的馆藏结构,满足读者需求。图2统计了2010-2015年该馆22大类图书的年利用率,从图2可以看到:(1)虽然每年22大类图书的馆藏利用率不断发生变化,但文学(I)、哲学、宗教(B)、语言文字(H)、艺术(J)类在历年统计中都位居前4位 ,说明高校读者比较喜欢这几类书,利用率高;馆藏利用率排行倒数后4位一直为航空航天(V)、自然科学总论(N)、农业科学(S)、环境安全科学(X), 说明高校读者对这几类书的需求量较小,利用率低;由于高校每年学科不会发生太大改变,读者群体的专业、学历相对稳定,读者的阅读需求类似。(2)我馆藏书主要以社会科学图书为主,排名前 10 位图书大类中,除 T 类和 O 类外,其余均为社会科学类图书,这些基本上是我馆读者借阅的重点。

2.3 2015图书借阅比例与馆藏比例统计分析

文献借阅比例是指一段时间内某类图书借阅册次与借阅总册次的比值,馆藏比例是指一段时间内某类图书馆藏册次与馆藏总册次的比值,x者借阅比例与馆藏比例应成正比例关系[2],它可以清楚反映读者需求读书类别与馆藏图书类别是否一致,也能呈现读者对某类图书的相对需求程度,图 3对比分析了2015年图书的馆藏比例和借阅比例,我们不难发现,我校部分图书的馆藏比例和借阅比例偏差较大,在文学(I)、工业技术(T)三类图书处有明显的浮动,I 类的借阅比例明显高于馆藏比例,借阅比例占整个图书馆借阅量的30%,但馆藏比例只占图书馆馆藏量的10%,反映出学生对文学类的图书需求相对较高,该馆购置的文学类图书受较多读者喜爱。工业技术(T)类的借阅比例明显低于馆藏比例,该馆藏比例为23%,但借阅比例仅为16%,说明该馆这两类图书的馆藏量明显高于借阅量。仔细分析T类图书的二级书目的外借情况,所有工业技术类图书中,一半是计算机类(TP)图书,其它图书借阅量较小。

2.4 不同类型读者的借阅量分析

由于该校是一所以海洋和水产为特色、多学科协调发展的综合性大学,现有全日制本科生、研究生、留学生3.1万余人,在所有读者种,本科生利用馆藏的纸质文献是最多的,占所有借阅图书数据的93.8%左右,其次是教职工,占3.5%左右,研究生读者数量较少,占2.7%,由于本科生人数较多,且兴趣爱好广泛,在校期间主要目标是完成学业所需的科目,学习专业知识,参与科研项目的学生不多,几乎没什么科研任务,与专业相关知识的学习难度低,深度较浅,相对于研究生和教职工来说,他们的检索能力不高,对电子书和数据库的利用率较低,因此,以治本图书为主要知识获取对象[3];相反,硕、博研究生和教职工多利用电子资源查找资料,对图书馆纸本图书的利用需求相对较少。

3 提高高校图书馆读者对纸本图书利用率的建议

3.1 优化馆藏结构,激发读者的阅读兴趣

第一、图书馆馆藏应根据适应学校发展需求,动态调整馆藏结构,以适应学校的发展,对于借阅比例高于馆藏比例的图书,由于师生的需求量较大,借阅量高,应增加该类图书的采购量,特别是丰富文学经典图书馆藏,满足学生对文学类图书的渴求;相反,借阅比例远小于馆藏比例的图书,应在丰富图书种数的同时,减少图书副本量,有计划的做好图书剔旧工作,对于计算机类图书,根据其更新速度快,图书价格高等特点,应加强对该类书籍的调研,既要满足学生对新技术的需求,又要突出重点,保障经典书籍的供给,进而提高该类图书的利用率。

3.2 加快信息化建设,更好的为读者服务

信息技术对图书馆管理、服务及其馆员的影响是深远的,随着数字化技术和网络技术的发展,图书馆将成为高度发达的信息集散地,图书馆必然将朝着“数字化图书馆”的方向发展[4]。图书馆在前进的过程中应引进先进的技术和设备,使读者通过各种移动设备(如手机、掌上电脑等)方便灵活的进行图书信息查询、浏览和获取图书信息服务。另外,可引进智能自动借还书功能的、自动化水平高的设备,开发或引入可供读者利用手机微信等看书、预约、借还书、自动推荐新书等功能的软件,提高我馆的办事效率和自动化水平,更好的为全校师生服务。

3.3合理巧妙利用网络媒体,主动适应高校阅读模式的转变,做好导读工作。

随着互联网的新媒体层出不穷,异彩纷呈,各种数字化阅读设备日益便捷,大学生阅读模式也在发生着改变,纸本阅读日渐减少,网络阅读比重增大,“浅阅读”和“泛阅读”逐渐成为潮流[5]。因此,高校图书馆是学校的文献信息中心,承担着为高校的教学和科研服务的重任,除了做好馆藏建设等工作外,还应通过多种方式开展阅读辅导,帮助读者提高阅读的兴趣,增强阅读的系统性和有序性,引导读者阅读倾向,提高阅读效率。第一、开展灵活多样的适合年轻大学生的读书活动,如读书沙龙、读书活动月、真人图书馆等;第二、建立网络阅读导航服务,建立高校图书馆与学生互动的网络系统,引导学生研读名著、主动屏蔽网络媒体新闻传播缺陷,鼓励大家多读书、读好书;第三、鉴于网络的浅层次阅读无法替代书本的深层次阅读, 传统阅读更利于人们的抽象思维,图书馆有义务大力倡导本馆读者对图书深层次阅读的工作。

参考文献:

[1]李冬梅.图书馆利用率的ARMA模型构建与预测实证分析.图书馆理论与实践,2011,9:16-18

[2]吴春红.中文纸质图书馆藏评价―以河南理工大学为例.情报探索, 2015,209(3):99-103

[3]杨军花,聂江城,王刚.用户利用高校图书馆馆藏资源分析及对策研究―以南开大学图书馆借阅统计为例.图书馆工作与研究,2011,183:66-70

[4]李胜利.当代大学生期刊阅读倾向的实证研究.案例研究,2011,24(2):164-165

篇10

伴随着课程改革的实施,如何提升实际教学效果和学生的学科素养、优化教育流程、有效的传授知识内容、合理的训练学科能力、恰当的传授思想方法成为了一个重要的课题。“教”与“学”之间的相辅相成,对实际学情的理解和分析,因材施教,适时调整策略并进行针对性教学,是实现学科知识、学科能力和学科方法目标的必经之途。把握教育教学的有效性与长效性,促进学生的多元化发展、培养创新意识,塑造高素质人才则是教育教学的必然之由。

关键词:计量数据 历史知识结构 历史学科能力 历史学科素养 教学策略

中图分类号:G630

引言:

对于高三教育教学和备考复习而言,如何有效的讲授知识内容结构、如何合理的训练学科能力、如何恰当的传授思想方法、如何培养和提升学科素养是一个多解的命题。要实现这四个角度的教学目标,切实培养学生的学科素质,促进学生的多元化和全面性发展,优化教育效果,提升教学的有效性,那么实事求是的理解学情、科学规范的训练、及时调整教师“教”与学生“学”之间的差距,是一个不得不面对的技术问题。

在下文中,笔者不揣浅陋,拟就如何有效利用计量统计数据分析学情和调整教学策略的话题略呈管见,希冀能抛砖引玉,敬请方家指正。

维度一:科学规范的命制试题

没有教育科学就没有科学的教育,没有规范的学科训练就没有规范的学科思维。规范的训练可以通过多种途径来实现,比如课堂教学、研究型学习、史料研读及遗址考察等,但是最简单而且教学中使用最多的还是试题测试。科学的试题、科学的测试、科学的训练对学生的历史学科能力训练和历史学科规范及学科素养的提高是非常有帮助的。

命制科学规范的试题可以建构一个计量统计的模型,以分析学情和调整教学策略,能更好的实现教学目标。

如何才能命制一套较为科学和规范的试题?这不仅需要了解测量技术的相关问题,还需较为深厚的历史学科专业知识,除此之外,教育经验和教材的熟悉度也是很重要的一个因素。

一般来讲,一套试题从结构上需要体现以下几个考察的方向:学科基本知识、学科基本能力、学科素养的体现。而学科方法则是沟通上述三个角度的桥梁。

从历史学科基本知识角度讲:内容应该包含高考考察的七个结构模块,即古代中国、近代中国、现代中国、古希腊罗马、近代世界、现代世界及选修模块。从历史学科能力角度讲:文科综合能力“考试大纲”将历史学科的高考考核目标表述为获取和解读信息、调动和运用知识、描述和阐释事物、论证和探讨问题四个能力要求①。具体来讲包括再认再现历史知识、重构历史时序、获取有效历史信息、理解分析历史事物、运用历史方法论证、评价历史问题。历史学科素养则是如何应运历史知识发现新问题、研究新问题、解决新问题的灵活体现,是创新意识培养的必然内核。培养素养“要关注知识的消化,关注它是不是发生了有益于吸收、转化为有益于生命的酶化”。②“把死知识变活,把活知识变灵”③是知识酶化的主要目的。

规范的命制试题后,设计测试的双向细目表,建立一个完整的测评模型后便可指导解决实际教学中有效利用计量统计数据分析学情和调整教策略的问题了。

下文,笔者拟就操作中的实例来讲述具体过程,以期抛砖引玉。在模型样本选取上,将本年级文科班分成程度好和程度一般两类。以较好的为参照系,在程度一般的学生中进行测评和策略检验,找出规律并进行验证。

维度二:利用分数段分布的统计数据分析学情以调整策略

下图为分数段数据,来源于分组中程度一般的学生。测试后将数据做出统计,结合数据分析学情,调整策略,矫正教学。

分数段分布数据可知如下学情:分数段的分布百分比可确定学生的层次、明晰学生是属于基本史实掌握不牢固的“知识型不足”,还是史学能力不到位的“技能型不足”;确定教学中重能力还是抓基础的后续教学重心、调整教学内容的难易度与深浅度。

上图所示,中间分数段的学生人数较多,反映出大多学生对于基础知识和主干知识的记忆和理解比较好,可继续加强和保持效果,确保不出现知识型问题。但非主干知识掌握不牢,如:课本小字部分(即自学内容)、非重点内容。

高分段人数较少,反映出技能型不足的问题。表现为运用历史方法论证、评价历史问题能力不足和逻辑思辨能力、史学理论方面存在欠缺。通过试卷作答细化分析发现语言阅读能力和理解能力不足及规范答题能力欠缺。

根据学生的情况和数据分析采取如下策略:为了能提高高分段人数比重,调整教学难度和深度,通过课本知识的延伸与拓展,扩大学生的知识容量和理论储备,关注史学研究的新成果,以专题讲座的形式讲解技能与方法,以提升学生表现出来的能力欠缺。指导和训练答题技巧,训练其在作答过程中语言简明、清晰、严密、要点化、序号化的能力。

在下阶段训练跟踪并在同一模型与难度下测试,如图所示:

数据统计后,发现效果较明显。中间分数段的学生人数百分比稳中有升,高分段人数明显增多,运用历史方法论证、评价历史问题能力和逻辑思辨能力、史学理论方面存在欠缺等技能型不足的问题得到修正。

维度三:利用能力结构得分统计数据分析学情以调整策略

、针对此问题调整策略,借鉴语文方法,训练学生语言能力,如找准关键词、对有效信息的提炼和概括、历史要素与关键词的关系,题干限定语的查找等。训练学生的逻辑分析能力,提高学生对历史名词内涵与外延的准确理解度,强化学生的逻辑思考习惯,训练其推理、判断、论证的能力。系统讲授历史学科方法与理论,如历史唯物论、辩证法、现代化史观、全球史观、文明史观、社会史观、生态史观;树立学生结合时代特征分析历史的思维、史论结合及生产力标准等论证和评价历史的方法。对学生数据进行统计与分析,进行逐个训练与指导。

在下阶段训练跟踪并在同一模型与难度下测试,数据统计后,发现效果较明显。如上图所示,样本学生中获取有效历史信息和运用历史方法论证、评价历史问题两个方面的不足得到修正,进步明显。

维度四:利用知识结构统计数据分析学情以调整策略

知识结构的统计分析,可知道学生哪些知识掌握的不到位,以便及时查漏补缺。由于知识模块范围太大,在具体分析的时候可以结合双向细目表及各小题得分率仔细分析,准确找到薄弱环节,再结合能力结构统计数据,分析是知识型问题还是能力型问题,以便更好的掌握学情。

上图所示,样本学生在“古代中国史”和“现代中国史”两个方面存在不足。针对此问题,查找薄弱环节,详尽分析,调整应对策略,对相关知识进行补充和加强,如古代经济,古代科技等。理清中国古代史的时代特点及线索和发展脉络,按通史时序梳理知识。现代中国史教学中注重时政与历史的关联,补充中国现代史中文化、教育、科技等相关内容。利用对世界史的知识优势,将中国史与世界史交叉起来,通过中外关联与对比,来加深理解。对基础知识进行再强化,加深知识的理解程度与深刻性。

在下阶段训练跟踪并在同一模型与难度下测试,数据统计后,发现效果较明显。如上图所示,样本学生中“古代中国史”和 “现代中国史”两个方面的不足得到修正,进步明显,超过了参照系的学生。

五:结语:

课程改革实施下如何提升教学效果和学生的学科素养,优化教育流程,有效传授知识、合理训练学科能力、恰当传授思想方法,培养学生的学科规范和学科素养、传授技巧和思维方法、挖掘和熟练教材、夯实主干知识的根基、关注史学研究动态、渗透史学研究的理论和方法、广泛学习和借鉴、科学的训练、多元的思考、重视培养学生能力和史学素质可能是一个必须面对的话题。“教”与“学”之间的相辅相成,对实际学情的理解和分析,因材施教,适时调整策略并进行针对性教学,是实现学科知识、学科能力和学科方法目标的必经之途。把握教育教学的有效性与长效性,促进学生的多元化发展、培养创新意识,塑造高素质人才则是教育教学的必然之由。

引注:

①《2013年文科・课程标准实验版・考试说明(考试大纲)》