评价模型范文
时间:2023-03-16 07:52:36
导语:如何才能写好一篇评价模型,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
【关键词】评分模型 评价指标
如果把业务上的二分类问题(例如信用评分中的“好”与“坏”、“拒绝”与“接受”)从统计角度理解,都在于寻找一个分类器(classifier),这个分类器可能是logistic模型,也可以是多元判别模型(Edward Altman1968年发展的基于财务指标建立的企业破产识别z得分模型),还可以使其它复杂形式的模型。
一、ROC曲线
ROC,英文全称Receiver Operating Curve,翻译成中文,简称受试者工作特征曲线。其在统计实务中应用甚广,尤其应用于处理医学研究中的“正常组”和“异常组”区分建模问题,用于评价分类模型的表现能力。
(一)ROC曲线原理。
要说清楚ROC曲线的原理,我们从一个简单的分类实例问题说起。假如我们有了基于商业银行企业贷款数据建立违约-非违约的业务分类模型,比如说我们是预测的所有样本的违约概率或者信用评级得分,比如信用评级得分,我们获得了关于两类样本的分布图形:
图 3.1 两类样本的违约率经验分布
1.基本假设
上面的图例可以看成一个基于银行债务人违约率分类的分类器。左边的分布表示历史样本数据中违约者预测得到的违约率的分布;右边的分布相应表示非违约者的分布,其中C点表示决策者做出决断的切分点(cutoff),对于该点有这样的经济意义:一旦我们确定了C点,不考虑其他业务处理,的样本被预测为违约者,反之被预测为非谓语这。对于一个固定的Cutoff点,我们可得到一些有实际意义的量化指标:
HR(C)=,表示在C点左边,对Defaulters的信用得分分布中,基于C点做决策时候,被正确命中的比率,这里H(C)表示被正确预测的违约者的样本个数,ND表示违约样本的总数。
HR(C)=,表示在C点左边,对non-Defaulters的信用得分分布中,基于C点做决策时候,被错误预测的比率,这里F(C)表示被错误预测的违约者的样本个数,NND表示非违约样本的总数。
2.ROC绘制方法
很显然,当我们移动C点的时候,我们得到了一个二维坐标点的集合,FAR(C),HR(RC)|C?缀信用得分区间}这里的FAR(C),HR(C)是风险管理领域的专用表示方法。将其用统计中的一些概念进行一般化处理,得到:FD(C)==,表示在C点左边违约样本个数,FD(C)表示在C点违约者信用得分的累积概率;FND(C)=FAR(C)则相应表示非违约者信用得分的累积概率;同样我们可得到二维坐标集合{FND(C),(C)|C?缀信用得分区间}。
我们将{FND(C),(C)|C?缀}在xy坐标平面上绘制,就得到了ROC曲线。
(二)ROC曲线与其他评价指标间关系。
1.K-S统计量
图 3.2 ROC曲线切线—K-S统计量
K-S检验,用于检验样本是否来自一个指定的分布或者检验两类样本是否同分布(独立)。对上述例子,两样本分布独立性的检验常用K-S统计量:
D=MAX|FD(S)-FD(S)|,这里为了符合常识,我们用表示变量得分。
2.GINI系数/AR(accuracy rate)准确率
GINI系数和AR(accuracy rate)准确率实际上是同一个东西,GINI系数这一称呼不知道来源于哪,倒是AR(accuracy rate)准确率这一术语常常在金融风险管理中出现。它的计算方法是:ROC曲线和对角线之间的面积与perfect model(y=1直线)和对角线(y=x)围成的面积之比,用于度量模型精确性的一个相对指标。
AR=■,这里表示ROC曲线与对角线围成的面积,αpD表示y=1直线与对角线围成的面积。很容易计算:AR=2AUC-1。
3.LR(似然比)
考虑ROC曲线上的导数,很显然由这个关系式,我们得到在ROC曲线上某点的似然比(可以直接理解成得分的好坏比)为该点的导数,这一指标可以刻画模型局部的区分能力。
二、CAP曲线
CAP曲线,亦称能力曲线,被各大银行和评级机构用于对违约率(PD)类模型的检验,它检验模型的预测结果排序能力。
我们依然以上面信用评分模型为例子,能力曲线的绘制通过以下步骤得到:
1.对已经评分的银行客户按其预测的违约概率从高到低排序;
2.横坐标表示客户按违约率概率从高到低排序后得到样本总数的累计百分比,纵坐标表示违约客户总数的累计百分比;
3.曲线上任何一点的坐标具有如下意义:表示给定所有排序后客户样本的一个比例;表示在给定的条件下,违约客户概率大于等于比例的客户中最小概率样本个数占总的违约客户样本总数的比率。
很显然,对于任何水平方向的数值,曲线越高,表明模型的预测能力越强。
篇2
[关键词] 城市品牌 模糊综合评价 层次分析法
中国城市已经进入品牌时代,品牌正在成为一个城市最重要的价值资源。城市品牌对于、对于投资者、旅游者、置业者的感召力日益增强,并成为提高城市的竞争力,实现又好又快发展的重要动力。因此,如何更好地建立城市品牌、管理城市品牌、推介城市品牌、经营城市品牌和创新城市品牌,已经成为城市决策者的重要任务,同时也给相关理论和城市品牌方面的课题研究提出了更高的要求。通过建立城市品牌测评体系和综合评价模型,可以科学量化地评估和比较城市品牌价值,在此基础上,城市管理的决策者可以通过采取更有针对性的措施提升品牌价值,以期形成更高的城市品牌的社会评价。
一、城市品牌基本构成体系分析
所谓品牌,是指给拥有者带来溢价、产生增值的一种无形的资产,它的载体是用以和其他竞争者的产品或劳务相区分的名称、术语、象征、记号或者设计及其组合。增值的源泉来自于消费者心智中形成的关于其载体的印象。品牌本身是一个复杂的识别系统,它应该是由品牌属性、利益、价值、文化、个性和用户这六个层次构成的一个体系。将品牌概念引入城市形象建设,对城市进行品牌化管理是营销研究深化的一个重要标志。正如营销大师菲利普?科特勒所指出:广告、促销等手段已无法应对当今的全球城市竞争,要实现城市营销的多元目标,包括树立积极、正面的形象以吸引企业、投资、游客、高素质的居民、公共机构、重要活动以及开拓出口市场等等,就必须采用战略营销规划工具,必须进行自觉的品牌建设和管理。
城市品牌是蕴含城市独特个性及受众效用的城市名称和标志,是构成城市的各种因素之总和在城市公众心目中的总体印象和实际评价,是城市性质、功能和文明的外在表现。关于城市品牌的基本构成体系,一个全面的城市品牌评价系统应由城市品牌属性、利益、价值、文化、个性和用户这六个基本方面构成。其中:
1.属性:品牌代表着特定的商品属性,属性是消费者判断是否接受商品的第一要素。对于城市品牌来说,则是它所反映出来的一个城市的基本面貌,如:城市规模、生活水平、工作效率等。
2.利益:品牌利益在很大程度上受制于品牌属性,而属性需要转换成品牌消费者功能和情感利益。也就是指一个城市对投资者、游客和其他潜在客户所能够带来的各种利益,如:良好的投资环境、完善的公共配套设施、便利的交通条件等。
3.价值:品牌还体现了拥有者的某些价值观。体现在一个城市的诚信建设、安全状况、产品质量等方面。
4.文化:品牌也象征了一定的文化。品牌中所蕴含的文化是使品牌得到市场认可的重要因素。对于一个城市而言,文化主要是指历史文化脉络以及能够凝练反映城市传统特征的文化特色方面。
5.个性:不同的品牌会使人们产生不同的品牌个性联想。品牌还代表了一定的个性。这在品牌方面主要是指一个城市的特色。
6.用户:品牌暗示了购买或使用产品的消费者类型。城市品牌用户体现的是城市对某些特定人群的吸引力。
二、运用模糊评价与IAHP进行城市品牌测评
城市品牌测评是要将品牌基础理论研究的最新成果与我国城市发展的现状及国际化方向相结合,科学制定城市品牌评价指标体系,旨在对我国城市品牌测评体系进行系统研究。基本思路是:第一,在品牌基本构成层次的基础上,对各级城市的相关要素进行确定并量化;第二、综合利用模糊评价原理与层次分析法(IAHP),建立了我国城市品牌的评价指标体系和评价模型;第三、对样本城市品牌进行测评,为城市决策者提供相应的对策建议。
对于城市品牌状况,其影响因素具有极大的复杂性,精确化能力的降低造成对系统描述的模糊性,运用模糊手段来处理模糊性问题,将会使评价结果更真实、更合理。模糊综合评价模型的建立须经过以下步骤:模糊综合评估的数学原理,首先考虑到影响城市品牌的量的确定是模糊的,也就是在确定了城市品牌能力指标体系之后对各因素指标标准首先不做定量处理。而是由评估专家对各因素指标标准进行模糊选择,然后统计出专家群体对评估因素指标体系的选择结果,再按照所建立的数学模型进行最后计算。模糊评估法的基本过程就是先从定性的模糊选择入手,然后通过模糊变换原理进行运算取得结果。
指标体系的构建,首先根据对影响城市品牌因素的分析,综合地反映城市品牌的各项指标,利用层次分析法,从品牌属性、利益、价值、文化、个性和用户等六个方面来构建城市品牌评价指标体系。
1.建立模糊评价矩阵R
(1)依据综合评价指标体系,设立评价指标集A,一级评价指标,其中,分别为:属性、利益、价值、文化、个性和用户。二级评价指标,其中i=1,2,……,n,n为一级指标数,j为一级指标Ai含有的指标数。
(2)确定评语集
评语集是对各种指标作出可能结果的集合,可请专家进行评估定级。我们根据城市品牌评价的目的。从A到U的模糊关系可以用模糊评价矩阵R来描述:
现在要对若干样本城市分别比较他们的文化、价值、个性、用户、属性和利益。
先成对比较所有样板城市的“文化”因素,根据专家评估定级,得成对比较阵:
经计算,的权向量
对所有样本城市的“价值”、“个性”、“用户”、“属性”、“利益” 因素同样得成对比较阵后,经计算可得其权向量依次为:
2.确定指标权重集K
所谓权重系数是表示某一指标在整个指标体系中具有的重要程度。某种指标越重要,则该指标的权重系数越大,反之,权重系数越小。可以通过专家打分法并运用层次分析法(IAHP)来确定各指标的权重,。
层次分析法(The analytic hierarchy process)简称AHP,是由Thomas L.Staaty 最先发明的用于解决包含多项标准时的复杂问题,在这个过程中,决策者需要判断各项评判标准的重要性、决策变量相对于评判标准的优先极。应用层次分析法可以给出各个标准的权重,各个决策变量相对于每项标准的优先级,量化决策变量,从而为决策提供依据。从心理学观点来看,专家打分法如分级太多会超越人们的判断能力,既增加了作判断的难度,又容易因此而提供虚假数据。Saaty等人还用实验方法比较了在各种不同标度下人们判断结果的正确性,实验结果也表明,采用1-9标度最为合适。对比矩阵如下:
根据判断矩阵,精确地求出 的最大特征根所对应的特征向量。所求特征向量即为各评价因素的重要性排序。归一化后,也就是权数分配。经过计算确定指标权重集为:
3.利用模糊矩阵的合成运算
通过模糊矩阵的合成运算,对样本城市的品牌进行排序。
模糊矩阵的合成运算模型:;其中i为评价指标权重(隶属度)所在列(行),J为样本城市所在列。
同样可以得出其他样本城市的P值,分别为:0.12、0.17、0.25、0.35。
由此可知样本城市的品牌进行的综合排序结果。若以最大值 作为标准,则其他各城市品牌的分数分别为:31分、34分、49分和71分。
总之,城市品牌是一个复杂的社会识别系统,在全面建设小康社会、加快推进社会主义现代化的发展阶段,在城市化进程和城市间竞争日益激烈和经济全球化背景下,塑造城市品牌已成为城市实现可持续发展的关键。加强对我国城市品牌发育水平的研究,探讨科学的城市发展战略定位,并以此促进我国城市的科学发展和城市的国际化进程,将是每个城市决策者和相关领域的理论研究者所愈来愈关注的问题。
参考文献:
篇3
【关键词】税务文化;评价指标;模型
一、税务文化的概念
税务文化是税务机构和公民组成的特殊文化主体,经过长期的税收实践活动后,逐步积累的物质条件、行为方式、法律制度与价值理念等的总和。根据这个概念,也可以把税务文化进一步细分为税务价值、税务制度、税务行为和税务物质四个部分。税务文化建设水平的高低可以直接或间接地影响我国政治、经济、文化的发展。先进的税务文化在促进税收更加平等与公正;提高税务机关征管水平和促进企业合理进行纳税筹划,降低征纳税成本;提高纳税服务水平,和谐税收征纳关系;提升国家文化软实力与国际形象等方面有着积极作用。
二、评价指标与评判标准的建立
虽然税务文化的评价指标是多元的、模糊的,但本文只采用一级指标,利用模糊数学综合评价方法,建立模糊综合评价模型。如要评价一个具体机构的税务文化建设水平,可以确定税务价值、税务制度、税务行为、税务物质四个指标。在评价指标中,选择排序性的评价等级 “优秀、良好、合格、差”,并给出相应的分值“7分、5分、3分、1分”, 在实践中可根据实际情况改进评判标准,见表1。
三、税务文化评价模型的简单设计与应用
1.由领导者、税务学者、纳税人等30人成立专家评估组,确定税务文化评价的因素集U。该评估组一致假定评价指标集U=(u1,u2,u3,u4)=(税务价值、税务制度、税务行为、税务物质)。
2.评估组一致确定税务文化的评价等级集V=(v1,v2,v3,v4)=(优秀,良好,合格,差)=(7,5,3,1)。并根据实际情况,评估组采用德尔菲法确定各个基本评价指标的权重A=(a1,a2,a3,a4,a5)=(0.2,0.3,0.3,0.2)。
3.求出模糊评价矩阵R和评价结果B。通过参照表1,评估组成员对税务文化的四个基本指标分别作出独立的评判,如表2。
显然,0.203+0.323+0.333+0.14=1,这是最终的评价结果。由此可见,有20.3%的人认为税务文化建设得优秀,32.3%的人认为良好,并以此类推。再按照最大隶属原则,综合确定税务文化建设水平为合格。
四、建立税务文化评价模型的意义
1.为研究税务文化提供一种创新思路。当前已有很多专家学者从宏观、微观层面、税收与经济、社会发展需求等方面对税务文化进行了深入的探讨研究,也提出了相应的税务文化理论,但是很少研究税务文化的评价模型。因此,建立评价模型为进一步研究税务文化提供了一种全新的思路。
2.引导税务文化建设实践活动。为了实现从理论到实践的突破,税务工作者都积极进行着税务文化建设实践活动,但是各级税务机构的建设水平参差不齐,且各地协调合作差,共建力弱,导致发展不均衡,建设效果不明显。如果有一个科学的评价模型就可以评价其建设的质量与效益,找出缺陷,采取相对应改进措施。税务文化评价模型也可以引导纳税人维护自身的合法权益,督促税务机构提高纳税服务水平。
参考文献:
[1]毛云芳,林擎国.现代税收文化内涵及其建设的再探讨[J].税务与经济,2005(1):24-26
[2]陈伟.河南省税务文化评价体系研究[J].河南财政税务高等专科学校学报,2008(8):9-11
篇4
关键词:供应链;绩效评价;指标
国际对供应商的选择研究最早、影响最大的Dickson G.W.,他通过分析170份对采购经理的调查结果,得出了23项供应商绩效评价准则。自Dickson之后,大量学者对供应商选择准则问题进行了广泛的研究。
我国对供应链概念引入较晚,供应链的研究无论从理论还是实践上均处于起步阶段,目前的研究也多是以引入为主。马士华教授等提出了供应链绩效评价的一般性统计指标,包括[1]客户服务、生产与质量、资产管理和成本4个方面;霍佳震教授等针对集成化供应链及其绩效评价问题作了初步探讨和开发。他将供应链视为一个系统,从供应链各个组成要素及各要素之间的关系出发,建立了供应链整体绩效评价体系。该体系[2]由四个部分组成,分别是:供应链整体绩效评价、核心企业绩效评价、供应商绩效评价、零售商绩效评价。每部分给出了对应的评价指标并使用层次分析法进行了分析评价。
一、供应链绩效评价指标体系的构建
供应链不是各节点企业简单的加总,而是节点企业之间相互依赖、相互作用的产物。这些节点企业各自的经营绩效和节点企业之间的协调绩效共同构成了供应链内部绩效,而各节点企业组成的供应链系统对最终顾客提品和服务时所获得的顾客满意程度决定了供应链的外部绩效。
1、各节点企业经营绩效
在供应链中,各个企业所处的地位不同,可能是制造企业,可能是原料供应商或者分销商,这就决定了不同的企业关注的对象也不一样,但是大体上来说,作为供应链上的节点企业的经营者或者所有者,他们比较关注的应该是财务状况,资产运营状况,偿债能力状况和企业的发展创新能力状况,因此本书在参考我国现有的企业绩效评价指标体系的同时,作了进一步删除和丰富,最后的各节点企业经营绩效评价指标如表1所示。
2、节点企业之间协调绩效
许多学者认为供应链管理就是一种平台管理,这也显示出信息共享的重要性。节点企业之问协作绩效,即节点企业之间的联系程度,正是以企业之间的信息共享为基础的。通过上述各节点企业经营绩效评价,我们能判断出单个企业的经营绩效,但是供应链是由多个企业组成,节点企业之间的合作、协调能力和状况对供应链整体的绩效会有非常大的影响。因此,我们对供应链内部进行评价时除了对链条上的节点企业进行评价还要对他们之间的联系程度进行评价,其指标设置如表2所示。
3、顾客满意度
供应链以面向顾客、满足顾客需要为管理核心。同时,供应链上各节点企业的运营绩效及节点企业之间相互影响和相互作用的协调绩效的综合效果只有供应链外部的顾客能够直接的感觉到。因此,供应链外部绩效评价主要侧重于顾客满意度的评价,其评价指标如表3所示。
二、供应链绩效评价指标的量化模型分析
由于在绩效评价指标中,许多指标的数值不能从原始数据中得到,因此需要对指标进行量化分析。量化分析是供应链绩效评价过程的一个重要阶段,本文主要对协调绩效及顾客满意度指标的量化进行研究。
1.节点企业之间的协调绩效评价指标的量化
(1)信息传递速度。这一指标主要从信息在链上的传递速度来反映共享信息的时效。虽然共享的信息很多,但最主要的还是顾客的需求信息。可以考察最靠近顾客的企业A的需求曲线与最远离顾客的企业B的需求曲线的滞后时间。可以分别取两条需求曲线上需求量最大的时间点,,和需求量最低的时间点,两组数值进行比较。则共享信息的传递速度ISV可以量化为:
(2)信息传递的质量。可以主要考察顾客的需求信息在链上的传递情况。即最靠近顾客的企业A的需求曲线与最远离顾客的企业B的需求曲线在数量上的放大。为了简化问题,可以在两条需求曲线上时间段T内分别取最大值Dmaxa,Dmaxb,最小值Dmina,Dminb两组数值,取整个供应链在时间段T内的平均需求量,则共享信息的质量ISQ的量化公式为:
(3)平均参与年数。这一指标主要从构成供应链的企业的参与年数这一角度来反映供应链构成的稳定性。对于供应链核心企业C而言,B的参与一定程度上决定着A的参与,所以B与A的参与年数对供应链的稳定性有不一样的影响,对于A的参与年数应该予以弱化,可以取一个小于1的系数。进行调整。则平均参与年数的量化公式可以表示为:
其他组成结构的供应链的这一指标也可以用此思想类推得到。
(4)平均交易重要性。应该说供应链成员的稳定性与成员之间的业务重要性是相关的,所以引进这样一个指标。以核心企业为出发点,考察其他企业对于核心企业而言的重要性。由于类似指标还不多见,下面举例说明、提出一种量化方法。
设为企业i的类似其与企业j交易的所有交易总额,为i、j双方具体的交易额。其平均的交易重要性(TI)可以表示为:
对于其他类型的供应链,也可以用此方法类推得到平均交易重要性这一指标的数学模型。
2.顾客满意度绩效评价指标的量化
(1)失去销售百分比。失去销售百分比指的是失去销售额与总销售额的比例,这个公式中分子“失去销售额”是量化的难点。参考霍佳震提出的方法,我们可以采用如下的处理方法:用缺货时间与单位时间内平均需求量的乘积来估计失去的销售额,其中计算平均需求量的时间段可选择缺货开始()前和结束()后的各N个交易日。设缺货时间段为TStocko,缺货开始前和结束后的N个交易日内的需求量分别为,
令TS(Total Sales)为在时间段T内已经实现的总销售额,则失去销售百分比为:
(2)客户抱怨比率。客户抱怨比率指的是顾客抱怨次数与总交易次数的比率,这个公式中“总交易次数”可以从销售数据库中得到,“客户抱怨次数”可以通过对企业收到的顾客抱怨次数进行修正而得到。所谓修正,是指将企业收到的抱怨次数乘以一个大于1的系数。这是因为客户并不总是把抱怨反馈给企业。客户抱怨次数可通过客户管理数据库获得;总交易次数则可从销售数据库统计得到。设T时段内的顾客抱怨次数为,总交易次数为,系数为,则客户抱怨率为:
(3)准时交货比率。准时交货比率指的是准时交货次数与总交货次数的比率,这个公式中的两个指标都可以从交货数据中取得,。准时交货次数和总交货次数都可以从交货数据库统计得到。设时段T内准时交货次数为,总交货次数为,则准时交货率为:
(4)产品柔性。产品柔性指的是新产品种类数量与产品种类总量的比例,这个公式中需要说明的是新产品的范围,主要指全新型新产品、换代型新产品、改进型新产品、仿制型新产品。设新品种种类数为,供应链经营的各产品种类数为,则产品柔性PF的计算公式为:
(5)数量柔性。数量柔性指的是可满足的需求与市场需求总量之比。所谓可满足的需求,是指供应链可以提供的产品数量。这个数量是一个区间(,),是保证供应链获利的最小生产量,是供应链以现有规模,能达到的最大的生产数量。设顾客需求D服从的正态分布,且D~N(,)。由供应链的销售数据库可得,
则数量柔性VF的量化公式为:
(6)交货柔性。交货柔性指的是松弛时间与总交货时间之比。霍佳震对此问题有详细的数学模型,这里为了提高评价的易操作性,采用一种简化模型,将整个交货过程看作是一个整体,而不进行分解。所以松弛时间等于平均交货时间L与最短的交货时间的差值。
(7)响应速度。响应速度指的是供应链对顾客需求的平均响应时间。设供应链每次对顾客服务需求的响应时间为,则一定时期了内的平均响应时间为:
3.定性指标的量化
对于定性指标的量化,通常可以采用专家评分法,选择专家对指标进行打分,求得均值将其转化为百分制,便得到各项指标的得分。然后与定性指标一起进行权重分析,从而将定性指标量化并带入供应链绩效评价模型中去。
三、应用分析
下面以某第三方物流公司所在的供应链为例来说明供应链绩效评价的方法。
1.明确评价指标体系
根据本文前面提到的建立绩效评价指标体系的要求,可以建立指标体系如表4所示。
表4: 某物流公司供应链绩效评价指标体系
2.无量纲处理
无量纲处理,也即对评价指标数值的标准化、正规化处理、它是通过一定的数学变换来消除指标量纲影响的方法,只把性质、量纲各异的指标转化为可以进行综合评价的一个相对数――量化值,下面以准时交货率为例计算无量纲处理的过程。
首先判定准时交货率属于正指标类型,最大值为1,最小值为0,则对=0.2222进行无量纲处理的结果为:
同理,可以得到:
同样的道理可以得到其他指标无量纲处理后的结果:
表5: 整体绩效评价指标的无量纲处理
接下来可以求得各指标的权数:
表6:各指标的权数
作者单位:山东建筑大学商学院
参考文献:
[1] 马士华,林勇,陈志祥.供应链管理[M].北京:机械工业出版社,2000.342-376.
[2] 霍佳震.企业评价创新-集成化供应链绩效及其评价[M].河北人民出版社,2001.10-15.
篇5
关键词:审计信息;评价;可靠性;研究
中图分类号:F239.1 文献标识码:A 文章编号:1001-828X(2013)10-0-02
审计信息是具有不确定性的,在审计实务中只是其中的一部分事项是完全确定的。从时间角度来说,未来的事都是不确定的,并且现在和过去的事也不一定是完全确定的,主要是因为这其中还存在博弈造成的信息不对称或知识能力不够而形成的信息缺位,审计实务中不确定性事项所占的比例是比较高的。审计信息的不确定性包括引起审计结论不确定性的因素。不确定性是会计信息的负量度,减少不确定性有助于相关决策者的决策以及资本市场的有效运行。审计的不确定性存在降低了审计信息使用的有效性,使决策相关者在依据所获取的审计信息作出评价和决策时受到限制。将审计信息不确定性降至最低是审计风险控制的重要措施之一。
一、审计抽样信息的不确定性
审计职能的作用在信息传递领域中有两个方面:第一是评价原始数据的客观性,第二是评价所得信息的公允性。
现代审计已经普遍发展为一种抽样审计,而不再是原始的详细审计。抽样便意味着由此及彼的推断,而推断本身便是包含着不确定性,推断不代表确证,只能表明有理由相信。因而审计抽样也是不确定性的一个重要来源。审计抽样是指从审计规模中按科学的统计方式抽取部分样本进行审查,根据样本审查的结果推断审计总体特征。无论样本的设计和审查怎么科学,根据部分样本结果推断的总体特涨,样本特征与总体的实际情况之间不可避免是有差异的,这就是抽样风险,也叫抽样风险,即样本特征不能代表总体特征的可能性。为了使审计抽样能得出客观公正的审计结论,首先要求审计人员在抽样时所选择的样本,应该具有代表总体的性质。审计抽样技术被广泛运用于符合性测试和实质性测试,该项技术的使用虽然降低了审计成本,可是其存在一个必然的缺陷,即忽略未被抽中的样本中可能存在的问题。
审计抽样中抽样风险的客观存在以及风险类型出现的可能性,因而我们在对源信息进行加工处理的过程中又增加了新的不确定性,而这种不确定性最后很有可能传递给宿信息,增加宿信息的不确定性,从而影响到审计信息质量。
那么我们怎样对这种可靠性进行评价?把香农信息熵引入审计抽样,这样就可以进一步评价风险导向审计抽样的充分性和可靠性。
二、香农信息论和香农熵
1.“信息论”或者称为“通信的数学理论”,是研究信息的传输、存储和处理的科学。信息论研究的主要问题是在通信系统设计中如何实现信息传输的有效性和可靠性。这就和审计信息系统不谋而合,在抽样审计中,抽取的样本信息是否可以有效、可靠的代表整体信息。
各种通信系统(包括存储系统),如电话、电报、图像、计算机、导航、雷达乃至生物系统,虽然他们的形式和用途各不相同,但从信息传输、存储和处理的角度来看,本质上有许多共同之处。对有收发两端的单项传信系统,一般可以概括为图1.1所示的模型:
香农信息论的基本任务是为设计有效而可靠的通信系统提供理论依据。通信的基本目的是在接收端精确的或以给定的失真度重现信源的输出。
信息论研究的另一个主要问题是信道编码问题。它和信源编码问题类似,但它不是研究最有效地表示信源输出的,而是研究在保证信息传输可靠性(如错误概率小于给定值)的条件下最有效地利用信道的传信能力的。设送入信道的信息速率为R,信道容量为C,信道编码基本定理告诉我们,若RC则不可能。这是信道编码和“可行性”问题。信道编码的另一个问题是寻找实际可行的编、译码方法。
香农信息论最大的特点是将概率统计的观点和方法引入到通信理论研究中,揭示了通信系统中传送的对象是信息,并对信息给出科学的、定量的描述。
2.相关概念
(1)熵和条件熵
信息量是信息论中量度信息多少的一个物理量。它从量上反映具有确定概率的事件发生时所传递的信息。一个事件的发生情况可以归结为三类:①在一定条件下必然要发生的事件,比如审计业务,根据证监会相关规定,只要是上市公司,必须经过注册会计师审计鉴证,出具审计意见,这些无论哪个上市公司每年必须要做的事情,其发生的概率为1;②在一定条件下必然不会发生的事件,事情发生的概率为0;③在相同条件下,可能发生也可能不发生的事件是随机事件,例如抽样审计过程中的样本抽取,可能抽取到具有代表性的样本信息,也可能抽取到不具有代表的样本,根据这些样本的特征可能得出错误的审计意见。事件发生的可能性程度,可以用发生的概率来描述:事件发生的可能性越小,则事件发生的概率就越小。人们估计它是否发生的困难程度就越大,不确定性就越大;反之,则事件发生的概率就越大,人们估计它发生的可能性就越大,不确定性就越小。事件中的信息量与事件发生的概率密切相关:事件出现的概率越小,则事件中包含的信息量就越大,就存在很多不确定性;如果事件是必然的,即发生的概率为1,则它传递的信息量应为零,就不存在不确定性;如果事件是不可能(概率为0),则它将有无穷的信息量。因此,从这一点出发,信息论利用统计热力学中熵的概念,建立了对信息的量度方法。1948年,香农把波尔兹曼关于熵的概念引入信息论中,把熵作为一个随机事件的不确定性的量度。
对于概率空间{X,Q(x)}中事件x的自信息量就是定义在这个概率空间上的一个随机变量函数,它是概率分布的函数。此随机变量函数的每个特定取值I(x)就是某一特定事件x的自信息量。由此可定义平均自信息量。
集{X,Q(x)}上定义的自信息量I(x)的数学期望
集X的平均自信息量,又称作集X的信息熵,简称熵。
集X的平均自信息量表示集X中事件出现的平均不确定性,即为了确定集X中出现一个事件平均所需的信息量(观测之前),或集X中每出现—事件平均给出的信息量(观测之后)。
在事件个数相同条件下,事件等概出现的情况下集的熵值最大。条件自信息量
是集{(X,Y),P(X,Y) }上的随机变量。由此可类似地得出条件平均自信息量
称作是给定y Y条件下,集X的条件熵。而H(X)又可看作是集{Y,}上的随机变量。
定义在集{Y,}上的随机变量H(X )的数学期望
称作是集X相对与集Y的条件熵。
若有两个符号为Xi,Yj同时出现,可用联合概率P(Xi,Yj)来表示,这时的自信息量为,当Xi和Yj相互独立时,有 ,那么就有
若两个符号的出现不是独立的,而是有相互联系的,则可用条件概率P(Xi/Yj)来表示,即在符号Yj出现的条件下,符号Xi发生的条件概率,这样它的条件自信息量可定义为条件概率对应的负值:
上式表示在给定Yj条件下,符号Xi出现时收信者得到的信息量,因为
,则有
即符号Xi,Yj同时出现的信息量等于Yj出现的信息量加上Yj出现后再出现Xi的信息量。
(2)互信息
X是信源发出的离散符号集合,Y是信宿收到的符号集合。由于信宿事先不知道信源在某一时刻发出的是哪一个符号,所以每一个符号消息是一个随机事件。信源发出信号,通过有干扰的信道传递给信宿。通常信宿可以预先知道信息X发出的各个符号消息的集合,以及他们的概率分布,即欲知信源X的先验概率P(xi),当信宿收到一个符号消息yi后,信宿可以计算信源各消息的条件概率p(xi/yi),y=1,2,……,N,这种条件概率称为后验概率。互信息量定义为后验概率与先验概率比值的对数,即
由于无法确定和的大小关系,所以不一定大于或等于零。互信息量在X集上的统计平均值
平均互信息量为上述为在Y集合上的概率加权统计平均值,即
三、在审计抽样中引入信息传递指标
在信息论中,一般用保真度或保真度的补数——错失率这两个指标来评价一般信息系统传递信息的可靠程度或失真程度,我们也将这两个指标引入审计抽样的评价中,以评价审计抽样信息的客观性和公允性。
在审计抽样过程中,信道实际传送的审计抽样信息量,即用互信息表示的样本信息量I(X;Y)和从整体样本信息量H(X)之比,称为样本信息源的保真度:
而把上述实际抽取的样本信息量与审计抽样结果所需要的整体样本信息量H(Y)之比,称为相关抽样审计信宿的保真度:
在审计抽样过程中,经信道(审计抽样技术)传递的信源信息有所损失。我们把从审计抽样样本与需要抽取的样本信息量,即用条件熵 表示误审信息量与从整体样本信息量H(X)之比,称为相关审计抽样样本的错失率:
而把审计抽样结果需要的信息源中没有被抽到的样本信息量,即用条件熵表示漏掉的审计样本信息量与审计抽样结果所需要的整体样本信息量H(Y)之比,称为有关审计抽样信息信宿的错失率:
以上所述的信息熵、条件熵、互信息之间的关系:
可以推出:
因此,保真度与错失率互为补数关系。
四、用信息熵评价抽样审计信息的客观性和公允性
经融风暴之后,各种风险越来越复杂化,审计风险引起审计理论研究和资本市场的重视,审计的价值在于确认和鉴证投资者和经营者之间的关系,是将信息风险社会化的过程。建立在“信息论”理论上的注册会计师、经营者和投资者三方关系则能够对社会责任观所导致的审计信息的变化作出更合理的解释。投资者的信息需求是审计三方关系的核心,正是由于投资者对较高质量审计对象信息的需求,才有了提高审计对象信息客观性的审计报告的需要。作为审计业务的创造者和审计信息的使用者,投资者的信息质量需求决定了审计对象和报告内容,进而对审计风险产生影响。
降低信息使用风险为注册会计师开展业务提供了理论依据,也使注册会计师更加关注查错纠弊。如果要更好地达到审计目标,注册会计师肯定关注审计风险,采用新的审计模式来识别和评估审计风险。降低信息使用风险,是因为信息的使用者在进行相关决策时所使用的信息是由第三方提供的,由于信息提供者和信息使用者的利益目标存在不一致,从自身利益的角度出发,信息提供者在提供信息时就有可能偏向于自己一方,使得信息中存在信息风险;而作为信息的使用者在利用信息提供者提供的信息进行决策时,要保证决策的客观性,就必须通过科学的途径来降低或消除信息使用风险。
针对审计信息评价的方法,建立在“信息论”基础上,在审计信息形成的过程中评价审计信息的质量,使得具有高质量的审计报告产生成为可能。
参考文献:
[1]汪浩瀚.不确定性理论:现代宏观经济分析的基石[J].财经研究,2002(l2):30-36.
[2]余成波.信息论与编码[M].重庆:重庆大学出版社,2005,7.
[3]吴伟陵.信息处理与编码[M].北京:人们邮电出版社,2003,7.
[4]崔孟修.审计动因论的修正.审计研究,2006,5.
篇6
关键词:知识资本 模糊综合评判 层次分析法
1、引言
随着经济的全球化运作和信息技术的高速发展,国际竞争环境变化的频度在不断的加强,企业间竞争的激烈程度的也不断加深,知识成为企业获取竞争优势的重要资源,无论是大型企业还是中小企业都必须加强对企业内外部知识的收集和创新,来提高企业自身的知识含量,使企业加快向知识型企业转变。知识型企业将企业的知识资本经营运作作为主要活动,重视企业的创新活动,知识资本成为知识型企业的核心资本形态。知识资本成为企业在快速变化的环境中寻求发展所依赖的关键性资源,是知识型企业得以延续和创造价值的动力源泉。人们越来越意识到知识资本对社会经济和企业发展的重要性,如何评估和衡量知识资本引起了众多学者、企业和研究机构的重视。本文针对知识资本的评价特点,认为适合采用多层次模糊综合评价法来对企业知识资本进行评估。
2、企业知识资本评价指标体系的构建
现代西方经济理论中对于知识资本理解的侧重点不同,对知识资本的构成也有不同的观点斯图尔特(T・Stewart)提出了知识资本的H-S-C结构,指出知识资本的价值体现在人力资本、结构性资本和顾客资本三者之中;范徵认为知识资本由人力资本、组织资本、技术资本、市场资本和社会资本五大方面构成;姚丽琼等认为,知识资本是知识在一定条件下转化而成,是企业在其生产经营及其管理活动中所积累起来的最具有价值增量的预付价值,由人力资本、技术资本、管理资本、市场资本和顾客资本五部分构成。
基于以上理论研究,根据指标选取的科学性原则、可测性原则、敏感性原则、完整性原则和定性与定量相结合的原则,本文从知识系统、结构资本、人力资本、技术资本和市场资本五个方面来对企业知识资本进行研究,具体见表1。
3、知识资本的评价方法
本文对知识型企业知识资本的综合评价采用多级模糊综合评判方法,它是将模糊综合评判法与层次分析法相结合,能够较好地处理多因素、模糊性和主观性较大的问题。对定性分析指标采用专家调查与模糊统计相结合的方法,对定量分析指标的处理则引入模糊数学的方法,从而实现了定性指标与定量指标的结合。
3.1 确定评价指标的权重
本论文采用层次分析法(AHP)确定指标权重,即各指标的相对重要程度,综合专家意见得出权重值。层次分析法AHP是由美国学者萨提(Saaty)提出的一种运筹学方法,它可将人们的主观判断量化,是一种简便而又实用的决策方法。具体步骤如下:
(1)建立层次结构模型。
(2)构造两两比较判断矩阵。第二层因素两两比较重要性,元素i与元素j相比,同等重要、稍重要、明显重要、强烈重要、极端重要时,相对重要性的权数分别为1、3、5、7、9。若元素i与元素j的重要性之比为aij,则元素j与元素i重要性之比为aji=1/aij ,判断矩阵是一个方阵,A=(aij)n×n,aij=ci/cj 。
(3)层次排序。特征向量W=(w1,w2,w3,w4,w5,)T及最大特征值λmax。比较判断矩阵特征向量值,表示同一层次中若干元素对相邻的上一层某一元素的相对重要性排序权重。本文利用一种简单的近似计算法――和法,步骤如下:
a.将判断矩阵A的每一列归一化,得到矩阵B=(bij)n×n,然后按B的行求和,即
,,
b.计算判断矩阵的最大特征向量值 ;
c.一致性检验。首先计算一致性指标CI=(λmax-n)/(n-1),平均随机一致性指标RI可以查表(n=4,RI=0.9;n=5,RI=1.12),然后计算一致性比率CR=CI/RI,当CR
3.2 进行模糊综合评价
所谓模糊综合评判是在模糊环境中,考虑多种因素的影响,根据给出的评价标准和具体的评价值,经过模糊变换后对事物作出评价的方法。多级模糊评判就是先把要评价的某一事物的多种因素,按其属性分为若干类大因素,然后对每一类大因素进行初级的综合评判,最后在对初级评判的结果,进行高一级的综合评价,其评价步骤如下:
(1)确定评价向量评语集和评价矩阵。知识资本水平评价集是有关专家对各个具体的评价指标可能做出的各种评价结果所组成的集合U。本文将知识资本水平的评语集定为:U=(U1,U2,U3,U4,U5)=(高,较高,一般,较低,很低)。通过专家评分法对B1,B2,B3,B4,B5,中的各指标进行评判,得到模糊判断矩阵R,如下:
其中,i=1,2,3,4时,n=4;i=5时,n=5;j=1,2,…,n
(2)计算一级评价向量。设一级模糊综合评价向量为Bi,则有
,i=1,2,3,4,5。
其中,式中的“”表示模糊合成运算。
(3)计算二级评价向量。将Bi=(i=1,…,5)看成一个指标,则R=(B1,B2,B3,B4,B5)T的归一化处理。设二级评价向量为B,则有B=AR=(a1,a2,a3,a4,a5)。
(4)归一化处理。为了便于分析,需要对一级、二级评价向量作归一化处理。记归一化后二级和一般可以根据最大隶属度原则进行风险的判断和分析。
4、知识资本评价模型实证分析
4.1确定评价指标的权重
采取层次分析法来确定知识资本各指标权重,相对于知识资本评价这个总目标层来说,对一级指标内指标进行两两比较,得到相对重要性判断矩阵,并利用AHP法中的和法,得到各指标的相对重要性权重W(特征向量),见表2。
同样方法,可以计算二级指标知识系统的相对重要性判断矩阵,进而得到其相对重要性权重,见表3。结构资本、人力资本、技术资本和市场资本的判断矩阵略,其相对重要性权重分别为:
均通过一致性检验。
,通过一致性检验。
同时,由表2可以看出,该知识型企业知识系统水平指标权重最大,达到40.09%,说明该企业对知识系统的依赖性较强;其次是结构资本,可见该企业的组织管理水平较好。
4.2 进行模糊综合评价
依据上述知识资本风险评价方法,本文对北京市某知识型企业的知识资本风险进行评价和分析。通过有关专家评分得到各二级指标风险的判断矩阵如下:
根据层次分析法确定的各一级指标和个二级指标的权重,可以对企业的知识资本水平进行综合评价。
(1) 对二级因素集做综合评判,用模型 计算,得Bi=Ai・Ri
(i=1,2,…,5)
从该企业知识资本各指标的评价来看,根据模糊数学中的最大隶属度原则,该企业的技术资本达到很高的水平,为30.53%,但是认为技术资本很低的占比也较大,达到15.17%;知识系统和结构资本均达到较高的水平,分别为49.79%和47.26%;人力资本和市场资本处于一般水平。通过以上分析,要提高该企业的综合竞争力,应采取措施提高企业的人力资本和市场资本水平,使企业知识资本各部分得到均衡的发展。
(2) 对一级因素集做综合评判
总评判矩阵R是以B1,B2,B3,B4,B5为行的模糊矩阵,则对该企业知识资本水平的综合评价为:
以上结果表明,该企业知识资本水平为很高的占6.96% 、较高的占41.01%,般的占39.15% 、低的占9.54%,认为水平很低的占3.33%。根据模糊数学中的最大隶属度原则,知识资本水平较高的隶属度最大,达到41.01%,所以,可以认为该企业知识资本综合水平较高。
5、结论
该公司的知识资本综合水平评价为较高水平,但是其人力资本状况和市场资本状况趋于一般水平。结合具体预警评价指标的评价结果:
(1)知识系统状况处于较好水平。知识只有在人们相互交流时才能得到发展,只有通过建立企业内部信息网络,使知识得到共享,企业内部的知识资源才能广泛联系起来。而且,广泛的联系可以促进知识的创新,因此,需要企业建立与外部间的信息网络。
(2)结构资本状况处于较好水平。为了加速企业管理决策的速度,企业必须加快其组织结构的转变速度和人事管理制度的建设工作,进一步提高企业的人事管理水平。
(3)人力资本状况处于一般水平,企业应该关注人力资本的发展。毕竟知识型企业的员工大都是知识型员工,知识型员工一般除了重视物资激励外,更重视精神层面的激励,尤其是自身能力的发挥和个人价值的增值,所以企业应加强对员工培训方面的投入。
(4)技术资本状况处于很好水平。企业应加强科研工作,增强产品的高科技含量,使其具有不可模仿和替代性。同时也要加强对知识产权的保护,提高知识产权的保护意识和管理水平,增加知识产权总量,提升企业的技术创新能力和综合竞争力。
(5)市场资本状况处于一般水平。企业在今后的发展进程中应该逐渐加大对市场资本的培育,壮大企业的市场资本,继续积极地树立企业良好形象。
参考文献:
[1]范徵.知识资本评价指标体系与定量评估模型[J].中国工业经济.2000(9)
[2]张维然,石宏平.知识资本评价模型比较[J] .管理现代化[J] .2001(6)
[3]王兴元,成冰.企业知识资本内涵及其评价研究[J] .科学学与科学技术理.2003(9)
[4]党兴华,李晓梅..知识资本的度量与西部工业知识资本评价[J] .西安理工大学学报.1999
[5]谢季坚,刘承平.模糊数学方法及其应用[M].华中科技大学出版社.2006(8)
[6]姚丽琼.知识及知识资本的测度研究[DB] .西安交通大学硕士学位论文.万方数据入.2002
篇7
关键词:网络教育资源;教育资源评价;评价者信誉;评价模型
中图分类号:G434 文献标志码:B 文章编号:1673-8454(2014)11-0035-04
一、引言
本文的研究范围主要是资源丰富的大型教育网站,其教育资源主要由政府、组织或公司提供。这些网络教育资源突破了传统教育资源在人员、地域、时空上的多重限制,能够提供大量全面的资料,为网络教育的成功提供了必要保障。但研究发现很多教育网站中资源丰富,质量却参差不齐。张京彬、贺志强提出由于缺乏有效的资源优化管理和资源遴选推荐,优秀资源没有被明显标注,从而造成资源发现困难,资源利用率低。[1]例如“国家数字化学习资源中心”资源丰富,共包含195340个媒体资源,涉及24581门课程,但从网站中发现具有相同教育目标或功能的资源很多而资源提供者不同,就犹如淘宝中相同功能的产品或服务很多,此种情况下到底哪个资源是最好的成为用户快速选择的难题。大多数网站对具有相同教育目标或功能的资源或服务通常依据资源或服务的评价结果而进行优劣排序。评价资源可以遴选出优秀资源,促进资源的有序组织及优秀资源的推荐,进而促进优秀资源的利用率及用户学习。尤其对于收费型资源,因为资源一般要付费后才能使用,所以欲购买的用户极其看重已使用者对资源的评价。但研究发现,目前很多教育网站采取的资源评价方法却不能合理有效地反映出资源的真实质量。
网络教育资源的评价主体包括网络教育资源的开发者、使用者、评审者和管理者。[2]因为教育资源的根本服务对象是用户,所以用户的评价一定程度上可以反映出资源的质量。资源投入系统后,大多数网站根据所有用户评分采取平均法的方式评价教育资源。这种方法简单易行但并不一定合理,因为每个用户的评价不一定都是合理的,可能受其他因素影响使其评价与资源的真实质量之间存在较大差距。不合理性主要体现在三个方面:第一,用户作为评价者因自身的知识水平、喜好等差异可能导致对同一个资源的评价差异过大,可信度降低,难以体现评价的可靠性;第二,对于收费型网站,资源的提供者或利益相关机构与人员可能由于利益驱使,使一些用户对资源进行恶评(诋毁或哄抬),这样资源的真实质量就难以从评价中体现;第三,很多用户为获得系统积分、提高个人级别等原因常进行随意评价甚至是未使用资源就直接评价,这也可能导致对资源评价的不真实。以上评价现象会使对资源的评价远离其真实质量,从而对资源的有序合理组织及用户选择产生不良影响,这降低了部分优秀资源的使用而不能更好地满足用户对优秀资源的需求。所以,应该选择一种更合理的资源评价方法,对每一个用户的评分区别对待以消除恶评、随意评价等带来的影响。
此外,当前网络信誉和信任已得到广泛的研究,并且作为一种评价和安全机制被广泛用于社交网络、虚拟社区尤其是交易类社区如淘宝等领域。Jøsang认为“信誉就是对某人或某事的品质和特性的通常看法或观点”。[3]信誉通常是一方根据另一方的历史行为而对其可信赖度得出的客观评价,而信任通常是在一定环境下一方基于另一方信誉而做出的评价,主观性较大。Li等[4]提出在电子交易的信誉模型中,信誉与五个因素有关:获得的交易满意数、总交易次数、交易评价可信度、交易上下文(Transaction Context Factor)和社区上下文(Community Context Factor)。胡建理等[5]提出了一种基于节点反馈可信度的分布式P2P全局信任模型,克服了以往工作中将节点的反馈质量简单地等同于服务质量的不足。黄骏虎,虞慧群[6]提出了一种基于信誉的P2P 的评价模型, 这种模型综合考虑了自身以往经验以及其它节点对请求节点的意见以判断请求节点是否可信。在文献[7]中,作者为了帮助用户在虚拟社区中快速获得有价值的信息而根据实验数据得出影响用户之间信任的几种交互属性,并提出了一个以信任等级为基础的推荐模型。毕振坤,蔡国永[8]在参考P2P网络中信誉模型的基础上,结合Wiki社区特点建立相应信誉模型,并在Wiki社区信誉模型中利用角色划分方式引入激励机制。虽然国内外对信誉的研究很多,但将信誉与信任应用到网络教育资源中的研究还很少。
本文借鉴当前对用户网络信誉的研究与应用,针对教育资源评价计算方法单一、评价可靠性差、用户评价积极性不高等问题,提出了一种考虑评价者信誉的网络教育资源评价模型。评价者信誉指用户作为资源评价者在评价资源过程中所产生的评价信誉,反映了用户在评价资源方面的可信赖程度。如果一个用户的评价信誉很高,说明该用户在评价资源方面是一个“专家”,能够比较客观合理地评价资源,所以其评价观点更具有参考价值。该模型通过对评价者的评价信誉进行计算,并依据评价信誉赋予评价者相应的评分权重,再综合所有用户的评价以综合评价资源。
二、基于评价者信誉的网络教育资源评价模型
为了提高合理、客观评价的用户的评价权重并降低异常评价尤其是恶意评价的比重以此更准确地通过评价反映出资源的质量,提出基于评价者信誉的网络教育资源评价模型。当用户对资源的评价越接近该资源的真实质量,用户的评价信誉就越高,其评价的权重就越大,资源质量的好坏由用户质量评价的评分及其评分权重综合计算获得。
定义1:评价者的实时信誉TT(Ry,Ux),指用户Ux对资源Ry做出评价时产生的实时信誉。
定义2:评价者的原始信誉TM(Rk,Ux),指用户Ux即将产生新的实时信誉前的当下信誉。
说明:对初次注册的用户Ux,该评价模型为每一个用户设置一个相同的初始信誉,记为T0(Ux),大小在0~1之间。当用户一旦对资源进行评价后开始获得实时信誉,且初始信誉即变成了原始信誉,且原始信誉随着用户评价的进行而动态更新。
定义3:资源的综合评分ST(Ry),指资源Ry经过一个固定的时间窗口T后更新的评分。
说明:为了综合很多用户的评价意见且减少系统运行负担,设置一个时间窗口T,即该资源每隔一个时间窗口T后,就依据该时间窗口下所有用户的评价及用户的实时信誉对资源进行综合评价计算。
定义4:资源的原始评分ST-1(Ry),指资源Ry即将产生新的综合评分前的当下综合评分。
说明:对于资源库中每一个资源Ry,该评价模型为其设置一个初始评分,记为S0(Ry),大小在0~10分之间,它是由资源开发者、行业专家及部分可靠用户进行的综合评价,其评分具有相当高的可信性。当资源经过第一个时间窗口后,该资源的综合评分将参照这个时间段所有用户的评分进行更新,其初始评分会变成原始评分,且原始评分随着用户评价及时间的推移而动态更新。
基于评价者信誉的网络教育资源评价模型的运行过程为:当某一个资源Ry投入使用后,用户Ux对其评分设为ST(Ux,Ry),比较ST(Ux,Ry)与资源的原始评分ST-1(Ry)的差距,结合用户Ux的原始信誉TM(Rk,Ux),即可通过一定的算法计算出用户的实时信誉TT(Ry,Ux)。而对于资源Ry综合评分的更新则需要经过一个时间窗口T后,根据该窗口下所有用户Ux对资源Ry的评分ST(Ux,Ry)及各个用户当时评价该资源时产生的实时信誉而赋予的评分权重,结合该资源的原始评分,通过一定的算法综合计算。综上,系统根据用户的评价不断更新着每个用户的信誉值和每个资源的综合评分。基于评价者信誉的网络教育资源评价模型图如图1所示。
三、评价模型中关键量的计算
1.评价者实时信誉TT(Ry,Ux)的计算
时间窗口T中,根据用户Ux对资源Ry的评分ST(Ux,Ry)、资源Ry在前一个时间窗口T-1的综合评分ST-1(Ry)的差的绝对值为SD(Ux,Ry)(以下公式中为方便记为SD)与用户的原始信誉TM(Rk,Ux),则用户Ux在时间窗口T被更新的实时信誉TT(Ry,Ux)如(1)所示。
TT(Ry,Ux)=TM(Rk,Ux)+(1.5-SD)/10 (SD⦤1)
TM(Rk,Ux) (1
TM(Rk,Ux)-(SD-1)/10 (1.5
TM(Rk,Ux)-SD/10 (2
TM(Rk,Ux)-(SD+2)/10 (SD>3)(1)
公式(1)中对异常评价的用户信誉采取了一定的惩罚措施,当用户评分与资源的原始评分的差距SD(Ux,Ry)越大时,用户信誉会下降的越快,用户在下次评价时的评分权重就越小,在一定程度上控制了某些用户恶意评价的影响。另外,当用户信誉大于1时取为1,小于0时取为0。
2.用户评分权重的确定
用户评分在资源综合评价计算中所占的权重主要依据评价者的实时信誉。实时信誉度越高,赋予的权重也越大。另外,资源的原始评分,是由开发者、专家和部分可靠用户综合评价获得,具有较大的可信性,设原始评分的信誉为0.8。对资源Ry,假设在第T个时间窗口中有n个用户对资源Ry做过评价,结合各评价者的实时信誉TT(Ry,Ux),每个评价者相应的评分权重a(Ux)如(2)所示。
a(Ux)=(2)
对于该资源的原始评分权重a0(Ry)如(3)所示。
a0(Ry)=(3)
3.资源综合评分ST(Ry)的计算
资源的综合评分,由当前时间窗口下各用户的评分及其相应评价权重获得。另外,在资源的综合评价计算时,还考虑了资源的历史表现,即参考它在历史时间窗口下的各个综合评分,且时间上越接近当前的评分越有参考价值。为了平衡计算压力,仅考虑距离当前时间窗口最近的一次历史评分,即原始评分的影响力,将原始评分的比重设为0.3,而当前时间窗口的综合评分的比重设为0.7。
设在第T个时间窗口中有n个用户对资源Ry进行了评价,根据不同用户Ux的评分ST(Ux,Ry)及资源的原始评分ST-1(Ry),其综合评分ST(Ry)如(4)所示。
ST(Ry)=a(U1)*ST(U1,Ry)+L
+a(Un)*ST(Un,Ry)
+a0(Ry)*ST-1(Ry)*0.7+ST-1(Ry)*0.3(4)
以上不但考虑了不同评价可信度用户的评分对资源综合评分的影响,还考虑了资源的历史表现,既防止个别恶意用户的恶意评价的负面影响,又可在一定程度上抑制用户整体异常评价带来的不良影响。
四、仿真实验
为了验证基于评价者信誉的网络教育资源评价模型的有效性,设计了仿真实验。在系统中,为每个资源设置初始评分5分(评分区间0~10),为每个用户设置初始信誉值0.5(信誉区间0~1),设更新资源评分的时间窗口为1周。分别采用基于评价者信誉的评价方法(简称RBE方法)和平均法(简称AVG方法)进行了以下两个实验的比较,其中平均法指在每个时间窗口下对用户的所有评价取平均值,为了与RBE方法对比,资源的综合评分也采用新评分与原始评分按7:3进行综合计算。因为当前网络教育资源网站中普遍存在用户评价数据不足的现象且为了实验需要,文章将采用著名的Jester Joke数据集[9](主要收集许多用户对不同笑话的评价数据)来代替资源评价数据,且从众多数据中选取部分用户对某一个笑话的评价数据。因为Jester Joke数据集中的评分范围从-10到10,所以需先将该评分数据转化成0到10。另外因为RBE方法中涉及到时间窗口,固设每个时间窗口下有30人评价,并根据实验需要,对一些数据进行归类划分。实验分为以下两类:
1.不同评价行为下对资源单次评价的比较
RBE方法最主要的目的是抑制用户评价中的异常评价,如恶意和哄抬评价、对资源的随意评价等。所以以下实验主要验证同一个资源如果遇到不同评价行为时两种评价计算方法的有效性。选取某一个初始评分为5的资源,参与评价的用户共30人,且评价行为分为三类:(a)诚实评价;(b)恶意差评;(c)哄抬评价。所有用户的信誉原则上包括信誉值均高、信誉值均低、信誉值随机等情况。但由以上资源的综合评分计算方法可知,相比于用户信誉均高的情况,用户信誉均比较低且不诚实评价资源时,则最后的综合评分会更接近原始评分,其计算结果会相对比用户信誉均高的效果好。所以仅讨论用户信誉值均高的情况。具体评分矩阵如表1所示:
用户信誉通过execl工具并按照实验需求随机生成,得到0.80,0.64,0.86,0.83,0.70,0.66……。运用RBE方法和AVG方法分别处理表2中的数据,可以得出资源的综合评分,如表2所示:
由表2可以看出,当用户真实、诚实地评价资源时,两种评价方式所得结果相差不大。但当某一资源遇到用户恶意差评、用户哄抬评分等异常评价时,两种评价方法对资源的评价相差很大。从表1和表2中知采用AVG方法影响了资源的总评分,使总评分偏离该资源的真实质量比较大,而通过RBE方法,在遇到异常评价时,能在一定程度上降低差评及哄抬评价的比重,使其评价更接近资源的真实质量。这说明采用RBE方法能够更有效地降低用户不诚实评价的不良影响,使其评分更加接近资源的真实质量。
以上实验仅对资源遭受一次异常评价进行了比较,以下实验将比较资源在长期评分更新中遭受异常评价时,两种方法对异常评价的抑制效果。因为用户异常评价的的类型及情况很多,以下仅选取一种情况进行比较。
2.资源连续遭受异常评价下的评价效果比较
选定某一资源,在三次连续的时间窗口中,设每次30人对资源进行评价。且该资源同样依次遭受以下三种用户评价行为:诚实评价、哄抬评价及恶意差评。用户的具体评分矩阵如表3所示。
同上,实验依旧设定评分用户信誉很高,并采取execl根据实验需要随机生成以上三组用户的信誉。第一组用户信誉分别为0.72,0.86,0.70,0.75,0.66,0.89……,第二组用户信誉分别为0.89,0.86,0.75,0.89,0.83,0.58……,第三组用户信誉分别为0.95,0.66,0.95,0.75,0.86,0.66……运用RBE方法和AVG方法分别处理表3中的数据,可以得出以下资源的综合评分,如表4所示:
根据表4中两种评价方法计算的值并分别对两组值求标准差,可得到(RBE)std=0.993,而(AVG)std=1.732。
所以通过表4及两种方法下各组评分的标准差可以清晰看出,当一个资源在连续遇到用户异常评价时两种评价方法存在很大差异。AVG方法中用户的评价起决定作用,对资源的评价随着异常评价的干涉而波动很大,与资源的真实质量相差较大。而RBE方法,对于不同用户的评分,其评分高低对资源不起决定作用,对资源的评价同时还需参照用户的信誉度及该资源的原始评分,所以有效降低了用户异常评价对资源总体评价的影响,使对资源的每一次评价都更合理更接近资源的真实质量,进而使资源的综合评分进行连续更新时比较平稳。
经过以上仿真实验可见,在对资源的评价中,基于评价者信誉的评价方式更能合理地评价网络教育资源,尤其可以抵制一些用户异常评价的影响。同时该评价模型能够时刻反映用户的评价信誉。
结语
该模型能够更合理科学地对资源进行评价,尤其是降低了用户异常评价带来的不利影响,使用户可以快速选择优质资源。文章最后的仿真实验也证明了模型的有效性。
参考文献:
[1]张京彬,贺志强.基于项目管理的创新型教育资源建设与管理平台设计[J].中国电化教育,2010,31(1):73-77.
[2]黄克斌.网络教育资源评价研究[J].现代远程教育研究,2005,18(5):24-27.
[3] Jøsang A, Ismail R, Boyd C. A survey of trust and reputation systems for online service provision[J]. Decision Support Systems, 2007,39(2):618644.
[4]Li X, Ling L. A reputation-based trust model for peer-to-peer ecommerce communities[C]//Proceedings of the 4th ACM Conference on Electronic Commerce. USA: CA, 2003:228-229.
[5]胡建理,吴泉等.一种基于反馈可信度的分布式P2P信任模型[J].软件学报,2009,20(10):2885-2898.
[6]黄骏虎,虞慧群.一种基于信誉的P2P的评价模型[J].计算机科学,2011,38(10):331-335.
[7]Zhang LZ, Li SY,et al.The Influence of interaction attributes on trust in virtual communities[C]// Proceedings of the UMAP 2011 Workshops.Berlin : LNCS,2012:268-279.
篇8
关键词:模糊综合评价模型;学习共同体;应用型本科院校
一、引言
在国际教育思潮的影响下,作为一种先进的教育理念 ,“学习共同体”正在我国的高等教育中被广泛倡导。1995年,博耶尔(E. L. Boyer)首次提出 “学习共同体 ”概念 , 他认为,学习共同体是所有人因共同使命并朝着共同愿景一起学习的一种组织,共同分享学习兴趣,共同寻找通向知识的旅程和理解世界运作方式,并朝着同一目标相互作用和共同参与[1]。
美国西南教育发展中心(Southwest Educational Development Laboratory)在1997年首次发表了关于专业学习共同体的描述和介绍,并设计了五个维度、十二个指标。他们认为专业学习共同体是由具有共同理念的管理者与教师构成的团队,他们致力于促进学生的学习,并且是进行合作性、持续性学习[2]。学习共同体具有学习性、互动性、团体性等基本特征。地方高校作为人才培养的重要阵地,通过构建“学习共同体”提高应用型人才培养质量具有重要的现实意义。
位于江苏省的S院校定位于地方应用型大学,为提高劳动与社会保障专业学生的综合素质,该校某社会保障专业努力探索基于学习共同体模式的应用型人才培养模式,经过几年的实践,取得了一定的成绩。国内学者往往倾向于使用定性的方法对高校专业学习共同体实施状况进行评价,这种评价方法依赖专家的观察和经验,比较简单,但只停留在感性的初级评价阶段。因此,有必要寻求一种科学、客观、严密而且定量化的高校专业学习共同体评价方法。本文以此为出发点,以对S学院社会保障专业实地调查所获得数据为实证分析的主要依据,运用模糊综合评价模型,从定量的角度对S学院社会保障专业学习共同体进行了评价。
二、调查设计
1.调查的范围、对象与目的
本调查的范围限于S学院,调查对象为四百多名全日制劳动与社会保障专业在校本科生,调查目的是获得评价S学院劳动与社会保障专业学习共同体相关数据,了解社会保障专业学习共同体发展状况,并为运用模糊综合评价法对其进行客观考量提供数据。
2.调查指标与问卷的设计
本研究按照1997年美国西南教育发展中心(Southwest Educational Development Laboratory)的界定,以五个维度,十二个指标对S学院劳动与社会保障专业学习共同进行评价。五个维度分别是:A1共同的目标和理念;A2学习的支撑环境;A3互相对话、沟通交流(学习意识,探究意识,团队意识);A4领导的支持、权利的共享;A5家庭和社区的积极参与。十二个指标依次是:B1专业定位、办学宗旨;B2共享的价值观和愿景;B3物力支持(经费支持);B4信息资源(图书馆、资料库);B5技术资源(计算机网络、技能培训课 程);B6互动的课堂文化和互动的师生关系;B7学生与学生团结合作、持续的学习文化;B8教师与教师合作性文化;B9尊重各自的价值观和人格;B10共享的权利和民主氛围;B11家庭有效参与学校教育;B12走进社区。具体各项评价指标及其代号见表1。
在二级指标下面又分设26个具体问题,从而建立一个自上而下的三层树形指标结构,并自下而上按照每一级指标对学习共同体的重要性分别赋予分值。对于一级指标和二级指标,我们采用五分点量表让被调查者打分;对于最底层的26个问题,我们采用四分点量表让被调查者打分,然后采用求算术平均数的方法算出各个指标的数值。
3.调查的实施
我们先发放30份试测问卷以获取数据,并进行信度检验,结果如表2、表3所示。
从表2可以看出一级指标的信度系数为α=0.848,从表3可以看出二级指标的信度为α=0.861,这两级指标量表的信度均在可接受范围之内,我们认为两份问卷均具备较好的信度,可以进行实测。
本研究调查阶段设计了两种问卷:问卷一和问卷二。问卷一所获得的数据主要用来计算一级指标和二级指标权重。本次调查实测阶段共发放问卷400份,回收396份,问卷回收率99%,其中有效问卷390份(问卷一170份,问卷二220份),有效率达到97.5%。有效问卷中,男性问卷占48.97%,女性问卷占51.03%。见表4。
三、模糊综合评价模型的应用
1.原理简介
模糊综合评价法是一种基于模糊数学的综合评标方法。该综合评价法根据模糊数学的隶属度理论把定性评价转化为定量评价,即用模糊数学对受到多种因素制约的事物或对象做出一个总体的评价。它具有结果清晰、系统性强的特点,能较好地解决模糊的、难以量化的问题,适合解决各种非确定性问题[3]。
在确定评价等级、评价指标相关数值基础上,运用模糊集合变换原理,以归属度描述各指标的模糊界限,构造模糊评判矩阵,通过多层的复合运算,最终确定评价对象所属等级。
若一级评价因素的权重为α=(A1,A2…Am),则模糊综合评价结果为:β=α・R=(b1,b2,…bn),若bk=max(b1,b2,…bn),则评价对象属于k类。
2.模糊综合评价模型的应用步骤
(1)构建模糊综合评价指标。模糊综合评价指标体系的构建是进行综合评价的基础,评价指标的选取的方式方法,对综合评价的准确性有直接影响。本研究在问卷设计阶段已经对模糊综合评价指标体系进行了科学的构建。
(2)构建权重向量。问卷一,运用专家经验法,采用五分量表的方式,向S学院相关学者专家共发放问卷180份,回收170份,有效问卷170份。让他们对五个一级指标和十二个二级指标进行打分,经过数据处理获得相关指标权重如表5A所示:
(3)构建评价矩阵。模糊综合评价法要求建立适合的隶属函数从而构建好评价矩阵。我们将学习共同体的评价分为四个等级,分别为差、中等、较好、很好,通过对问卷二的处理得到每个二级指标的隶属度。问卷二共回收220有效问卷,因此各个指标归属度计算均以220为分母。
(4)合成权重和评价矩阵。把表5的指标权重和表6的指标隶属度矩阵结合,对S学院社会保障专业学习共同体进行评价。
(5)结论。我们可以看到0.38 对应的是较好,也就是说从学习共同体角度考量,S学院劳动与社会保障专业学习共同体总体属于较好的等级。
四、讨论
通过运用模糊评价模型实现了对地方应用型本科院校S学院社会保障专业学习共同体的分析。虽然总体上该专业学习共同体属于较好等级,但各维度上还存在较大的区别。
1.强化领导支持与权力共享,促进共同的目标与理念的形成
S学院属于由各个高校联合办学组成的地方高校,管理体制比较特殊。S学院的学生虽然在本院读书,但S学院却没有学历和学位证书的授予权,导致学生对身份的认同度不高,院系领导在促进学校发展与学生教学、管理上存在一定的矛盾,赋权方面存在明显不足,导致对权利共享这个指标评价较低。
S学院的劳动与社会保障专业定位于培养熟练掌握管理学、经济学和社会学等相关的专业知识,能够在企事业单位、大中型企业和地方社区从事人力资源、劳动与社保相关工作的应用型创新人才。确立了立足地方,提高应用技能的培养理念。但由于社会保障专业是一个比较新的专业,专业定位和知识结构与社会需求之间存在一定的脱节。社会保障专业属于公共管理类,在技术性层面上无法与理工科相比,虽然国家十分重视社会保障,但社会需求表面化,学生的就业很难达到预期目标。
2.营造沟通交流氛围,提高环境支撑力
S学院始终突出教学的中心地位,在预算安排上充分体现教学经费优先的原则。 2013 年,生均预算内教育事业费5978.27元(其中生均拨款1904.31元,商品和服务支出3279.87元,其他资本性支出94.09元),本科教学日常运行经费投入2085.61万元,生均1530.16元,本科专项教学经费1383.1万元,生均1014.75元。实验教学经费260.97万元,生均191.47元;实习经费141.9万元,生均104.09元。图书馆占地面积约30700平方米。目前馆藏纸质图书达136.6万余册,其中涉及劳动与社会保障专业的纸质书籍有5万册,2013年征订期刊2009种、报纸208种,各类电子图书125万余种、电子期刊2万余种,是苏北地区图书资源最丰富的图书馆之一。
S学院是以教学为主的本科院校,对于各专业的教学十分重视,社会保障专业的教学满意度每学期都在97%以上,学生与老师之间关系十分融洽,几年来教师通过“社会政策”“社会工作”等课程的教学改革,使学生充分融入课堂教学中,促进了师生之间的互动。由于学院是个较新的学院,社会保障专业的老师也都比较年轻,老师之间合作与交流十分顺畅。这些都为社会保障专业学习共同体的发展和有效运行提供了良好的保障。
3.构建学校、家庭、社区三位一体应用型人才培养模式
劳动与社会保障专业一方面在教学上突出老师与学生互动合作,另一方面在管理上突出辅导员的重要作用。社会保障专业有三名辅导员,辅导员对本专业的每个学生及其家庭状况都比较了解,使学生管理工作与学生的家庭情况紧密联系起来,创建了良好的家校互动机制。当前政府对社会民生问题越来越重视,社会保障专业在教学过程中加强了与地方社区的合作,教学效果逐渐被社会认可,同时在人社局 、民政局和残联等单位建立了实践基地,通过“社会保险实践”“社会工作”“社会调查”等课程的社会实践环节深入基层,让学生在社区实践中来提高自己,发展自己。通过学校、社区、家庭三方联动,建立三位一体的应用型人才培养模式。
本科应用型院校普遍存在学生学习积极性差、创新能力不足、人才培养和社会实际脱节等问题,因此,将学习共同体与应用型人才的培养结合起来,对于教学质量的提高、学生价值观的树立以及学生团结合作精神的培养具有重要意义。
参考文献:
[1] 全守杰.“学习共同体”研究理论考察与新探[J]. 湖北经济学院学报(人文社会科学版),2007(10).
篇9
关键词:广西;物元模型;水质评价
中图分类号:X824 文献标识码:A 文章编号:0439-8114(2016)16-4154-04
DOI:10.14088/ki.issn0439-8114.2016.16.020
随着社会的发展、经济的增长及人民生活水平的提高,人民对水资源的要求也越来越高,科学地评价水质显得尤为重要,常用的水质评价方法有综合指数法、因子分析法、层次分析法、人工神经网络法、污染损失率法、集对分析法、模糊综合评判法以及物元分析法等。水环境质量的好坏是一个模糊概念,各水质等级是模糊集合,评价标准界限的明显量化将会遗漏一些有用信息,甚至会导致错误的结论,若以单项指标对水质进行评价,其评价结果常常具有矛盾性、不确定性和不相容性。物元分析理论是一种主要研究和处理不相容问题的方法,它可以将复杂的问题抽象为形象化的模型,并应用这些模型研究基本理论,提出相应的应用方法。本研究以广西省水质评价为例,说明物元模型理论在水环境质量评价中的应用。
1 物元模型理论
1.1 物元的定义
物元理论是在20世纪80年代由中国的蔡文教授创立,是主要研究和处理不相容问题的方法,贯穿自然科学和社会科学的横断学科,将物元分析与可拓集合相结合,广泛应用于新产品构思与设计、优化决策、控制、识别与评价等领域,在理论和实践方面发挥了重要作用。物元可拓法将评价指标体系及其特征值作为物元,通过评价级别和实测数据,得到经典域、节域及关联度,从而建立定量综合评价方法。以有序三元组R=(Q,c,v)作为描述事物的基本单元,称为物元。其中,Q表示事物;c表示Q的特征;v表示Q关于c所取得的量值。假设水质R有多个特征,以n个特征c1,c2,…cn和相应的量值v1,v2,…vn描述,则表示为:
3 讨论
在运用物元分析方法进行水质评价过程中,物元理论通俗易懂,计算方法简便。物元模型中,关联函数可取负值,分辨能力强,能全面分析判别待评价对象属于某一级别的程度,从而提供更为丰富的信息,使判断更加准确,为环境决策提供较为可靠的科学依据,并为该领域的评价方法提供了新的思路。但在应用该方法时,经典域、节域量值范围的确定、关联函数的选取等问题都有待进一步研究探讨。
参考文献:
[1] 张 锐,郑华伟,刘友兆.基于PSR模型的耕地生态安全物元分析评价[J].生态学报,2013,33(16):5090-5100.
[2] 余 健,房 莉,仓定帮,等.熵权模糊物元模型在土地生态安全评价中的应用[J].农业工程学报,2012,28(5):260-266.
[3] 和 吉,胡西林,邱 林,等.模糊物元模型在湖泊水质评价中的应用[J].华北水利水电学院学报,2007,28(2):97-100.
[4] 武 斌.基于模糊物元的湖泊水质评价模型研究[J].水利水电技术,2007,38(4):12-15.
[5] 张虹波,刘黎明,张军连,等.区域土地资源生态安全评价的物元模型构建及应用[J].浙江大学学报(农业与生命科学版),2007, 33(2):222-229.
[6] 黄 乾,彭世彰,田守岗,等.模糊物元模型在区域水安全评价中的应用[J].河海大学学报(自然科学版),2007,35(4):379-383.
[7] 张先起,梁 川.基于熵权的模糊物元模型在水质综合评价中的应用[J].水利学报,2005,36(9):1057-1061.
[8] 李如忠.模糊物元模型在区域水安全评价中的应用[J].水土保持研究,2005,12(5):225-227.
[9] 潘 峰,梁 川,王志良,等.模糊物元模型在区域水资源可持续利用综合评价中的应用[J].水科学进展,2003,14(3):271-275.
[10] 胡 伟,李满春,符海月,等.土地利用适宜性评价物元模型研究[J].测绘科学,2009,34(5):126-129.
[11] 杨秋林,郭亚兵.水资源承载能力评价的熵权模糊物元模型[J].地理与地理信息科学,2010,26(2):89-92.
[12] 徐卫红,于福亮,龙爱华.基于熵权的模糊物元模型在水资源可持续利用评价中的应用[J].中国人口・资源与环境,2010(S2):157-160.
篇10
【关键词】地质模型;数值模拟;一体化;模型精度
0 研究目的
三维油藏地质建模和油藏数值模拟是油藏描述的重要研究内容。长期以来,地质建模与数值模拟是两个相对独立的研究过程,且地质模型质量关系到其能否客观反映油藏实际,数值模拟的研究进度,及油藏开发各种技术措施的制定。究其原因主要有三个方面:一是缺乏详细的建模数据质量规范,无法对第一手资料的真实性进行甄别;二是由于油藏三维地质模型是建立在基础数据和建模人员的地质认识及建模水平的基础上形成的,因此缺乏油藏三维地质模型质量评价的量化标准;三是模型修正是一个动静态结合、综合研究的过程,单纯根据动态数据和历史拟合结果进行修正,往往造成对地质模型不合理的修改,甚至出现明显不符合地质规律的状况。
本次地质模型质量评价及控制方法研究,从资料质量、油藏类型、地质认识、建模方法、软件开发水平等方面入手,提出并建立了一套对地质模型进行质量评价和控制的方法。
1 质量评价与控制方法
质量评价是指对比地质认识与地质模型一致性的过程。质量控制是指利用动态资料约束地质模型,进一步加深地质认识的过程。
提出了基于静态资料建立油藏三维地质模型的质量评价标准,即由可视化评价、规律一致性评价到抽稀井评价,其中可视化评价包括构造模型与构造特征、断层模型与断裂系统、地层模型网格模型与砂体展布和沉积相分布特征的认识一致;规律一致性评价是指模型数据与岩心数据和测井解释数据的规律一致;最后通过抽稀井检验模型数据是否符合油藏实际。这是一个由直接观察、数据匹配到实际验证的过程,体现了模型质量由粗到细的质量评价标准。
可视化评价标准具体到三维地质模型中主要表现在以下几个方面:构造模型中,要求地质研究的构造面与模型构造面趋势一致,地层分层数据与模型构造面吻合;断层模型中,要求断棱等间距平行且等高或者高度渐变,两盘断线不可相交,同一断层的断点要近断面分布;网格模型中,要求网格主方向为主要物源方向,且无网格负体积出现;地层模型中,要求砂体展布范围、无井控制的边水区要与地质认识基本一致。
规律一致性评价内容包括,岩心数据、测井解释数据频率分布特征基本一致,测井解释数据、井点粗化值、模型数据频率分布特征基本一致。抽稀井评价是指抽出部分井重新建立模型,被抽出井点处的模型数据与实际数据对比误差较小即可。
质量控制方法主要是指在模型建立的过程中,通过技巧的应用提高模型精度。例如在构造模型中,需检查修正局部井斜、补心数据,井震结合,合理化构造趋势,合理添加虚拟井、点的方法;可使用断点数据及断点锁定,层面采样法确保正确的断层切割关系来提高断层模型质量;地层模型中可采用分层方法优选、沉积相控约束和动态验证的方法;储层模型中可开展测井解释数据可靠性分析,建模方法优选,变差函数的合理调整及应用等方法。
例如在断层模型中,断层位置不符、断距不合理、断层附近底层尖灭都会影响构造模型精度,从而影响油水井的受效,增加油藏液量、含水量拟合困难,可以采用断点锁定、层面采样等方法控制并提高断层模型的质量。
单纯应用静态资料及建模技巧不能很好的确保模型的精度,在模型建立时更要考虑结合油藏生产实际使得模型更好的服务于生产,像边水能量、油水边界、断层封闭性、井间连通性、储层物性时变、储层含油性等这些动态资料都可以约束地质建模过程。在这里,将这些参数进行不确定性和确定性参数分类,并分别控制约束范围来提高模型精度。
2 应用效果
应用提出的地质模型质量评价与控制方法,对总网格数达2163万的地质模型开展建模数模一体化研究,仅用了3个月的时间,完成了3次模型修正及430口油水井的历史拟合,且单井拟合率达到85%以上,为后期开展研究打下良好基础;因此该方法不仅极大的提高了工作效率,同时大大的深化并提升了原有地质认识。
3 结论
该方法的应用将大大提高三维地质模型质量,从而提高后期研究工作效率;同时加强了多专业、多学科科研人员的相互协作和紧密结合,进一步提升地质认识;另外,应用动静态资料相结合,约束地质模型的建立和修改过程,使得模型的建立有章可循、模型的修改有据可依,保证了三维地质模型的精度,为建立三维地质模型质量规范提供了部分依据,为建设“数字化油田”及开展“建模数模一体化”工作提供了有力保障。
【参考文献】
[1]吴胜和.储层表征与建模[M].石油工业出版社,2010:341-445.
[2]于兴河.油气储层表征与随机建模的发展历程及展望[J].地学前缘,2008,l5(1):1-7.
[3]吴胜和.储层建模[M].北京:石油工业出版社,1999.
[4]崇仁杰,于兴河. 储层三维地质建模质量控制的关键[J]. 海洋地质前沿,2011,27(7):65-69.