❶ 如何用数据包络分析(DEA)进行效率评估
一、什么是数据包络分析DEA
数据包络分析DEA是一种多指标投入和产出评价的研究方法,其应用数学规划模型计算比较决策单元(DMU)之间的相对效率,对评价对象做出评价。比如有10个学校(即10个决策单元DMU,Decision Making Units),每个学校有投入指标(比如学生人均投入资金),也有产出指标(比如学生平均成绩,学生奥数比赛比例等),有的学校投入多,有的学校投入少,但是投入多或少,均会有对应的产出,那么具体哪个学校的投入产出更加优秀呢,诸如此类投入产出的优劣问题,则可使用数据包络DEA模型进行分析。
最常见的DEA模型为CCR和BBC,此两种模型的区别在于是否假定‘规模报酬可变’,其对比如下:
二、数据包络分析DEA案例
1
当前希望对天津市的城市可持续发展情况进行研究,共收集1990~1999共计10年的相关指标数据。具体说明如下表格:
原始数据如下图,从下图来看,从1990~1999年共计10年里面,人均GDP和城市环境质量指数均在逐步提高,单独从产出指标来看说明每年都在提升。但反过来看,3个投入指标却有高有低,那么到底哪些年的投入产出较好,而哪些年的投入产出还有改进空间并不知晓,这正是需要数据包络分析DEA分析寻找的答案。
2
数据包络分析DEA时,首先需要分析综合效益值θ,即首先判断DMU是否有DEA有效,如果有效,则说明该DMU较优,反之说明‘非DEA有效’,即相对来说还有提升空间,那么提升空间具体在哪里呢,比如提高还是减少规模呢,可以通过规模效益分析得到。与此同时,如果是‘非DEA有效’,那么具体问题是什么,投入冗余还是产出不足,则可以通过对应的投入冗余 或产出不足分析表格得出,具体数字直接查看松驰变量即可。如下表所示:
3
本例子操作截图如下:
分别将3个投入指标和2个产出指标放在对应的框中,与此同时,本案例中年份为决策单元DMU,因此放入对应的框中,当然也可以不放入DMU(如果不放入,SPSSAU默认输出为比如第1项,第2项等)。另外,本案例使用默认的BBC(VRS)模型进行分析。
4
如果是BBC模型时,SPSSAU共输出6个表格和1个图。分别如下:
如果是CCR模型时,SPSSAU共输出4个表格【无规模报酬相关的表格】和1个图。分别如下:
5
有效性分析是指决策单元DMU的总体有效性情况,本案例使用BBC模型进行分析。从上表可以看出:1997,1998和1999这三年的数据均为‘DEA强有效’,即相对于其它年份(DMU)来讲,此3年的投入产出达到相对最有效率。
关于有效性的判断规则说明如下:
如果综合效益值等于1且松驰变量S-和松驰变量均为0,那么为DEA强有效,说明相对来讲某DMU单元达到最有效率;如果综合效益值等于1并且2个松驰变量任意中任意1个大于0,那么为DEA弱有效,说明某DMU单元已经相对有效率但还有一定提升空间;如果说综合效益值小于1(此时不论松驰变量为多少),那么为非DEA有效,即说明相对来讲投入产出比效率较差。
以及关于上表格中各指标的意义说明如下表:
从本案例分析来看,除1997,1998和1999共3个决策单元外,其余年份(决策单元DMU)均为非DEA有效,即还有较大的提升空间,下述中还会进一步对规模效益系数进行分析。
上图为有效性分析的图示化,人上图可以看到,从1990到1999年变迁过程中,综合效益值在不断的提升,也即说明政府的投入产出效率在不断提升。包括规模效益和技术效益均在不断提升,进一步说明投入产出效率的提升,也即说明政府的效率在不断提高。
针对BBC模型即规模报酬可变模型来看,上述分析可知,1997,1998和1999这3年均为DEA强有效,自然其规模报酬达到最优即规模报酬固定。而1997年之前,规模报酬系数值均小于1,也即说明规模报酬递增,加大规模更加速提高投入产出比。可能这也正是政府在逐年提升投入的原因。关于规模报酬系数的判断规则说明如下表:
针对非DEA有效的决策单元DMU,可进一步分析其‘投入冗余’情况。当然DEA强有效的决策单元(本案例中的1997,1998和1999共3年),相对意义上其并没有投入冗余问题,因此松驰变量S-值均为0。
松驰变量S-意义为“减少多少投入时达目标效率”,简单来说就是得到基于当前的产出,投入要减少多少才能达到高效率。该值越小越好,最小值为0(即最优状态),从上表可知:从1990~1996年间,政府财政收入占GDP比例对应的松驰变量S-值一直都大于0,意味着财政收入相对GDP过高(收税相对过多)。与此同时,在1994~1996年这3年里,每千人科技人员数的松驰变量S-值较高,意味着科技人员占比相对过高,可适量减少科技人员投入。
至于投入冗余率,其是一个相对的数字,即‘过多投入’除以‘已投入’,分析时可直接对比该数字,如果该值越大意味着需要减少的比例越大。
针对非DEA有效的决策单元DMU,可进一步分析其‘产出不足’情况。当然DEA强有效的决策单元(本案例中的1997,1998和1999共3年),相对意义上其并没有产出不足问题,因此松驰变量S+值均为0。
松驰变量S+意义为“增加多少产出时达目标效率”,简单来说就是得到基于当前的投入,产出要增加多少才能达到高效率。该值越小越好,最小值为0(即最优状态),从上表可知:人均GDP这一产出变量仅在1995年出现松驰变量S+值大于0,意味着1995年时人均GDP相对产出较低。与此同时,1990~1993共4年时间里,松驰变量S+值大于0,说明此4年里面相对于投入,产出效率还有提升空间(即产出不够)。
至于产出不足率,其是一个相对的数字,即‘产出不足’除以‘已产出’,分析时可直接对比该数字,如果该值越大意味着需要产出增加的比例越大。
描述统计分析表格为各研究指标的平均值和标准差值等,用于查阅数据中是否有缺失或异常情况等,并无其它意义。
6
涉及以下几个关键点,分别如下:
数据包络分析DEA从数学原理上并不要求数据进行量纲化处理,如果需要处理,可使用SPSSAU数据处理里面的生成变量功能进行处理。与此同时,如果数据有负向(逆向)指标,则需要对其进行逆向化处理,让其指标意义变为正向。处理方式为:SPSSAU数据处理里面的生成变量功能中的逆向化处理。
如果指标中有负向(逆向)指标,那么需要对负向(逆向)指标进行逆向化处理,使其意义变为正向。处理方式为:SPSSAU数据处理里面的生成变量功能中的逆向化处理。
数据包络DEA分析有很多模型,BBC和CCR最为经典,如果考虑规模报酬可变则使用BBC,反之如果认为规模报酬不变则应使用CCR,通常情况下使用BBC较多。
数据包络DEA分析进行分析时,其是一个相对对比的过程,即基于所分析数据里面对比相对的优劣,比如不同城市的DEA分析,有的分析发现北京DEA有效,但指标更改后(或对比的DMU更换),可能就会出现北京为非DEA有效。
❷ 什么是DEA,数据包络分析法相关材料有吗
数据包络分析(DEA)简介
在人们的生产活动和社会活动中常常会遇到这样的问题:经过一段时间之后,需要对具有相同类型的部门或单位(称为决策单元)进行评价,其评价的依据是决策单元的“输入”数据和“输出”数据,输入数据是指决策单元在某种活动中需要消耗的某些量,例如投入的资金总额,投入的总劳动力数,占地面积等等;输出数据是决策单元经过一定的输入之后,产生的表明该活动成效的某些信息量,例如不同类型的产品数量,产品的质量,经济效益等等.再具体些说,譬如在评价某城市的高等学校时,输入可以是学校的全年的资金,教职员工的总人数,教学用房的总面积,各类职称的教师人数等等;输出可以是培养博士研究生的人数,硕士研究生的人数,大学生的人数,学生的质量(德,智,体),教师的教学工作量,学校的科研成果(数量与质量)等等.根据输入数据和输出数据来评价决策单元的优劣,即所谓评价部门(或单位)间的相对有效性.
1978年由着名的运筹学家A.Charnes,W.W.Cooper和 E.Rhodes首先提出了一个被称为数据包络分析(Data Envelopment Analysis,简称DEA)的方法,去评价部门间的相对有效性(因此被称为DEA有效).他们的第一个模型被命名为CCR模型.从生产函数角度看,这一模型是用来研究具有多个输入、特别是具有多个输出的“生产部门”同时为“规模有效”与“技术有效”的十分理想且卓有成效的方法.1984年 R.D.Banker,A.Charnes和W.W.Cooper给出了一个被称为BCC的模型.1985年Charnes,Cooper和 B.Golany, L.Seiford, J.Stutz给出了另一个模型(称为CCGSS模型),这两个模型是用来研究生产部门的间的“技术有效”性的.1986年Charnes,Cooper 和魏权龄为了进一步地估计“有效生产前沿面”,利用Charnes, Cooper和K.Kortanek于1962年首先提出的半无限规划理论,研究了具有无穷多个决策单元的情况,给出了一个新的数据包络模型——CCW模型.1987年Charnes, Cooper,魏权龄和黄志民又得到了称为锥比率的数据包络模型——CCWH模型.这一模型可以用来处理具有过多的输入及输出的情况,而且锥的选取可以体现决策者的“偏好”.灵活的应用这一模型,可以将CCR模型中确定出的DEA有效决策单元进行分类或排队等等.这些模型以及新的模型正在被不断地进行完善和进一步发展.
上述的一些模型都可以看作是处理具有多个输入(输出越小越好)和多个输出(输入越大越好)的多目标决策问题的方法.可以证明,DEA有效性与相应的多目标规划问题的pareto有效解(或非支配解)是等价的.数据包络分析(即DEA)可以看作是一种统计分析的新方法.它是根据一组关于输入-输出的观察值来估计有效生产前沿面的.在经济学和计量经济学中,估计有效生产前沿面,通常使用统计回归以及其它的一些统计方法,这些方法估计出的生产函数并没有表现出实际的前沿面,得出得函数实际上是非有效的.因为这种估计是将有效决策单元与非有效决策单元混为一谈而得出来的.在有效性的评价方面,除了DEA方法以外,还有其它的一些方法,但是那些方法几乎仅限于单输出的情况.相比之下,DEA方法处理多输入,特别是多输出的问题的能力是具有绝对优势的.并且,DEA方法不仅可以用线性规划来判断决策单元对应的点是否位于有效生产前沿面上,同时又可获得许多有用的管理信息.因此,它比其它的一些方法(包括采用统计的方法)优越,用处也更广泛.
数据包络分析是运筹学的一个新的研究领域.Charnes和Cooper等人的第一个应用DEA的十分成功的案例,是在评价为弱智儿童开设公立学校项目的同时,描绘出可以反映大规模社会实验结果的研究方法.在评估中,输出包括“自尊”等无形的指标;输入包括父母的照料和父母的文化程度等,无论哪种指标都无法与市场价格相比较,也难以轻易定出适当的权重(权系数),这也是DEA的优点之一.
DEA的优点吸引了众多的应用者,应用范围已扩展到美国军用飞机的飞行、基地维修与保养,以及陆军征兵、城市、银行等方面.目前,这一方法应用的领域正在不断地扩大.它也可以用来研究多种方案之间的相对有效性(例如投资项目评价);研究在做决策之前去预测一旦做出决策后它的相对效果如何(例如建立新厂后,新厂相对于已有的一些工厂是否为有效).DEA模型甚至可以用来进行政策评价.
最引人注目的研究是把DEA与其它评价方法进行比较.例如将DEA应用于北卡罗来纳州各医院的有效性评价.已有的按计量经济学方式给出的回归生产函数认为,此例中不存在规模收益.DEA的研究发现,尽管使用同样的数据,回归生产函数不能象DEA那样正确测定规模收益.其关键在于(a)DEA和回归方法虽然都使用给定的同样数据,但使用方式不一样;(b)DEA致力于每个单个医院的优化,而不是对整个集合的统计回归优化.在其它的研究中,例如在评价医院经营有效性时,将DEA与马萨诸塞州有效性评定委员会使用的比例方法进行了比较,当使用模拟方法对DEA进行检验后认为,尽管由回归函数产生的数据有利于回归方法的使用,但是DEA方法显得更有效.
DEA方法和模型,以及对DEA方法的理解和应用还在不断的发展和深入.除了上面提到的新的模型BCC、CCGSS、CCW和CCWH模型外,在具体使用 DEA方法时,例如“窗口分析”方法,使DEA的应用范围拓广到动态情形;将DEA应用于决策单元为私人部门(商业公司)时,各决策单元之间存在着激烈的相互竞争作用等情况.
特别值得指出的是,DEA方法是纯技术性的,与市场(价格)可以无关.可以预言,这一方法在我们社会主义国家也会得到广泛应用.