Ⅰ 大数据背景下的审计分析方法有哪些
一、“大数据”时代的数据挖掘的应用与方法
数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。所以它所得到的信息应具有未知,有效和实用三个特征。因此数据挖掘技术从一开始就是面向应用的,目前数据挖掘技术在企业市场营销中得到了比较普遍的应用。它包括:数据库营销、客户群体划分、背景分析、交叉销售等市场分析行为,以及客户流失性分析、客户信用记分、欺诈发现等。审计部门的数据挖掘以往偏重于对大金额数据的分析,来确实是否存在问题,以及问题在数据中的表现,而随着绩效审计的兴起,审计部门也需要通过数据来对被审计单位的各类行为做出审计评价,这些也都需要数据的支撑。
数据挖掘的方法有很多,它们分别从不同的角度对数据进行挖掘。其中绝大部分都可以用于审计工作中。1. 数据概化。数据库中通常存放着大量的细节数据,
通过数据概化可将大量与任务相关的数据集从较低的概念层抽象到较高的概念层。数据概化可应用于审计数据分析中的描述式挖掘,
审计人员可从不同的粒度和不同的角度描述数据集, 从而了解某类数据的概貌。大量研究证实, 与正常的财务报告相比,
虚假财务报告常具有某种结构上的特征。审计人员可以采用概念描述技术对存储在被审计数据库中的数据实施数据挖掘,
通过使用属性概化、属性相关分析等数据概化技术将详细的财务数据在较高层次上表达出来, 以得到财务报告的一般属性特征描述,
从而为审计人员判断虚假财务报告提供依据。2.统计分析。它是基于模型的方法, 包括回归分析、因子分析和判别分析等,
用此方法可对数据进行分类和预测。通过分类挖掘对被审计数据库中的各类数据挖掘出其数据的描述或模型,
或者审计人员通过建立的统计模型对被审计单位的大量财务或业务历史数据进行预测分析, 根据分析的预测值和审计值进行比较, 都能帮助审计人员从中发现审计疑点,
从而将其列为审计重点。3. 聚类分析。聚类分析是把一组个体按照相似性归成若干类别, 目的是使得同一类别的个体之间的距离尽可能地小,
而不同类别的个体间的距离尽可能地大, 该方法可为不同的信息用户提供不同类别的信息集。如审计人员可运用该方法识别密集和稀疏的区域, 从而发现被审计数据的分布模式,
以及数据属性间的关系, 以进一步确定重点审计领域。企业的财务报表数据会随着企业经营业务的变化而变化, 一般来说,
真实的财务报表中主要项目的数据变动具有一定的规律性, 如果其变动表现异常, 表明数据中的异常点可能隐藏了重要的信息,
反映了被审计报表项目数据可能存在虚假成分。4. 关联分析。它通过利用关联规则可以从操作数据库的所有细节或事务中抽取频繁出现的模式,
其目的是挖掘隐藏在数据间的相互关系。利用关联分析, 审计人员可通过对被审计数据库中的数据利用关联规则进行挖掘分析, 找出被审计数据库中不同数据项之间的联系,
从而发现存在异常联系的数据项, 在此基础上通过进一步分析, 发现审计疑点。
二、应对“大数据”时代,审计分析应做出的调整
从以上分析过程中,我们不难看出“大数据”时代的数据存贮、处理、分析以及挖掘的各个方面虽然与传统方式相比,在技术层面上有了较大的改变,但是在基本的原理方面并没有显着的改变,原有的审计分析模式没有必要因为“大数据”时代的来临而急于做出相应的改变。然而“大数据”时代在给审计分析带来机遇的同时,还是给我们带给了相当大的冲击,对此我们有必要引起相当的重视,并在日后的信息化建设过程做出相应的调整。
1、数据的存贮与处理。大数据分析应用需求正在影响着数据存储基础设施的发展。随着结构化数据和非结构化数据量的持续增长,以及分析数据来源的多样化,此前存储系统的设计已经无法满足大数据应用的需要。基于块和文件的存储系统的架构设计需要进行调整以适应这些新的要求。审计部门在选择相应的存贮系统的时候,要对非结构化数据有足够的重视,做好采集的相关准备。同时随着采集数据的单位和年份越来越多,数据量必然是会有大规模的增长。即使是海量数据存储系统也一定要有相应等级的扩展能力。存储系统的扩展一定要简便,可以通过增加模块或磁盘柜来增加容量,甚至不需要停机。同时,为了提高数据的处理能力,解决I/O的瓶颈问题,可以考虑各种模式的固态存储设备,小到简单的在服务器内部做高速缓存,大到全固态介质可扩展存储系统通过高性能闪存存储都是可以考虑使用的设备。
2、非结构化的数据处理。非结构化数据的多元化给数据分析带来新的挑战,我们需要一套工具系统的去分析,提炼数据。语义引擎需要设计到有足够的人工智能以足以从数据中主动地提取信息。
3、可视化的分析。数据分析的使用者有数据分析专家,同时还有普通用户,但是他们二者对于数据分析最基本的要求就是可视化分析,因为可视化分析能够直观的呈现大数据特点,同时能够非常容易被读者所接受,就如同看图说话一样简单明了。
“一个平台、两个中心”建设,是审计署目前信息化建设的重要内容。通过数据中心的建设,可以在相当程度上解决数据存储与处理的问题;而数据式审计分析平台,同样可以在一定程度上实行可视化分析的相当一部分功能,但是对于越来越庞大的非结构化数据的存储和处理,将会是审计部门接下来所面临的最大的挑战。
Ⅱ 数据分析都分析什么
1、总规模度量
总量指标又称统计绝对数,是反映某一数据的整体规模大小,总量多少的指标。他是对原始数据经管分组和汇总以后得到的各项总计数字,是统计整理阶段的直接成功。
2、相对度量
相对指标是说明现象之间数量对比关系的指标,由两个有联系的指标数值对比而求得,其结果表现为相对数,相对数的重要特点就是把两个具体的数值概括为一个抽象的数。
3、集中趋势的度量
集中趋势是通过指标反映某一现象在一定时间段内所达到的一般水平。用平均指标来表示。平均指标分为数值平均和位置平均。
4、离散程度的度量
变异指标是用来表示总体分布的变异情况和离散程度的指标,通过变异程度也可以看出平均值指标的代表性程度,如果离散程度小,说明大部分数据都是挨着的,则平均值可以很好的反映整体情况的一般水平,反之相反。
Ⅲ 审计数据包括哪些内容
审计数据包括:
①原始数据:审计被审计单位抄录的原始数据,账面数据。
②强制数据:国家对有的资料下达的硬性指标数据,例如:国家在建设工程里边取费系数就是强制性数据。
③派生数据:审计将原始数据、强制数据相互验算得出的数据,例如;国家规定所得税税率是33%,您原来记取是按照30%,毛利额不变,用新的税率与毛利率相乘后得出的应交税金就变化了,这就叫“派生数据”。
④引用数据)为了使数据数据更有说服力,审计时就引用一些其他数据,例如:评价那么单位的绩效,就用同期数据、历史最好时期数据、世界先进水平数据比较,进一步评价单位是进步了、还是退不了,用”量’去说话。
按审计的内容分类,可分为财政收支审计、财务收支审计和经济效益审计三类。财政收支审计是指国家审计机关对本级财政预算执行情况和下级政府财政预算的执行情
况和决算,以及预算外资金的管理和使用情况的真实性、合法性进行的审计监督。财务收支审计是对金融机构、企事业单位的财务收支及有关的经济活动的真实性、
合法性所进行的审计监督。以企业财务收支审计为例,审计内容主要有:企业制定的财务会计核算办法是否符合《企业财务通则》、《企业会计准则》以及国家财务
会计法现、制度的规定;对企业一定时期内的财务状况和经营成果进行综合性的审查并做出客观评价。经济效益审计,是对财政、财务收支及其有关经济活动的效益
进行监督的行为。审计机关对列入审计监督范围的所有单位和项目,都可以进行经济效益审计,其中以审计公共财政资金使用效益最为典型。目前,我国审计机关主
要开展财政收支审计和财务收支审计。随着我国经济增长方式由粗放型逐步向集约型转变和实现可持续发展战略的实施,人们越来越关注经济效益问题。审计机关对
财政收支和财务收支进行监督的同时,将根据客观需要逐步开展经济效益审计。
国家审计的对象或客体,即哪些部门和单位必须接受审计。依据《宪法》和《审计法》规定,必须接受审计的部门和单位包括:国务院各部门、地方人民政府及其各部
门;国有的金融机构;国有企业和国有资产占控股地位或者主导地位的企业;国家事业组织;其他应当接受审计的部门和单位,以及上述部门和单位的有关人员。审
计的内容是这些部门和单位的财政收支和财务收支。接受审计监督的财政收支,是指依照《中华人民共和国预算法》和国家其他有关规定,纳入预算管理的收入和支
出,以及预算外资金的收入和支出。接受审计监督的财务收支,是指国有的金融机构、企业事业单位以及国家规定应当接受审计监督的其他各种资金的收入和支出。
财政、财务收支的划分不是截然对立的,在某些方面它们是重合或交叉的。
Ⅳ 内部审计中的大数据分析程序包括哪些阶段
内部审计中的大数据分析程序包括数据的线上化、数据的可采集以及数据可用的阶段。
1、数据线上化:大数据审计最重要的基础就是数据的线上化,可以说如果数据没有线上化就无法通过计算机做大量、全量的数据分析,就更不要提大数据审计。
2、数据可采集:只有数据线上化是不够的,不同系统后台数据的形式是各不相同的,而且不能在系统后台中直接做数据分析,而是需要将系统后台的数据采集到本机,转化成我们需要的格式(通常为XLS或CSV格式)进行分析。
3、数据可用:有些系统由于未做输入限制或输入校验,导致在数据的采集过程中会得到一些无效数据(如借方金额的字段中包合字母、符号、空值等对分析造成影响的数据)。
大数据规则分析
通过规则模型的应用,可实时将系统中符合模型设定条件的数据提取出来,及时传递给审计人员,以审查核实异常。在审计项目中,针对有的数据,使用数据分析的方法找出异常数据,进而确认问题的一种方法。
与传统的抽样审计方法相比,大数据审计通常使用的是全量分析的方式,更加关注数据之间的整体性与关联性,而不局限于某个个体的单独特性。