导航:首页 > 数据处理 > 数据挖掘中关联分析有哪些方法

数据挖掘中关联分析有哪些方法

发布时间:2023-02-06 20:45:52

A. 数据挖掘方法入门——关联分析

自然界中,某件事情发生时,其他事件也会发生,这种联系称为关联。关联分析就是为了寻找事物之间的一些有趣的关联关系。

最让人熟知的就是购物篮分析,商场在分析用户经常同时购买“啤酒、尿布“、“篮球”、“篮球服”等商品组合,于是将其放在一起以促进销售。这种关联关系的分析,不仅应用与网站设计者可以根据访客日志数据,发现访客浏览习惯和网站页面间的关系。

拿某个商场的交易数据中进行分析,数据集中有限的项目经过排列组合以后可以产生大量的关联规则,但是,只有一小部分的规则会是用户感兴趣的,因此需要引入一个“兴趣度”的概念帮助用户评估得到的关联规则。

而与兴趣度评估相关的度量包括:简洁性、正确性、实用性、新颖性

1)简洁性:太复杂的规则会让用户的兴趣度降低,也难以解释和理解

2)正确性:令人信服的程度有多高。

正确性的判断指标是置信度,表示这个规则正确的概率有多大。即在某一项x出现的前提下,另外一项y出现的频率是多少。

置信度confident(x=>y)=p(y|x)

3)实用性:判断该规则再次出现的可能性有多大,即这个指标的覆盖率。

实用性的判断指标是支持度,支持度越大说明规则应用越广泛,即xy同时出现的频率.

支持度support(x=>y)= p(x U y)

4)新颖性:判断规则是否已经被导出的另外一个规则作蕴含。

在这4个指标中,置信度和实用性是用来评判一条规则是强关联规则的依据。

强关联规则:同时满足用户定义的最小支持度阈值和最小置信度阈值的关联规则

弱关联规则:不满足最小支持度阈值和最小置信度阈值的关联规则

5)改善度:

期望可信度是在x没有影响的作用下y出现的频率,p(i)

改善度则是评估x的出现对y的出现的影响性。p(y|x)/p(x)越大,则改善度越高,说明x的出现对y的可能影响就越大。

1)布尔规则和量化规则

(1)布尔规则:性别=女=》职业=老师

(2)量化规则:性别=女=》平均收入=2300

量化关联规则可以直接对原始数据进行处理,或先对数值型属性进行分区间进行动态分割

2)单层规则和多层关联规则

在单层规则中,所有的项不考虑现实数据的多层性,而在实际应用中,涉及不同的抽象层发现的多层关联规则则是一种更有用的关联规则,因为属性之间存在一种层次关系。

(1)不涉及不同抽象层的项的规则称为单层关联规则

adidas篮球=》nike篮球服

(2)较高层次和较低层次之间规则称为多层关联规则

adidas篮球=》篮球服

3)单维规则和多维规则

(1)单维关联规则:处理同一个属性或维度内的联系。

adidas篮球=》nike篮球服

(2)多维关联规则:多个属性或维度之间的联系。

用户的年龄和购买物品

B. 数据挖掘的方法有哪些

神经网络方法


神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注。


遗传算法


遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法,是一种仿生全局优化方法。遗传算法具有的隐含并行性、易于和其它模型结合等性质使得它在数据挖掘中被加以应用。


决策树方法


决策树是一种常用于预测模型的算法,它通过将大量数据有目的分类,从中找到一些有价值的,潜在的信息。它的主要优点是描述简单,分类速度快,特别适合大规模的数据处理。


粗集方法


粗集理论是一种研究不精确、不确定知识的数学工具。粗集方法有几个优点:不需要给出额外信息;简化输入信息的表达空间;算法简单,易于操作。粗集处理的对象是类似二维关系表的信息表。


覆盖正例排斥反例方法


它是利用覆盖所有正例、排斥所有反例的思想来寻找规则。首先在正例集合中任选一个种子,到反例集合中逐个比较。与字段取值构成的选择子相容则舍去,相反则保留。按此思想循环所有正例种子,将得到正例的规则(选择子的合取式)。


统计分析方法


数据库字段项之间存在两种关系:函数关系和相关关系,对它们的分析可采用统计学方法,即利用统计学原理对数据库中的信息进行分析。可进行常用统计、回归分析、相关分析、差异分析等。


模糊集方法


即利用模糊集合理论对实际问题进行模糊评判、模糊决策、模糊模式识别和模糊聚类分析。系统的复杂性越高,模糊性越强,一般模糊集合理论是用隶属度来刻画模糊事物的亦此亦彼性的。


关于数据挖掘的方法有哪些,青藤小编就和您分享到这里了。如果您对大数据工程有浓厚的兴趣,希望这篇文章可以为您提供帮助。如果您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。

C. 什么是数据挖掘中的关联分析

FineBI数据挖掘的结果将以字段和记录的形式添加到多维数据库中,并可以在新建分析时从一个专门的数据挖掘业务包中被使用,使用的方式与拖拽任何普通的字段没有任何区别。
配合FineBI新建分析中的各种控件和图表,使用OLAP的分析人员可以轻松的查看他们想要的特定的某个与结果,或是各种各样结果的汇总。

D. 数据挖掘的常用方法有哪些

1、决策树法

决策树在解决归类与预测上有着极强的能力,它以法则的方式表达,而这些法则则以一连串的问题表示出来,经由不断询问问题最终能导出所需的结果。典型的决策树顶端是一个树根,底部有许多的树叶,它将纪录分解成不同的子集,每个子集中的字段可能都包含一个简单的法则。此外,决策树可能有着不同的外型,例如二元树、三元树或混和的决策树型态。


2、神经网络法


神经网络法是模拟生物神经系统的结构和功能,是一种通过训练来学习的非线性预测模型,它将每一个连接看作一个处理单元,试图模拟人脑神经元的功能,可完成分类、聚类、特征挖掘等多种数据挖掘任务。神经网络的学习方法主要表现在权值的修改上。其优点是具有抗干扰、非线性学习、联想记忆功能,对复杂情况能得到精确的预测结果;缺点首先是不适合处理高维变量,不能观察中间的学习过程,具有“黑箱”性,输出结果也难以解释;其次是需较长的学习时间。神经网络法主要应用于数据挖掘的聚类技术中。


3、关联规则法


关联规则是描述数据库中数据项之间所存在的关系的规则,即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现,即隐藏在数据间的关联或相互关系。在客户关系管理中,通过对企业的客户数据库里的大量数据进行挖掘,可以从大量的记录中发现有趣的关联关系,找出影响市场营销效果的关键因素,为产品定位、定价与定制客户群,客户寻求、细分与保持,市场营销与推销,营销风险评估和诈骗预测等决策支持提供参考依据。


4、遗传算法


遗传算法模拟了自然选择和遗传中发生的繁殖、交配和基因突变现象,是一种采用遗传结合、遗传交叉变异及自然选择等操作来生成实现规则的、基于进化理论的机器学习方法。它的基本观点是“适者生存”原理,具有隐含并行性、易于和其他模型结合等性质。主要的优点是可以处理许多数据类型,同时可以并行处理各种数据;缺点是需要的参数太多,编码困难,一般计算量比较大。遗传算法常用于优化神经元网络,能够解决其他技术难以解决的问题。


5、聚类分析法


聚类分析是把一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能小。根据定义可以把其分为四类:基于层次的聚类方法;分区聚类算法;基于密度的聚类算法;网格的聚类算法。常用的经典聚类方法有K-mean,K-medoids,ISODATA等。


6、模糊集法


模糊集法是利用模糊集合理论对问题进行模糊评判、模糊决策、模糊模式识别和模糊聚类分析。模糊集合理论是用隶属度来描述模糊事物的属性。系统的复杂性越高,模糊性就越强。


7、web页挖掘


通过对Web的挖掘,可以利用Web的海量数据进行分析,收集政治、经济、政策、科技、金融、各种市场、竞争对手、供求信息、客户等有关的信息,集中精力分析和处理那些对企业有重大或潜在重大影响的外部环境信息和内部经营信息,并根据分析结果找出企业管理过程中出现的各种问题和可能引起危机的先兆,对这些信息进行分析和处理,以便识别、分析、评价和管理危机。


8、逻辑回归分析


反映的是事务数据库中属性值在时间上的特征,产生一个将数据项映射到一个实值预测变量的函数,发现变量或属性间的依赖关系,其主要研究问题包括数据序列的趋势特征、数据序列的预测以及数据间的相关关系等。


9、粗糙集法


是一种新的处理含糊、不精确、不完备问题的数学工具,可以处理数据约简、数据相关性发现、数据意义的评估等问题。其优点是算法简单,在其处理过程中可以不需要关于数据的先验知识,可以自动找出问题的内在规律;缺点是难以直接处理连续的属性,须先进行属性的离散化。因此,连续属性的离散化问题是制约粗糙集理论实用化的难点。


10、连接分析


它是以关系为主体,由人与人、物与物或是人与物的关系发展出相当多的应用。例如电信服务业可藉连结分析收集到顾客使用电话的时间与频率,进而推断顾客使用偏好为何,提出有利于公司的方案。除了电信业之外,愈来愈多的营销业者亦利用连结分析做有利于企业的研究。

阅读全文

与数据挖掘中关联分析有哪些方法相关的资料

热点内容
所需的五个数据在同一列如何引用 浏览:285
微商怎么做人脉代理 浏览:357
怎么去龙洞华侨职业技术学校 浏览:299
你是如何获取租房信息的 浏览:931
代理费多少钱什么意思 浏览:189
安信证券交易界面怎么显示 浏览:183
东阳卖狗的宠物市场在哪里 浏览:98
不当交易检察官最后怎么样了 浏览:964
xbox怎么交易 浏览:296
交易猫如何100退款成功 浏览:993
高中生信息泄露有什么后果 浏览:330
如何构建企业信息利用 浏览:976
线上怎么销售产品图片 浏览:14
电脑股票交易明细按哪个键 浏览:366
注塑产品如何开机 浏览:990
建设银行普通信息卡是哪个 浏览:369
电商黑马技术有多少 浏览:965
三圣花乡花市场搬到哪里去了 浏览:295
口腔医学技术多少人学 浏览:314
权健产品什么时候重新上市 浏览:639