1. 数据挖掘中常见的分类方法有哪些
判别分析、规则归纳、决策树、神经网络、K最近邻、基于案例的推理、遗传算法等等挺多的,这个问题范围太大了,云速数据挖掘分类挺多。
2. 信息分类的方法有哪些
信息分类常见的分类方法有两种:
线分类法
线分类法又称层级分类法,是指将分类对象按所选定的若干分类标志,逐次地分成相应的若干层级类目,并排列成一个有层次逐级展开的分类体系。
分类体系的一般表现形式是大类、中类、小类等级别不同的类目逐级展开,体系中各层级所选用的标志不同,同位类构成并列关系,上下位类构哪汪成隶属关系。
由一个类目直接划分出来的下一级各类目之间存在着并列关系,不重复,不交叉。
线分类法应遵循的基本原则:
1.在线分类法中,由某一上位类类目划分出的下位类类目的总范围应与上位类类目范围相同(都属于家具)。
2.当一个上位类类目划分成若干个下位类类目时,应选择一个划分标志(按照制作原料)。
3.同位类类目之间不交叉、不重复,并只对应于一个上位类(木椅、木凳、木桌、木箱、木架)。
4.分类要依次进行,不应有空层或加层。
线分类法的优缺点:
Ø优点:层次性好,能较好地反映类目之间的逻辑关系,使用方便,既适合于手工处理信息的传统习惯,又便于计算机处理信息。
Ø缺点:线分类体系存在着分类结构弹性差(分类结构一经确定,不易改动)、效率较低(当分类层次较多时,代码位数较长,影响数据处理的速度)。
面分类法
面分类法又称平行分类法,它是将拟分类的商品 *** 总体,根据其本身的属性或特征,分成相互之间没有隶属关系的面,每个面都包含一组类目。
将每个面中的一种类目与另一个面中的一种类目组合在一起,即组成一个复合类目。
服装的分类就是按照面分类法组配的。
把服装用的面料、款式、穿着用途分为三个互相之间没有隶属关系的“面”,每个“面”又分成若干个类目。
使用时,将有关类目组配起来。
如:纯毛男式西装,纯棉女式连衣裙等。
面分类法应遵循的基本原则:
1.根据需要,应将分类对象的本质属性作为分类对象的标志。
2.不同面的类目之间不能相互交叉,也不能重复出现。
3.每个面有严格的固定位置。
4.面的选择以及位置的确定应根据实际需要而定。
面分类法的优缺点:
Ø优点:具有较大的弹性,可以较大量地扩充新类目,不必预先确定好最后的分组,适用于计算机管理。
Ø缺点:组配结构太复杂,不便于手工处理,其容量也不能充分利用。
信息编码是将某一类信息赋予一定的符号,为了满足实际业务应用,编码需要具备以下基本原则:
1.唯一性:编码必须保证每一个编码对象对应仅有一个代码。
2.可扩展性:代码结构必须能够适应编码对象不断增加的需要
3.简单性:在不影响代码的容量和可扩展性的情况茄孝下,代码尽量简短明确,以减少差错,方便阅读、抄录
4.一贯性:同一级代码类型、结构以及编写格式必须统一,一直沿用代码格式,不要中途变化格式。
5.可操作性:代码应尽可能反映编码对象的特点,有助记忆,便于填写。
少使用其他符号,如‘#’、‘-’、‘*’等。
6.稳定性:代码不宜频繁变动,应考虑其变化的可能性,尽可能保持代码系统的相对稳定。
在当前的企业应用中,编码的方式主要有以下几种:
1英文字母法:英文字母法是指将某项物资用特定的一个字母或一组字母来表示。
2数字法:指将某项物资用特定的一个数字或一组数字来表示的方法。
数字法还可考虑以下几种编码方法。
a)连续数字法,首先要求将所有物资进行分类,并按一定的规律先后排列,然后自1号起依顺序编排流水号,此方法优点是代号连贯,但未来新增类别时,不能在中间穿插,只能在后面添加。
b)阶梯式数字法,首先要求将所有物资分成若干大类,其次再将各大类按其次级类别分成若干中类。
c)区段数字法,是介于连续数字法与阶梯式数字法之间的一种表示方法。
d)国际十进制分类法,是指将所有物资分为十大类,分别以0-9之间的数字代表;然后每大类再划分为十个中类,并分别再以0-9之间的数字代表,如此进行下去。
3暗示法:是指根据物资的特性,采用特定的数字或符号使之能代表物资特性的方法,又可分为数字暗示和符号暗示法。
4混合法:是指将英文字母和数字结合起来使用的方法。
根据以上编码原则与方法颤缓稿,下面将根据企业资产管理过程中需要进行编码的内容进行举例说明,简单直观的了解编码过程中的关键因素。
1.客户管理信息(混合法)
XXXXXXXXXXXX
第四层:邮政编码
第三层:客户代码
第二层:客户类别
第一层:客户信息类目:
编码:110BSF200137
1-客户管理,1-直接客户,0BSF-巴斯夫公司,200137-邮政编码
2.物料分类信息(国际十进制分类法)
6应用科学
62.工业技术
621.机械的工业技术
621.8动力传动
621.88挟具
621.882.螺丝、螺帽
621.882.2各种小螺丝
621.882.21金属用小螺丝
621.882.215丸螺丝
621.682.215.3平螺丝
信息编码是企业资产管理的基础性工作,是实现企业信息共享和交互的前提和基础,总结信息编码的作用可以归结如下: