1. 數據挖掘中常見的分類方法有哪些
判別分析、規則歸納、決策樹、神經網路、K最近鄰、基於案例的推理、遺傳演算法等等挺多的,這個問題范圍太大了,雲速數據挖掘分類挺多。
2. 信息分類的方法有哪些
信息分類常見的分類方法有兩種:
線分類法
線分類法又稱層級分類法,是指將分類對象按所選定的若干分類標志,逐次地分成相應的若干層級類目,並排列成一個有層次逐級展開的分類體系。
分類體系的一般表現形式是大類、中類、小類等級別不同的類目逐級展開,體系中各層級所選用的標志不同,同位類構成並列關系,上下位類構哪汪成隸屬關系。
由一個類目直接劃分出來的下一級各類目之間存在著並列關系,不重復,不交叉。
線分類法應遵循的基本原則:
1.在線分類法中,由某一上位類類目劃分出的下位類類目的總范圍應與上位類類目范圍相同(都屬於傢具)。
2.當一個上位類類目劃分成若干個下位類類目時,應選擇一個劃分標志(按照製作原料)。
3.同位類類目之間不交叉、不重復,並只對應於一個上位類(木椅、木凳、木桌、木箱、木架)。
4.分類要依次進行,不應有空層或加層。
線分類法的優缺點:
Ø優點:層次性好,能較好地反映類目之間的邏輯關系,使用方便,既適合於手工處理信息的傳統習慣,又便於計算機處理信息。
Ø缺點:線分類體系存在著分類結構彈性差(分類結構一經確定,不易改動)、效率較低(當分類層次較多時,代碼位數較長,影響數據處理的速度)。
面分類法
面分類法又稱平行分類法,它是將擬分類的商品 *** 總體,根據其本身的屬性或特徵,分成相互之間沒有隸屬關系的面,每個面都包含一組類目。
將每個面中的一種類目與另一個面中的一種類目組合在一起,即組成一個復合類目。
服裝的分類就是按照面分類法組配的。
把服裝用的面料、款式、穿著用途分為三個互相之間沒有隸屬關系的「面」,每個「面」又分成若干個類目。
使用時,將有關類目組配起來。
如:純毛男式西裝,純棉女式連衣裙等。
面分類法應遵循的基本原則:
1.根據需要,應將分類對象的本質屬性作為分類對象的標志。
2.不同面的類目之間不能相互交叉,也不能重復出現。
3.每個面有嚴格的固定位置。
4.面的選擇以及位置的確定應根據實際需要而定。
面分類法的優缺點:
Ø優點:具有較大的彈性,可以較大量地擴充新類目,不必預先確定好最後的分組,適用於計算機管理。
Ø缺點:組配結構太復雜,不便於手工處理,其容量也不能充分利用。
信息編碼是將某一類信息賦予一定的符號,為了滿足實際業務應用,編碼需要具備以下基本原則:
1.唯一性:編碼必須保證每一個編碼對象對應僅有一個代碼。
2.可擴展性:代碼結構必須能夠適應編碼對象不斷增加的需要
3.簡單性:在不影響代碼的容量和可擴展性的情況茄孝下,代碼盡量簡短明確,以減少差錯,方便閱讀、抄錄
4.一貫性:同一級代碼類型、結構以及編寫格式必須統一,一直沿用代碼格式,不要中途變化格式。
5.可操作性:代碼應盡可能反映編碼對象的特點,有助記憶,便於填寫。
少使用其他符號,如『#』、『-』、『*』等。
6.穩定性:代碼不宜頻繁變動,應考慮其變化的可能性,盡可能保持代碼系統的相對穩定。
在當前的企業應用中,編碼的方式主要有以下幾種:
1英文字母法:英文字母法是指將某項物資用特定的一個字母或一組字母來表示。
2數字法:指將某項物資用特定的一個數字或一組數字來表示的方法。
數字法還可考慮以下幾種編碼方法。
a)連續數字法,首先要求將所有物資進行分類,並按一定的規律先後排列,然後自1號起依順序編排流水號,此方法優點是代號連貫,但未來新增類別時,不能在中間穿插,只能在後面添加。
b)階梯式數字法,首先要求將所有物資分成若干大類,其次再將各大類按其次級類別分成若干中類。
c)區段數字法,是介於連續數字法與階梯式數字法之間的一種表示方法。
d)國際十進制分類法,是指將所有物資分為十大類,分別以0-9之間的數字代表;然後每大類再劃分為十個中類,並分別再以0-9之間的數字代表,如此進行下去。
3暗示法:是指根據物資的特性,採用特定的數字或符號使之能代表物資特性的方法,又可分為數字暗示和符號暗示法。
4混合法:是指將英文字母和數字結合起來使用的方法。
根據以上編碼原則與方法顫緩稿,下面將根據企業資產管理過程中需要進行編碼的內容進行舉例說明,簡單直觀的了解編碼過程中的關鍵因素。
1.客戶管理信息(混合法)
XXXXXXXXXXXX
第四層:郵政編碼
第三層:客戶代碼
第二層:客戶類別
第一層:客戶信息類目:
編碼:110BSF200137
1-客戶管理,1-直接客戶,0BSF-巴斯夫公司,200137-郵政編碼
2.物料分類信息(國際十進制分類法)
6應用科學
62.工業技術
621.機械的工業技術
621.8動力傳動
621.88挾具
621.882.螺絲、螺帽
621.882.2各種小螺絲
621.882.21金屬用小螺絲
621.882.215丸螺絲
621.682.215.3平螺絲
信息編碼是企業資產管理的基礎性工作,是實現企業信息共享和交互的前提和基礎,總結信息編碼的作用可以歸結如下: