『壹』 什麼是數據挖掘,簡述其作用和應用。
數據挖掘是指從大量的數據中通過演算法搜索隱藏於其中信息的過程。
數據挖掘通常與計算機科學有關,並通過統計、在線分析處理、情報檢索、機器學習、專家系統和模式識別等諸多方法來實現上述目標。
人們迫切希望能對海量數據進行深入分析,發現並提取隱藏在其中的信息,以更好地利用這些數據,正是在這樣的條件下,數據挖掘技術應運而生。
數據挖掘有很多合法的用途,例如可以在患者群的資料庫中查出某葯物和其副作用的關系。這種關系可能在1000人中也不會出現一例,但葯物學相關的項目就可以運用此方法減少對葯物有不良反應的病人數量,還有可能挽救生命。
目前數據挖掘的演算法主要包括神經網路法、決策樹法、遺傳演算法、粗糙集法、模糊集法、關聯規則法等。
根據信息存儲格式,用於挖掘的對象有關系資料庫、面向對象資料庫、數據倉庫、文本數據源、多媒體資料庫、空間資料庫、時態資料庫、異質資料庫以及internet等。
數據挖掘過程是一個反復循環的過程,每一個步驟如果沒有達到預期目標,都需要回到前面的步驟,重新調整並執行。不是每件數據挖掘的工作都需要這里列出的每一步。
『貳』 什麼是數據挖掘
數據挖掘是從大量的、不完全的、有雜訊的、模糊的、隨機的數據中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。
數據挖掘流程:
定義問題:清晰地定義出業務問題,確定數據挖掘的目的。
數據准備:數據准備包括:選擇數據–在大型資料庫和數據倉庫目標中 提取數據挖掘的目標數據集;數據預處理–進行數據再加工,包括檢查數據的完整性及數據的一致性、去雜訊,填補丟失的域,刪除無效數據等。
數據挖掘:根據數據功能的類型和和數據的特點選擇相應的演算法,在凈化和轉換過的數據集上進行數據挖掘。
結果分析:對數據挖掘的結果進行解釋和評價,轉換成為能夠最終被用戶理解的知識。
『叄』 我想問問數據挖掘可以做什麼
數據挖掘能做以下七種不同事情:分類、估計、預測、相關性分組或關聯規則、聚類、描述和可視化、瞎鄭復雜數據類型挖掘。數據挖掘(DataMining)的定義尺神逗是通過分析每個數據,從大量數據中尋找其規律的技術,主要有數據准備、規律尋找和規律表示3個步驟。數據挖掘的任務有關聯分析、聚類分析、分陵賣類分析、異常分析、特異群組分析和演變分析等。
更多關於數據挖掘可以做什麼,進入:https://m.abcgonglue.com/ask/c9b96b1615831141.html?zd查看更多內容
『肆』 數據挖掘的預測建模任務主要包括哪幾大類問題
數據挖掘的預測建模任務主要包括以下幾大類問題:
1.分類問題:將數據分成不同的類別,例如將客戶分為高、中、低價值客戶,或將電子郵件歸類為垃圾郵件和非垃圾郵件等。
5.時序分析:預測未來的趨勢或周期性變化,例如預測某種商品的銷售量在接下來的幾個月內會有何種走勢等。
這些預測建模任務在實際生活和工作中都有廣泛的應用,可以幫助企業和個人做出更准確的決策,提高效率慧跡和利潤。
『伍』 數據挖掘的主要步驟有哪些
(1)信息收集:根據確定的數據分析對象抽象出在數據分析中所需要的特徵信息,然後選擇合適的信息收集方法,將收集到的信息存入資料庫。對於海量數據,選擇一個合適的數據存儲和管理的數據倉庫是至關重要的。
(2)數據集成:把不同來源、格式、特點性質的數據在邏輯上或物理上有機地集中,從而為企業提供全面的數據共享。
(3)數據規約:執行多數的數據挖掘演算法即使在少量數據上也需要很長的時間,而做商
業運營數據挖掘時往往數據量非常大。數據規約技術可以用來得到數據集的規約表示,它小得多,但仍然接近於保持原數據的完整性,並且規約後執行數據挖掘結果與規約前執行結果相同或幾乎相同。
(4)數據清理:在資料庫中的數據有一些是不完整的(有些感興趣的屬性缺少屬性值),含雜訊的(包含錯誤的屬性值),並且是不一致的(同樣的信息不同的表示方式),因此需要進行數據清理,將完整、正確、一致的數據信息存入數據倉庫中。不然,挖掘的結果會差強人意。
(5)數據變換:通過平滑聚集,數據概化,規范化等方式將數據轉換成適用於數據挖掘的形式。對於有些實數型數據,通過概念分層和數據的離散化來轉換數據也是重要的。
(6)數據挖掘過程:根據數據倉庫中的數據信息,選擇合適的分析工具,應用統計方法、事例推理、決策樹、規則推理、模糊集、甚至神經網路、遺傳演算法的方法處理信息,得出有用的分析信息。
(7)模式評估:從商業角度,由行業專家來驗證數據挖掘結果的正確性。
(8)知識表示:將數據挖掘所得到的分析信息以可視化的方式呈現給用戶,或作為新的知識存放在知識庫中,供其他應用程序使用。