『壹』 數據中台和數據倉庫的區別是什麼
數據中台與數據倉庫沒有直接關系,在某個維度上他們為業務產生價值的形式有不同的側重,數據中台距離業務更近,能更快速地響應業務和應用開發的需求,可追溯、更精準。
1、概念上的區別
數據中台:企業級的邏輯概念,體現企業 D2V(Data to Value)的能力。
數據倉庫:一個相對具體的功能概念,是存儲和管理一個或多個主題數據的集合。
2、應用上的區別
數據中台:距離業務更近,通過將數據服務化之後提供給業務系統,為業務提供速度更快的服務,不僅限於分析型場景,也適用於交易型場景,強調共享和復用;
數據倉庫:支持管理決策分析,主要應用於BI;
3、價值上的區別
數據中台:建立在數據倉庫和大數據平台上,是加速企業從數據到業務價值過程的中間層。數據中台將數據生產為一個個數據 API 服務,以更高效的方式為業務提供服務。
數據倉庫:存儲的數據大多是根據需求有針對性抽取的結構化歷史數據,能夠生成各類報表,但這些報表都無法實時產生,因此,盡管能提供部分業務價值,但不能直接影響業務。
數據倉庫算產品,數據中台的精髓在於其機制,數據中台不是一個產品,而是一套體系,是一種組織架構,數據中台的開發和建設既可以建立企業數據倉庫基礎上,也可以建立在企業大數據平台基礎上,區別就在於企業的數據應用場景是否多元化。
『貳』 如何區別資料庫、數據中台、數據湖
數據湖、數據倉庫和數據中台,他們並沒有直接的關系,只是他們為業務產生價值的形式有不同的側重。
一、區別:
數據湖作為一個集中的存儲庫,可以在其中存儲任意規模的所有結構化和非結構化數據。在數據湖中,可以存儲數據不需要對其進行結構化,就可以運行不同類型的分析。
數據倉庫,也稱為企業數據倉庫,是一種數據存儲系統,它將來自不同來源的結構化數據聚合起來,用於業務智能領域的比較和分析,數據倉庫是包含多種數據的存儲庫,並且是高度建模的。
數據中台是一個承接技術,引領業務,構建規范定義的、全域可連接萃取的、智慧的數據處理平台,建設目標是為了高效滿足前台數據分析和應用的需求。數據中台距離業務更近,能更快速的相應業務和應用開發的需求,可追溯,更精準。
二、關系:
數據湖、數據倉庫更多地是面向不同對象的不同形態的數據資產。而數據中台更多強調的是服務於前台,實現邏輯、標簽、演算法、模型的復用沉澱。
數據中台像一個「數據工廠」,涵蓋了數據湖、數據倉庫等存儲組件,隨著數據中台的發展,未來很有可能數據湖和數據倉庫的概念會被弱化。
三、小結:
數據空間持續增長,為了更好地發揮數據價值,未來數據技術趨於融合,同時也在不斷創新。