⑴ OLAP是什麼意思
OLAP(Online AnalyticalProcessing)是一種數據處理技術,專門設計用於支持復雜的分析操作,側重對決策人員和高層管理人員的決策支持,可以根據分析人員的要求快速、靈活地進行大數據量的復雜查詢處理,並且以一種直觀而易懂的形式將查詢結果提供給決策人員,以便他們准確掌握企業(公司)的經營狀況。
二十幾年前E.F. Codd提出OLAP時,也參照關系資料庫提出了12條規則,但後期沒有得到發展,其中有些規則在現在看來都已經不再完全適用,或者不是OLAP的特殊規則。因此我們從OLAP的本質定位上,重新確定三條原則,用以解析OLAP的歷史發展:
1、提供多維的業務視圖(「維」是OLAP存在和核心概念)
2、滿足靈活的交互分析(面向決策分析需要及時響應查詢需求的變更)
3、提供高速的檢索性能(沒有人希望查詢數據等待太長時間)
OLAP的技術派系
1、傳統OLAP
尊重傳統是技術領域最缺少的品德,傳統OLAP中尤其是Mondrian和SSAS還是有不少用戶群的(前者是開源軟體),反而選用Cognos、MSTR等的越來越少。
2、可視化OLAP
十幾年前,最火爆的BI產品是BO(2007年以68億美元被SAP收購)。BO里最早的核心技術叫做「動態微立方」,就是把基於語義模型查詢的結果集數據以MOLAP的方式存儲在內存中,以加快後期交互分析的效率。
現在同樣也有各種基於內存計算的軟體,但它們是以可視化為主,比如Tableau和Qlikview等
3、大數據OLAP
Hadoop的生態系統誕生於互聯網公司,從一開始就有開放的基因,這個OLAP派系最有意思的是Kylin,而且是咱中國人在Apache上的定級項目。