A. 教你輕松掌握數據倉庫的規劃和構建策略
教你輕松掌握數據倉庫的規劃和構建策略
數據倉庫作為決策支持系統(DSS)的基礎,具有面向主題的、集成的、不可更新的、隨時間不斷變化的特性。這些特點說明了數據倉庫從數據組織到數據處理,都與原來的資料庫有很大的區別,這也就需要在數據倉庫系統設計時尋求一個適合於數據倉庫設計的方法。在一般的系統開發規劃中,首先需要確定系統的功能,這些系統的功能一般是通過對用戶的需求分析得到的。從數據倉庫的應用角度來看,DSS分析員一般是企業中的中高層管理人員,他們對決策支持的需求不能預先做出規范的說明,只能給設計人員一個抽象地描述。
這就需要設計人員在與用戶不斷的交流溝通中,將系統的需求逐步明確,並加以完善。因此數據倉庫的開發規劃過程實際上是一個用戶和設計人員對其不斷了解、熟悉和完善的過程。 數據倉庫的開發應用規劃是開發數據倉庫的首要任務。只有制定了正確的數據倉庫規劃,才能使組織主要力量有序地實現數據倉庫的開發應用。在數據倉庫規劃中一般需要經歷這樣幾個過程:選擇實現策略、確定數據倉庫的開發目標和實現范圍、選擇數據倉庫體系結構、建立商業和項目規劃預算。 當數據倉庫規劃完成後,需要編制相應的數據倉庫規劃說明書,說明數據倉庫與企業戰略的關系,以及與企業急需處理的、范圍相對有限的開發機會,重點支持的職能部門和今後數據倉庫開發工作的建議,實際使用方案和開發預算,作為數據倉庫實際開發的依據。
1、選擇數據倉庫實現策略
數據倉庫的開發策略主要有自頂向下、自底向上和這兩種策略的聯合使用。自頂向下策略在實際應用中比較困難,因為數據倉庫的功能是一種決策支持功能。這種功能在企業戰略的應用范圍中常常是很難確定的,因為數據倉庫的應用機會往往超出企業當前的實際業務范圍,而且在開發前就確定目標,會在實現預定目標後就不再追求新的應用,是數據倉庫喪失更有戰略意義的應用。由於該策略在開發前就可以給出數據倉庫的實現范圍,能夠清楚地向決策者和企業描述系統的收益情況和實現目標,因此是一種有效的數據倉庫開發策略。該方法使用時需要開發人員具有豐富的自頂向下開發系統的經驗,企業決策層和管理人員完全知道數據倉庫的預定目標並且了解數據倉庫能夠在那些決策中發揮作用。
自底向上策略一般從某個數據倉庫原型開始,選擇一些特定的為企業管理人員所熟知的管理問題作為數據倉庫開發的對象,在此基礎上進行數據倉庫的開發。因此,該策略常常用於一個數據集市、一個經理系統或一個部門的數據倉庫開發。該策略的優點在於企業能夠以較小的投入,獲得較高的數據倉庫應用收益。在開發過程中,人員投入較少,也容易獲得成效。當然,如果某個項目的開發失敗可能造成企業整個數據倉庫系統開發的延遲。該策略一般用於企業洗碗對數據倉庫的技術進行評價,以確定該技術的應用方式、地點和時間,或希望了解實現和運行數據倉庫所需要的各種費用,或在數據倉庫的應用目標並不是很明確時,數據倉庫對決策過程影響不是很明確時使用。
在自頂向下的開發策略中可以採用結構化或面向對象的方法,按照數據倉庫的規劃、需求確定、系統分析、系統設計、系統集成、系統測試和系統試運行的階段完成數據倉庫的開發。而在自底向上的開發中,則可以採用螺旋式的原型開發方法,使用戶可以根據新的需求對試運行的系統進行修改。螺旋式的原型開發方法要求在較短的時間內快速的生成可以不斷增加功能的數據倉庫系統,這種開發方法主要適合於這樣一些場合:在企業的市場動向和需求無法預測,市場的時機是實現產品的重要組成部分,不斷地改進對與企業的市場調節是必需的;持久的競爭優勢來自連續不斷地改進,系統地改進是基於用戶在使用中的不斷發現。 自頂向下和自底向上策略的聯合使用具有兩種策略的優點,既能快速的完成數據倉庫的開發與應用,還可建立具有長遠價值的數據倉庫方案。但在實踐中往往難以操作,通常需要能夠建立、應用和維護企業模型、數據模型和技術結構的、具有豐富經驗的開發人員,能夠熟練的從具體(如業務系統中的元數據)轉移到抽象(只基於業務性質而不是基於實現系統技術的邏輯模型);企業需要擁有由最終用戶和信息系統人員組成的有經驗的開發小組,能夠清楚地指出數據倉庫在企業戰略決策支持中的應用。
2、確定數據倉庫的開發目標和實現范圍
為確定數據倉庫的開發目標和實現范圍,首先需要對企業管理者等數據倉庫用戶解釋數據倉庫在企業管理中的應用和發展趨勢,說明企業組織和使用數據來支持跨功能系統的重要性,對企業經營戰略的支持,以確定開發目標。在該階段確認與使用數據倉庫有關的業務要求,這些要求應該只支持最主要的業務職能部門,將使用精力集中在收益明顯的業務上,使數據倉庫的應用立即產生效果,不應該消耗太多的精力在各個業務上同時鋪開數據倉庫的應用。
在確定開發目標和范圍以後,應該編制需求文檔,作為今後開發數據倉庫的依據。 數據倉庫開發的首要目標是確定所需要信息的范圍,確定用戶提供決策幫助時,在主題和指標域需要哪些數據源。這就需要定義:用戶需要什麼數據?面向主題的數據倉庫需要什麼樣的支持數據?為成功地向用戶提交數據,開發人員需要哪些商業知識?哪些背景知識?這就需要定義整體需求,以文件的形式整理現存的記錄系統和系統環境,對使用數據倉庫中數據的候選應用系統進行標識、排序,構造一個傳遞模型,確定尺度、事實及時間標記演算法,以便從系統中抽取信息且將他們放入數據倉庫。通過信息范圍確定可為開發人員提供一個良好的分析平台,和用戶一起分析哪些信息是數據倉庫需要的,進行商業活動需要什麼數據。開發人員可以和用戶進一步定義需要,例如數據分級層次、聚合的層次、載入的頻率以及需要保持的時間表等。 數據倉庫開發的另一個重要目標是確定利用哪些方法和工具訪問和導航數據?雖然用戶都需要存取並且檢索數據倉庫的內容,但是所存取的粒度有所不同,有的可能是詳細的記錄,有的可能是比較概括的記錄或十分概括的記錄。用戶要求的數據概括程度不同,將導致數據倉庫的聚集和概括工具的需求不同。
數據倉庫還有具有一定功能來訪問和檢索圖表、預定義的報表、多維數據、概括性數據和詳細記錄。用戶從數據倉庫中獲得信息,應該有電子表格、統計分析器和支持多維分析的分析處理器等工具的支持,以解釋和分析數據倉庫中的內容,產生並且驗證不同的市場假設、建議和決策方案。為將決策建議和各種決策方案向用戶清楚地表達出來,需要利用報表、圖表和圖像等強有力的信息表達工具。 數據倉庫開發的其他目標,是確定數據倉庫內部數據的規模。在數據倉庫中不僅包含當前數據,而且包含多年的歷史數據。數據的概括程度決定了這些數據壓縮和概括的最大限度。如果要讓數據倉庫提供對歷史記錄進行決策查詢的功能,就必須支持對大量數據的管理。數據的規模不僅直接影響決策查詢的時間,而且還將直接影響企業決策的質量。
在數據倉庫的開發目標中,還有:根據用戶對數據倉庫的基本需求,確定數據倉庫中數據的含義;確定數據倉庫內容的質量,以確定使用、分析和建議的可信級別;哪種類型的數據倉庫可以滿足最終用戶的需求,這些數據倉庫應該具有怎樣的功能;需要哪些元數據,如何使用數據源中的數據等。 數據倉庫的開發目標多種多樣,十分復雜,需要開發人員和用戶在開發與使用的過程中不斷交互完善。因此,在規劃中需要確定數據倉庫的開發范圍。使開發人員能夠根據需求和目標的重要性逐步進行,並且在開發中吸取經驗教訓,為數據倉庫在企業中的全部實現提供技術准備。因此,在為數據倉庫確定總體開發方向和目標以後,就必須確定一個有限的能夠很快體現數據倉庫效益的使用范圍。在考慮數據倉庫苦的應用范圍時,主要從使用部門的數量和類型、數據源的數量、企業模型的子集、預算分配以及開發項目所需的時間等角度分析。
在分析這些因素時,可從用戶的角度和技術的角度兩方面進行。 從用戶的角度應該分析哪些部門最先使用數據倉庫?是哪些人員為了什麼目的使用數據倉庫?以及數據倉庫首先要滿足哪些決策查詢?因為這些決策查詢往往確定了關於數據維數、報表的種類,這些因素都將確定數據倉庫定義時所需要的數量關系。查詢的格式越具體,越容易提供數據倉庫的維數、聚集和概括的規劃說明。 從技術角度分析,應該確定數據倉庫中元資料庫的規模,數據倉庫的元資料庫是存儲數據倉庫中數據定義的模型。數據定義存儲在倉庫管理器的目錄中,可以作為所有查詢和報表工具構造和查詢數據倉庫的依據。元資料庫的規模直接表示了數據倉庫中必須管理的數據規模。通過對元資料庫規模的管理,實際上就確定了數據倉庫中所需要管理的數據規模。
3、數據倉庫的結構選擇
數據倉庫的結構可以進行靈活的選擇,可將組織所使用的各種平台進行恰當的分割,把數據源、數據倉庫和最終用戶使用的工作站分割開來進行恰當的設計。
(1)數據倉庫的應用結構
基於業務處理系統的數據倉庫 在這種結構中,將運作的數據用於無需修改數據的只讀應用程序中。具有這種結構的數據倉庫元資料庫是一種虛庫,而不是數據倉庫自身的元數據。在數據倉庫元資料庫的直接指導下,對數據倉庫的查詢就是簡單的從資料庫中抽取數據。
單純數據倉庫
利用在數據倉庫中的數據源凈化、集成、概括和集成等操作,將數據源從業務處理系統中傳輸進集中的數據倉庫,各部門的數據倉庫應用只在數據倉庫中進行。這種結構經常發生在多部門、少用戶使用數據倉庫的情況下。這里的集中僅僅是邏輯上的,物理上可能是分散的。
單純數據集市
數據集市是指在部門中使用的數據倉庫,因為企業中的各個職能部門都有自己的特殊需要,而統一的數據倉庫可能不能滿足這些部門的特殊要求。這種體系結構經常發生在個別部門對數據倉庫的應用感興趣,而組織中其他部門卻對數據倉庫的應用十分冷漠之時,由熱心的部門單獨開發式所採用。
數據倉庫和數據集市
企業各部門擁有滿足自己需要的數據集市,其數據從企業數據倉庫中獲取,而數據倉庫從企業各種數據源中收集和分配。這種體系結構是一種較為完善的數據倉庫體系結構,往往發生在組織整體對數據倉庫應用感興趣之時所採用的體系結構。
(2)數據倉庫的技術平台結構 單層結構
單層結構主要是在數據源和數據倉庫之間共享平台,或者讓數據源、數據倉庫、數據集市與最終用戶工作站使用同一個平台。共享一個平台可以降低數據抽取和數據轉換的復雜性,但是共享平台在應用中可能遇到性能和管理方面的問題,這種體系結構一般在數據倉庫規模較小,而組織的業務系統平台具有較大潛力之時所採用。
客戶/伺服器兩層結構
一層為客戶機,一層為伺服器,最終用戶訪問工具在客戶層上運行,而數據源、數據倉庫和數據集市位於伺服器上,該技術機構一般用於普通規模的數據倉庫。
三層客戶/伺服器結構
基於工作站的客戶層、基於伺服器的中間層和基於主機的第三層。主機層負責管理數據源和可選的源數據轉換;伺服器運行數據倉庫和數據集市軟體,並且存儲倉庫的數據;客戶工作站運行查詢和報表運用程序,且還可以存儲從數據集市或數據倉庫卸載的局部數據。在數據倉庫稍具規模,兩層數據倉庫結構已經不能滿足客戶的需求,要講數據倉庫的數據存儲管理、數據倉庫的應用處理和客戶端應用分開之時,可以採用這種結構。
多層式結構
這是在三層機構基礎上發展起來的數據倉庫結構,在該結構中從最內數據層到最外層的客戶層依次是:單獨的數據倉庫存儲層、對數據倉庫和數據集市進行管理的數據倉庫服務層、進行數據倉庫查詢處理的查詢服務層、完成數據倉庫應用處理的應用服務層和面向最終用戶的客戶層。體系層次可能多達五層,這種體系結構一般用於超規模數據倉庫系統。
4、數據倉庫使用方案和項目規劃預算
數據倉庫的實際使用方案與開發預算,是數據倉庫規劃中最後需要確定的問題。因為數據倉庫主要用於對企業管理人員的決策支持,確保其實用性是十分重要的,因此需要讓最終用戶參與數據倉庫的功能設計。這種參與是通過用戶的實際使用方案進行的,使用方案是一個非常重要的需求模型。實際使用方案必須有助於闡明最終用戶對數據倉庫的要求,這些要求有的只使用適當的數據源就可以得到基本滿足,而有的卻需要來自企業外部的數據源,這就需要通過使用方案將這些不同的要求聯系起來。 實際使用方案還可以將最終用戶的決策支持要求與數據倉庫的技術要求聯系起來。因為當用戶確定最終要求後,為元資料庫的范圍確定一個界限。還可以確定所需要的歷史信息的數量,當根據特定的用戶進行數據倉庫的規劃時,就可確定最終用戶所關心的維度(時間、方位、商業單位和生產企業),因為維度與所需要的概括操作有明顯的關系,必須選擇對最終用戶有實際意義的維度,如:「月」、「季度」、「年」等。最後,還可以確定數據集市/數據倉庫的結構需要,使設計人員確定採用單純數據倉庫結構,還是單純的數據集市結構或者是兩者相結合的結構。
在實際使用開發方案確定後,還需要對開發方案的預算進行估計,確定項目的投資數額。投資方案的確定可以依據以往的軟體開發成本,但是這種預算的評估比較粗糙。另一種方法是參照結構進行成本評估,也就是說,將數據倉庫實際使用方案所確定的構件進行分解,根據各個構件的成本進行預算估算。數據倉庫的構件包含在數據源、數據倉庫、數據集市、最終用戶存取、數據管理、元數據管理、傳輸基礎等部分中,這些構件有的在企業原有信息系統中已經具備,有的可以選擇商品化構件,有的則需要自我開發。根據這些構件的不同來源,可以確定比較准確的預算。 在完成數據倉庫規劃後,就需要編制數據倉庫開發說明書,說明系統與企業戰略目標的關系,以及系統與企業急需處理的范圍相對有限的開發機會,所設想的業務機會的說明以及目標任務概況說明、重點支持的職能部門和今後工作的建議。數據倉庫項目應有明確的業務價值計劃開始,在計劃中需要闡明期望取得的有形和無形的利益。無形利益包含利用數據倉庫使決策完成得更快更好等利益。
業務價值計劃最好由目標業務主管來完成,因為數據倉庫是用戶驅動的,應該讓用戶積極參與數據倉庫的建設,在規劃書中要確定數據倉庫開發目標的實現范圍、體系結構和使用方案及開發預算。
B. sybase如何建庫 如何先建立服務萬分感謝!!!!!!!!!
是sybase ASE?
服務是安裝sybase 資料庫系統時自動建立的,資料庫要可以在sybase central中建立。
C. 請問數據倉庫都用什麼建立
1、首先你得搞清楚建設數倉的目的是什麼
是偏向於整合各系統數據,為數據分析決策服務,還是偏向於快速的完成分析決策需求?
如果是前者,那麼在數據倉庫建模的時候一般會選擇ER建模方法;
如果是後者,一般會選擇維度建模方法。
ER建模:即實體關系建模,由數據倉庫之父BIll Inmon提出,核心思想是從全企業的高度去設計三範式模型,用實體關系描述企業服務。主張的是自上而下的架構,將不同的OLTP數據集中到面向主題的數據倉庫中。
維度建模:由Kimball提出,核心思想是從分析決策的需求出發構建模型。這種模型由事實表和維表組成,即星悶叢型模型和雪花模型。Kimball倡導自下而上的架構,可以針對獨立部門建立數據集市,再遞增的構建,匯總成數據倉庫。
2、敗罩攜其次你得進行深入的業務調研和數據調研
業務調研:深入的業務調研能使你更加明確數倉建設的目的;同時也利於後續的建模設計,隨著調研的開展,如何將實體業務抽象為數倉模型會更加明朗。
數據調研:各部門或各科室的數據現狀了解,包括數據分類、數據存儲方式、數據量、具體的數據內容等等。這對後續的主數據串聯或者維度一致性處理等等都是必須的基礎。
3、然後是數據倉庫工具選型
傳統型數據倉庫:一般會選擇第三方廠家的資料庫和配套ETL工具。因為有第三方支持,相對有保障;但缺點也很明顯,受約束以及成本較高。
NoSQL型數據倉庫:一般是基於hadoop生態的數據倉庫。hadoop生態已經非常強大,可以找到各種開源組件去支持數據倉庫。缺點是需要招聘專門人士去摸索,並且相對會存在一些未知隱患。
4、最後是設計與實施
設計:包括數據架構中的數據層次劃分以及具體的模型設計;也包括程序架構中的數據質量管理、元數據管理、調度管理等;
實施:規范化的項目管理實施,但同時也需記住一點,數據倉庫不察伏是一個項目,它是一個過程。
D. oracle 就安裝了軟體,該怎麼建立資料庫
1、
下面要進行建庫,使用命令dbca
[oracle@redhat4 ~]$ dbca
-bash: dbca: command not found
顯示找不到命令
有dbca這個命令,但是找不到它,說明環境變數PATH設置有問題
設置環境變數PATH
[oracle@redhat4 ~]$ vi .bash_profile
在文件尾部加入下行
export PATH=$PATH:$ORACLE_HOME/bin:.
再重新登陸一下oracle用戶,使環境變數生效。
[root@redhat4 install]# su - oracle
運行dbca命令
----
2、
成功啟動 Database Configuration Assistant 資料庫配置助手開始建庫。
步驟1:操作
請選擇希望執行的操作:
這個頁面顯示了我們通過dbca可以執行的操作
這里我們選 創建資料庫
步驟2:選擇創建資料庫的模板
有一般用途、事務處理、定製資料庫、數據倉庫四種模板可供選擇。
四種模板參數和內容有區別,而安裝中的區別在後面的步驟9 資料庫內容 頁中的內容
一般用途 事務處理 數據倉庫 三種模板在步驟9顯示的是:
實例方案標簽頁,自己只能決定是否選擇實例方案組件
定製資料庫 模板在步驟9顯示的是:
資料庫組件標簽頁,可以自己選擇組件,但是無法選擇實例方案組件
這里我們選擇 一般用途 模板
步驟3: 資料庫標識
全局資料庫名:jiagulun SID:jiagulun
步驟4: 管理選項
決定使不使用Enterprise Manager
em用java編寫,用ie訪問 如果選擇了它我們可以使用基於ie的工具管理oracle
推薦生產中使用。
步驟5: 資料庫身份證明
oracle建立中,在資料庫內部默認會建很多用戶
在這里只是學習,給這些用戶設置相同的密碼,設為oracle。實際生產中可分別設置,並要保證密碼強度。
步驟6: 存儲選項
生產中ASM和裸設備使用非常多,而且ASM用的越來越多,
學習中我們使用文件系統。
步驟7: 資料庫文件所在位置
決定資料庫建在文件系統的那個目錄底下
這里是用 所有資料庫文件使用公共位置:{ORACLE_BASE}/oradata
這里可以自己選擇路徑,但自己要記住,方便以後使用。
步驟8: 恢復配置
指定快速恢復區 按默認即可
步驟9:選上示例方案
學習中需要使用的一些案例,實際生產中沒有用。
步驟10:初始化參數
oracle資料庫是非常吃內存的一個軟體,這里要設置oracle使用的內存大小
這些參數事後可以調整
但字元集以後最好不要再調了,這里設定後,就不要改變了,以後調可能會出現問題
資料庫字元集選:ZHS16GBK-GBK 16位簡體中文,建議選AL32UTF8,實際生產中這兩種用的最多。
國外有企業分支機構可以選AL32UTF8
國家字元集選:AL16UTF16
其它默認
步驟11:資料庫存儲
決定oracle資料庫的三類文件 控制文件、數據文件、重做日誌組 的 存儲位置
三類文件的內容,有什麼意義,放到存儲結構中講。
步驟12:創建選項
選 創建資料庫
點完成
最後的確認頁:
確認自己在各步驟做的選擇後,點 確定 開始創建資料庫。
創建資料庫完成後,Database Configuration Assistant 給出完成頁面。
顯示的是:
資料庫創建完成。詳細信息在:/u01/app/oracle/proct/10.2.0/db_1/cfgtoollogs/dbca/jiagulun 上的日誌文件
資料庫參數文件名:/u01/app/oracle/proct/10.2.0/db_1/dbs/spfilejiagulun.ora
Database Control URL 為:http://redhat4:1158/em
這里還可以點擊 口令管理... 修改剛創建完成的oracle資料庫當前所有已有用戶的密碼。
退出 後
資料庫創建最終完成。
E. 淺析數據倉庫的構建方法
淺析數據倉庫的構建方法
隨著不同的管理信息系統(MIS)在企業不同部門的大規模應用及企業對數據管理不斷提出新的要求,不僅要求能實現傳統的聯機事務處理,而且越來越多的要求是各種應用系統能夠在企業不斷積累的以及從企業外部獲取的豐富信息資源的基礎上,把這些分散的、不一致的、凌亂的信息資源加以利用,即更多地參與數據分析和決策支持,盯寬配由此出現了一種用於數據分析處理和決策支持的數據存儲和組織技術,即數據倉庫技術。
1、什麼是數據倉庫
數據倉庫是面向主題的、集成的、具有時間特徵的、穩定的數據集合,用以支持經營管理中的決策制定過程。數據倉庫提供用戶用於決策支持的當前和歷史數據,這些數據在傳統的操作型資料庫中很難或不能得到。
面向主題是指數據倉庫中的數據是按照一定的主題域進行組織。主題是一個抽象的概念,是指用戶使用數據倉庫進行決策時所關心的重點方面,一個主題通常與多個操作型信息系統相關。集成的是指數據倉庫中的數據是在對原有分散的資料庫數據抽取、清理的基礎上經過系統加工、匯總和整理得到的,必須消除源數據中的不一致性,以保證數據倉庫內的信息是關於整個企業的一致的全局信息。
數據倉庫的體系結構分數據源、數據轉換、數據倉庫、數據集市和用戶幾部分。數據源,包括企業內部的業務數據、遺留數據、其它業務系統數據及相關WEB數據等;數據轉換是數據倉庫構建的重要環節,主要是對各種復雜的數據源進行抽取、轉換、裝載及其他處理,同時要實現數據質量跟蹤監控以及元數據抽取與創建等工作;數據倉庫主要實現對各種數據的組織、存儲及管理等;數據集市是為不同業務而單獨設計的數據倉庫系統,即開發者為企業內部的不同用戶群定製特殊的數據倉庫子系統。用戶部分,即具體面向使用者的應用部分,主要是指數據倉庫存取與檢索為用戶提供了訪問數據倉庫或數據集市的功能,其中分析與報告為用戶使用數據倉庫提供了一組工具,用於幫助用戶對數據倉庫或數據集市進行聯機分析或數據挖掘等。
2、數據倉庫構建方法
2.1 普通數據倉庫構建方法。對於普通數據倉庫的構建,企業在對整個系統的建設綜合各種因素的基礎上,將整個項目的實施分階段、分步驟實施,可以在每一階段建設的基礎上分階段納入不同的業務系統,逐步建立起一個綜合的、專題較為完善的、適合部門、子單位使用的完整的數據倉庫系統,從而才能使投資盡快獲得收益。
在數據倉庫的構建過程中,利用模糊數學可實現數據倉庫內數據的語義表示,豐富數據加工的手段,提高分析處理的能力。數據倉庫的構建,一般採取先構建數據集市,最後將各個數據集市整合在一起形成數據倉庫的漸進模式;通過概念層、邏輯層、物理層建模,確定相關主題域的數據集市並對其進行聯機分析處理。構建數據倉庫模型一般採用以下幾種:
2.1.1 星型模型:凱指星型模型是最常用的數據倉庫設計結構的實現模式。使數據倉庫形成了一個集成系統,為用戶提供分析服務對象。該模型的核心是事實表,圍繞事實表的是維度表。通過事實表將各種不同的維度表連接起來,各個維度表都連接到中央事實表。[page] 2.1.2 星系模型(也稱雪花模型):雪花模型對星型模型的維度表進一步標准化,對星型模型中的維度表進行了規范化處理。同時也是對星型模型的擴展,每一個維巧升度都可以向外連接到多個詳細類別表。在實際應用中,用戶的需求多種多樣,數據來源可能為多個事實表,故可採用多個事實表共存,之間通過公用的維表相關聯的星系模型,也稱為事實星座。
2.1.3 原子級數據模型和匯總級數據模型並存:堅持原子級數據模型和匯總級數據模型並存,而且要盡可能地細化原子級數據。
2.1.4 設立代理鍵:代理鍵是維表中一些沒有業務含義的欄位,只是一個由數據倉庫載入程序時建立的數字。
2.2 空間數據倉庫構建方法。隨著GIS(地理信息系統)在各行業的廣泛應用,最初面向事務處理為主的空間資料庫信息系統已不能滿足需要,信息系統開始從管理轉向決策處理,空間數據倉庫就是為滿足這種新的需求而提出的空間信息集成系統。尤其是地理信息決策支持系統中,空間數據倉庫系統顯得尤為重要。
空間數據倉庫具有普通數據倉庫的普遍特徵,但其本身有一些特殊性。並且空間數據倉也並不是空間資料庫的簡單集合。與空間資料庫比,空間數據倉除支持資料庫外,還支持數據文件、文本文件、應用程序等眾多數據源;另外空間數據倉庫中的數據有時間數據、空間數據、屬性數據及異構數據等多種數據;其次空間數據倉庫中還包括了數據處理規則、演算法等;再次空間數據倉庫的數據是對原始數據進行加工、處理、集成等轉換,是對數據的增值和統一;空間資料庫還引入了時間縱的概念,它是以時間為基準來管理數據,可以截取不同時間尺度上的信息,從瞬態到區段時間直到全體,空間數據倉庫是依賴於時間維的數據結構,它可以根據不同的需要劃分不同的時間粒度等級,以便進行各種復雜的趨勢分析。當然,不言而喻,它還包含了空間維的方位數據。正因為空間數據倉庫與普通數據倉庫的不同,並且它以空間數據倉庫完全不是相同的概念,一般空間數據倉庫以如下體系結構分為四大功能模塊,分別是源數據、數據變換工具、空間數據倉庫、客戶端分析工具。源數據它不僅指那些常見的空間資料庫,還包括文件、網頁、知識庫、遺留系統等各種數據源。數據變換工具與具有普通數據倉庫數據變換相同的提取轉換功能,但它還包括了特有的空間變換等。空間數據倉庫以立體、多維的方式來組織和顯示數據。但最基本的空間維和時間維是其反映客觀世界動態變化的基礎,空間數據倉庫技術最關鍵要點也就是時間維和空間維數據組織方式。目前空間數據倉庫已成為國、內外GIS(地理信息系統)研究的熱點並取得了較大進展。要把空間信息融合進企業現有的數據倉庫中,在原有系統不作較大改動的前提下,一般採用三種模式構建企業空間數據倉庫:(1)把空間信息作為多維模型中的空間維引入;(2)把空間信息作為研究主題引入;(3)在維和度量中都包含空間信息。因此,計算並存儲所有空間度量是不現實的。一般使用空間索引樹(如R-tree)在最細空間粒度上構建分組層次,作為空間維的分層,每個空間維需要建立一棵空間索引樹。
3、結束語
總之,數據倉庫構建是數據倉庫技術的關鍵,數據倉庫技術是一項基於數據管理和利用的綜合性技術和解決方案,尤其是現在空間數據倉庫在GIS 中的廣泛應用,它成為資料庫市場的新一輪增長點,同時也成為下一代信息系統的重要組成部分。
F. 如何創建資料庫
什麼是SQL呢 SQL就是專門用來做資料庫的一門語言 和C語言差不多 (當然功能不緊緊是做數據了 編程啊 都可以..... 這里就不多說了)z這道題用ACCESS 就可以完成了
1 首先 用Access 2000(資料庫 )做一個資料庫 打開設計器創建表 在點菜單 另存為 名為班級名+自己名字英文簡寫 最後點保存啦 (每完成系統都是有提示的啦) 第一問 解決
2 打開設計器 上面做的表下面下
創建數據表 名字都是在最後完成時做的 先不用管 然後在輸入sID,sName,sSex,sAge,sClass 注意根據後面的要求填寫欄位 及數據類型 以及
在做其他的問題了將T_Student表的sID欄位設置為標識列,種子為1,增量為2。
為T_Student表的sSex(性別)欄位設置其默認值為「男」。
為T_Student表的sAge(年齡)欄位設置檢查約束,規定年齡在0到30歲之間。
為T_KC表的cName(課程名稱)欄位設置唯一性約束。,規定課程名稱不得重復。
生成一個規則t_rule,限制數據的取值范圍在(0---100)之間,然後將這個規則綁定到T_CJ表的cj(成績)欄位。
為T_KC表的cName欄位創建索引。
最後
當然主鍵當然是SID了 一定要標好哦~~·先不管作業其他要求
在依次做其他2個表;
T_KC(cID,cName,sBianhao,sXuefen)
T_CJ(sID,cID,cj) 注意主鍵是SID
3. 做好了三個表後退出設計器
在打開以一個個表 在按要求輸入(在每個表中添加3-5條記錄。)
好了 基本就完成了
當然用SQL 也能完成 這些問題 並且要快 但涉及到TQL語言 編程問題 很難說清楚 就不一一解釋了···