導航:首頁 > 數據處理 > 風險數據集市具體是什麼

風險數據集市具體是什麼

發布時間:2023-08-22 00:33:34

A. 數據集市的常見問題

建立不同規格的數據倉庫、數據集市的成本,國外的咨詢機構有專門的評估,在一定程度上可以借鑒。但
是這些結果在國內也許並不適用,因為國情不同,在國內的構建成本需要專門的調研。以人們為企業構建的客戶主題數據集市為例,一般成本在20萬元到50萬元人民幣之間。數據集市的設計可以採用迭代式的方法。在迭代式開發中,每個迭代為上一次的結果增加了新的功能。功能增加的順序要考慮到迭代平衡以及盡早發現重大風險。通俗地說,就是在正式交貨之前多次給客戶交付不完善的中間產品「試用」。這些中間產品會有一些功能還沒有添加進去、還不穩定,但是客戶提出修改意見以後,開發人員能夠更好地理解客戶的需求。如此反復,使得產品在質量上能夠逐漸逼近客戶的要求。這種開發方法周期長、成本高,但是它能夠避免整個項目推倒重來的風險,比較適合大項目、高風險項目。
理論上講,應該有一個總的數據倉庫的概念,然後才有數據集市。實際建設數據集市的時候,國內很少這么做。國內一般會先從數據集市入手,就某一個特定的主題(比如企業的客戶信息)先做數據集市,再建設數據倉庫。數據倉庫和數據集市建立的先後次序之分,是和設計方法緊密相關的。而數據倉庫作為工程學科,並沒有對錯之分。

B. 什麼是「數據集市技術」啊

1、數據集市的產生
當今信息社會,「數據」不等於「信息」,只有對數據進行恰當的處理,才會找到所需要的信息。為了把數據轉化為有價值的信息,必須拓展最終用戶的查詢能力,企業應能使用戶對其詳細的業務數據隨時進行查詢,於是出現了數據倉庫這一新的技術概念。數據倉庫(Data Warehouse)實際上是把傳統資料庫對數據的操作型處理升級到對多個數據源的數據進行統一的組織,形成一個一體化的存儲結構,為決策分析奠定基礎。

數據倉庫作為企業級應用,其涉及范圍和投入成本常常是巨大的,它的建設很容易形成高投入、慢進度的大項目。這一切都是設計者和使用者所不希望看到和不能接受的,使用者要求在部門內部獲得一種適合自身應用、容易使用且自行定向而方便高效的開放式數據介面工具。正是這種需求使數據集市應運而生。

2 數據集市的概念

數據集市(Data Market)是一種更小、更集中的數據倉庫。簡單地說,原始數據從數據倉庫流入不同的部門以支持這些部門的定製化使用。這些部門級的資料庫就稱為數據集市。一個數據集市就是一個部門的數據集合。數據集市是為特定部門的決策支持而組織起來的一批數據和業務規則,習慣上稱它們為「主題域」。不同部門有不同的「主題域」,因而也就有不同的數據集市。例如,財務部門有自己的數據集市,市場部門也有自己的數據集市,它們之間可能有關聯,但相互不同且在本質上互為獨立。

盡管數據集市與數據倉庫在很多方面有類似之處,但它們之間卻存在著區別。主要體現在:
(1)面向的對象不同。數據倉庫面向的是整個企業,為整個企業提供所需的數據;數據集市則面向各個部門。
(2)數據粒度不一樣。數據倉庫中的數據粒度非常小;數據集市中的數據主要是概括級的數據。

數據集市的數據源主要來自數據倉庫,它主要從數據倉庫中提取部門所需要的數據以滿足部門級的需要。數據集市的部分數據由其他數據源供給
3 數據集市的體系結構

數據集市的數據源主要來自數據倉庫和其他數據源。實際上,如果先建數據集市,後建數據倉庫,則數據集市的數據就不能來自數據倉庫,因此在實際應用中數據集市最主要的數據源來自業務資料庫。

實際應用中,考慮到業務資料庫的伺服器承擔著繁忙的業務活動,所以我們將數據集市伺服器與業務資料庫的伺服器分開。因此,有關系統以及WEB的開發,都是基於數據集市伺服器的。它們的相互關系如下圖所示。

數據集市體系結構圖

4 數據集市技術的應用及其實現方法
數據集市主要是為有關的決策提供支持的,它能夠大大提高工作效率,降低建設風險,在較短的時間內取得較好的成果,因此得到廣泛的應用。數據集市可以分為兩類:獨立型和依賴型。在獨立型數據集市中,數據來自一個或多個操作系統或外部信息提供者,或者來自在一個特定的部門或地域局部產生的數據。依賴型數據集市中的數據直接來自企業數據倉庫。
目前,國內還是依賴型的數據集市居多。兩者的區別就在於是否從一個中央數據倉庫而來。因為國內的數據倉庫項目在開始階段多是國外廠商推進的,肯定有些不理智,大多直接從數據倉庫的概念入手,整合分散的、異構的數據。而獨立型數據集市是因為客戶有分析需求,需要一些用於分析的數據支撐,所以在部分或者自己的區域內建立這種小型數據倉庫。獨立型數據集市是服務具體分析應用的。
就應用而言,獨立型和依賴型數據集市應該是相似的,因為目前對於數據集市的建模方法基本一致:使用建立面向主題的星型模式,服務於某項分析應用。二者主要的差別還是在擴展性方面,獨立型數據集市還是會導致不一致的數據。因為它可能按照自己本地的方式來進行編碼,當存在多個獨立數據集市的時候,他們之間的數據很難共享。依賴型的數據集市則是按照中央數據倉庫統一的編碼方式,可以共享。
要建立數據集市伺服器,必須將業務資料庫中的數據提取到數據集市資料庫。但是從業務資料庫提取來的數據是被設計用於日常的事物處理的,這種按傳統方式組織的數據不適合支持因決策而經常進行的查詢,故查詢的效率比較低。為了提高查詢效率,克服傳統數據組織結構所帶來的弊端,多維資料庫是一種較好的解決方法。多維資料庫是以多維數據存儲形式來組織數據的數據管理系統,它不是關系型資料庫,在使用時需要將數據從關系資料庫中轉載到多維資料庫中方可訪問。多維資料庫在針對多維的分析應用時具有較好的效果
數據集市技術可以方便快捷地建立面向部門的或面向主題的統計查詢系統,在現代企業客戶管理系統中,通過數據集市技術可以全面分析您的客戶管理現狀和發展目標,幫助您設計、開發和維護客戶信息和營銷活動管理系統。從這一層面來看,「ecdms數據集市」所提供的資料庫產品更能體現出數據集市技術在現代商務營銷模式中的重要作用。綜合以上所述也可以預見,數據集市技術將會在各行業領域得到越來越廣泛的應用和更大的發展。

閱讀全文

與風險數據集市具體是什麼相關的資料

熱點內容
普桑的啟停技術是怎麼關閉的 瀏覽:574
檳榔代理一個市多少 瀏覽:362
成都久貿市場怎麼樣 瀏覽:568
太倉市板材市場有哪些木材 瀏覽:692
程序員說的上車是什麼梗 瀏覽:484
支付會計師代理記賬怎麼收費 瀏覽:560
景區代理需要什麼資質 瀏覽:591
啟動程序太多是什麼原因 瀏覽:850
電商小程序怎麼搶紅利 瀏覽:992
怎麼把顯卡的數據弄回來 瀏覽:117
農業銀行放貸多久能查到信息 瀏覽:409
神兔手游怎麼交易 瀏覽:689
蘇聯電子技術落後中國多少年 瀏覽:7
我們必須保護哪些信息 瀏覽:73
邊坡開挖程序如何編程 瀏覽:432
哪裡有宜停車小程序 瀏覽:996
如何做文化衫代理 瀏覽:130
商丘市批發市場怎麼辦卡 瀏覽:938
哪裡當程序員最好 瀏覽:850
重慶貨車交易市場有哪些 瀏覽:132