⑴ 什麼是元數據(MetaData)及元數據的用途
元數據(Meta Data)是關於數據的數據,當人們描述現實世界的現象時,就會產生抽象信息,這些抽象信息便可以看作是元數據,元數據主要用來描述數據的上下文信息。
通俗的來講,假若圖書館的每本書中的內容是數據的話,那麼找到每本書的索引則是元數據,元數據之所以有其它方法無法比擬的優勢,就在於它可以幫助人們更好的理解數據。
發現和描述數據的來龍去脈,特別是那些即將要從OLTP系統上升到DW/BI體系建設的企業,元數據可以幫他們形成清晰直觀的數據流圖,元數據是數據管控的基本手段。
元數據是為了提升共享、重新獲取和理解企業信息資產的水平,元數據是企業信息管理的潤滑劑,不對元數據進行管理或管理不得當。
信息將被丟失或處於隱匿狀態而難以被用戶使用,數據集成將十分昂貴,不能對業務進行有效支撐。終端用戶要識別相關的信息將十分困難,最終用戶將失去對數據的信任。
(1)用戶自定義元數據什麼意思擴展閱讀
元數據分類
元數據管理的范圍將涵括數據產生、數據存儲、數據加工和展現等各個環節的數據描述信息,幫助用戶理解數據來龍去脈、關系及相關屬性。按其描述對象的不同可以劃分為三類元數據:技術元數據、業務元數據和管理元數據。這三種元數據的具體描述如下:
1、技術元數據 技術元數據是描述數據系統中技術領域相關概念、關系和規則的數據,主要包括對數據結構、數據處理方面的特徵描述,覆蓋數據源介面、數據倉庫與數據集市存儲、ETL、OLAP、數據封裝和前端展現等全部數據處理環節;
2、業務元數據 業務元數據是描述數據系統中業務領域相關概念、關系和規則的數據,主要包括業務術語、信息分類、指標定義和業務規則等信息;
3、管理元數據 管理元數據是描述數據系統中管理領域相關概念、關系和規則的數據,主要包括人員角色、崗位職責和管理流程等信息。
⑵ 什麼叫元數據
問題一:什麼是元數據? 元數據就是用來定義數據的數據閥比如,有一條學生信息記錄,其中包括欄位姓名(name)、年齡(age)、性別(male)、班級(class)等,那麼name、age、male、class就是元數據。通過它們的描述,一條關於學生信息的數據記錄就產生;
問題二:什麼是元數據 元數據(Metadata),又稱中介數據、中繼數據,為描述數據的數據(data about data),主要是描述數據屬性(property)的信息,用來支持如指示存儲位置、歷史數據、資源查找、文件記錄等功能。元數據算橋緩是一種電子式目錄,為了達到編制目錄的目的,必須在描述並收藏數據的內容或特色,進而達成協助數據檢索的目的。
問題三:什麼是元數據 元數據是關於數據的組織、數據域及其關系的信息,簡言之,元數據就是關於數據的數據。 [編輯]元數據的特點[1] ①元數據是關於數據的結構化的數據,它不一定是數字形式的,可來自不同的資源。 ②元數據是與對象相關的數據,此數據使其潛在的用戶不必先具備對這些對象的存在和渣祥特徵的完整認識。 ③元數據是對信息包裹(Information Package)的編碼的描述。 ④元數據包含用於描述信息對象的內容和位置的數據元素集,促進了網路環境中信息對象的發現和檢索。 ⑤元數據不僅對信息對象進行描述,還能夠描述資源的使用環境、管理、加工、保存和使用等方面的情況。 ⑥在信息對象或系統的生命周期中自然增加元數據。 ⑦元數據常規定義中的「數據」是表示事務性質的符號,是進行各種統計、計算、科學研究、技術設計所依據的數值,或是說數字化、公式化、代碼化、圖表化的信息。 [編輯]元數據的類型[1] 根據功能可將元數據劃分為管理型元數據、描述型元數據、保存型元數據、技術型元數據、使用型元數據。根據結構和語境可將元數據劃分為三組:第一組為全文索引;第二組為簡單結構化的普通格式,如DC、RFCl807、Template等;第三組為結構復雜的特殊領域內的格式,如FGDC、GILS、TEI、EAD等。 根據元數據的應用范圍,可分為通用性元數據、專業性元數據、Web元數據、多媒體元數據。 [編輯]元數據的結構[1] ①內容結構。包括描述性元素、技術性元素、管理性元素、復用性元素。 ②句法結構。包括元素的分區分層分段組織結構、元素結構描述方法、DTD描述語言、元數據復用方式、與被描述對象的捆綁方式。 ③語義結構。包括元素內容編碼規則定義、元素定義、元素語義概念關系、元數據版敏梁模本管理。 [編輯]元數據的作用[2] 元數據是網路信息資源描述的重要工具,可以用於網路信息資源管理的各個方面,包括信息資源的建立、發布、轉換、使用、共享等。元數據在網路信息資源組織方面的作用可以概括為五個方面:描述、定位、搜尋、評估和選擇。 (1)描述作用:根據元數據的定義,它最基本的功能就在於對信息對象的內容和位置進行描述,從而為信息對象的存取與利用奠定必要的基礎。 (2)定位作用:由於網路信息資源沒有具體的實體存在,因此,明確它的定位至關重要。元數據包含有關網路信息資源位置方面的信息,因而由此便可確定資源的位置之所在,促進了網路環境中信息對象的發現和檢索。此外,在信息對象的元數據確定以後,信息對象在資料庫或其他 *** 體中的位置也就確定了,這是定位的另一層含義。 (3)搜尋作用:元數據提供搜尋的基礎,在著錄的過程中,將信息對象中的重要信息抽出並加以組織,賦予語意,並建立關系,使檢索結果更加准確,從而有利於用戶識別資源的價值,發現其真正需要的資源。 (4)評估作用:元數據提供有關信息對象的名稱、內容、年代、格式、製作者等基本屬性,使用戶在無需瀏覽信息對象本身的情況下,就能夠對信息對象具備基本了解和認識,參照有關標准即可對其價值進行必要的評估,作為存取利用的參考。 (5)選擇作用:根據元數據所提供的描述信息,參照相應的評估標准,結合使用環境,用戶便能夠做出對信息對象取捨的決定,選擇適合用戶使用的資源。
問題四:十六、什麼是元數據? 謝海洋 王素娟 元數據,英文拼寫為Metadata,目前已被廣泛應用於各種信息資源的管理領域中。在檔案界,最早使用「元數據」的是美國的電子文件管理專家戴維?比爾曼,他在20世紀90年代初發表的有關電子文件管理方面的論文中首先使用了元數據這一術語。 元數據的概念目前在檔案界還沒有一個統一的定論,目前比較有代表性的描述有: 1.元數據是「關於數據的數據(Data about Data)」,其中,後一個Data是指被描述的信息資源,前一個Data則是指為理解該信息資源而存儲的有關信息,即元數據。這是元數據目前公認最為經典、通俗和簡潔的定義。 2.國際檔案理事會《電子文件管理指南》(1997)認為「元數據是關於文件的背景信息和結構的數據,是有關電子文件的技術性信息。」 3.《澳大利亞聯邦機構電子文件保管元數據標准》(1999)認為「文件保管元數據是關於電子文件背景的描述信息。」 4.英國國家檔案館《電子文件管理指南》(1999)認為「元數據是關於文件和文件 *** 的背景及其相互關系的結構化描述和編目數據。」 5.馮惠玲主編的《電子文件管理教程》認為元數據是「由電子文件系統自動記錄的關於文件形成時間、地點、人員、活動、文件系統、結構及內容方面的具體數據。」 6.「元數據可以理解為用來描述資源的屬性與特徵的信息。」-劉家真《電子文件管理理論與實踐》,科學出版社2003年版。 7.「元數據是對數據對象規范描述所形成的數據 *** ,通過計算機可讀的開放語言來標記元數據,就能在系統間發現、交換、轉換和理解相應的數字對象,支持系統間互操作。」-張曉林《開放元數據機制:理念與原則》,《中國圖書館學報》2003年3期。 以上描述雖然表述各不相同,但我們可以發現一個共同點,即元數據主要是動態地描述電子文檔各種特徵的信息數據 *** ,並且它能為分散的、由多種數字化資源有機構成的檔案信息體系提供整合的工具與紐帶。隨著研究的深入,我們對元數據的認識在逐步深化。 檔案工作人員為便於理解,可以簡單把電子文檔的元數據視為兩方面:一是「著錄信息或著錄數據」。其中,「元數據元素就是著錄項目,元數據格式就是著錄項目之間關系的結構化表示,元數據編碼就是著錄信息的編制。」(劉越南《對電子文件管理元數據的再認識》,《檔案學通訊》2005年2期);二是電子文檔的內容、背景和結構等方面的信息。 國外學者將元數據喻為電子文件管理系統中的「血液」,足見元數據在數字檔案館電子文件管理中發揮著舉足輕重的作用。元數據的作用主要可以概括為以下幾方面: 1.元數據能協助數字檔案館構建信息檢索機制。元數據具有動態跟蹤功能,能夠即時動態地獲取電子文件管理的各項信息。在數字檔案館的海量信息庫中,藉助元數據,可以快速發現並獲取特定的信息單元。 2.元數據能維護信息的識別與讀取。電子文件所攜帶的元數據信息可以完整地記錄電子文件的原始狀態,能夠系統地映射出電子文件的信息內容、背景和結構等;還能夠映射出電子文件的生成環境和行政管理環境。只有在獲取數據對象的同時也獲取這些元數據信息,被檢索到的數據單元才是可理解的、可讀的。 3.元數據能保障電子文件的真實性與憑證性。元數據系統能夠跟蹤記錄電子文件從產生那一刻起的載體、設備及所用技術的變遷史以及使用干預該文件的整個歷史過程,即不論載體、設備、技術如何更新換代,不論使用者、使用人數的多少都全部作為歷史數據保存下來,記錄備案。這些為數字信息單元真實性和憑證性提供了重要的佐證。
問題五:元數據的作用和意義是什麼 元數據的作用和意義: 元數據是關於數據的描述性數據信息,說明數據內容、質量、狀況和其他有關特徵的背景信息。其目的是促進數據集的高效利用,並為計算機輔助軟體工程服務。 幫助數據生產單位有效的維護和管理數據; 提供有關數據生產單位的各種有關信息供用戶查詢; 幫助用戶了解數據; 提供有關信息,以便用戶處理和轉換有用數據。 採用元數據可以便於數據共享。 以上內容均根據學員實際工作中遇到的問題整理而成,供參考,如有問題請及時溝通、指正。
問題六:C#中的元數據是什麼意思? blog.csdn/...554681
問題七:「元數據」是什麼意思,能簡單解釋下嗎 一件事下出的定義 也叫概念
問題八:什麼是元數據? 元數據就是用來定義數據的數據閥比如,有一條學生信息記錄,其中包括欄位姓名(name)、年齡(age)、性別(male)、班級(class)等,那麼name、age、male、class就是元數據。通過它們的描述,一條關於學生信息的數據記錄就產生;
問題九:什麼是元數據 元數據(Metadata),又稱中介數據、中繼數據,為描述數據的數據(data about data),主要是描述數據屬性(property)的信息,用來支持如指示存儲位置、歷史數據、資源查找、文件記錄等功能。元數據算是一種電子式目錄,為了達到編制目錄的目的,必須在描述並收藏數據的內容或特色,進而達成協助數據檢索的目的。
問題十:什麼是元數據 元數據是關於數據的組織、數據域及其關系的信息,簡言之,元數據就是關於數據的數據。 [編輯]元數據的特點[1] ①元數據是關於數據的結構化的數據,它不一定是數字形式的,可來自不同的資源。 ②元數據是與對象相關的數據,此數據使其潛在的用戶不必先具備對這些對象的存在和特徵的完整認識。 ③元數據是對信息包裹(Information Package)的編碼的描述。 ④元數據包含用於描述信息對象的內容和位置的數據元素集,促進了網路環境中信息對象的發現和檢索。 ⑤元數據不僅對信息對象進行描述,還能夠描述資源的使用環境、管理、加工、保存和使用等方面的情況。 ⑥在信息對象或系統的生命周期中自然增加元數據。 ⑦元數據常規定義中的「數據」是表示事務性質的符號,是進行各種統計、計算、科學研究、技術設計所依據的數值,或是說數字化、公式化、代碼化、圖表化的信息。 [編輯]元數據的類型[1] 根據功能可將元數據劃分為管理型元數據、描述型元數據、保存型元數據、技術型元數據、使用型元數據。根據結構和語境可將元數據劃分為三組:第一組為全文索引;第二組為簡單結構化的普通格式,如DC、RFCl807、Template等;第三組為結構復雜的特殊領域內的格式,如FGDC、GILS、TEI、EAD等。 根據元數據的應用范圍,可分為通用性元數據、專業性元數據、Web元數據、多媒體元數據。 [編輯]元數據的結構[1] ①內容結構。包括描述性元素、技術性元素、管理性元素、復用性元素。 ②句法結構。包括元素的分區分層分段組織結構、元素結構描述方法、DTD描述語言、元數據復用方式、與被描述對象的捆綁方式。 ③語義結構。包括元素內容編碼規則定義、元素定義、元素語義概念關系、元數據版本管理。 [編輯]元數據的作用[2] 元數據是網路信息資源描述的重要工具,可以用於網路信息資源管理的各個方面,包括信息資源的建立、發布、轉換、使用、共享等。元數據在網路信息資源組織方面的作用可以概括為五個方面:描述、定位、搜尋、評估和選擇。 (1)描述作用:根據元數據的定義,它最基本的功能就在於對信息對象的內容和位置進行描述,從而為信息對象的存取與利用奠定必要的基礎。 (2)定位作用:由於網路信息資源沒有具體的實體存在,因此,明確它的定位至關重要。元數據包含有關網路信息資源位置方面的信息,因而由此便可確定資源的位置之所在,促進了網路環境中信息對象的發現和檢索。此外,在信息對象的元數據確定以後,信息對象在資料庫或其他 *** 體中的位置也就確定了,這是定位的另一層含義。 (3)搜尋作用:元數據提供搜尋的基礎,在著錄的過程中,將信息對象中的重要信息抽出並加以組織,賦予語意,並建立關系,使檢索結果更加准確,從而有利於用戶識別資源的價值,發現其真正需要的資源。 (4)評估作用:元數據提供有關信息對象的名稱、內容、年代、格式、製作者等基本屬性,使用戶在無需瀏覽信息對象本身的情況下,就能夠對信息對象具備基本了解和認識,參照有關標准即可對其價值進行必要的評估,作為存取利用的參考。 (5)選擇作用:根據元數據所提供的描述信息,參照相應的評估標准,結合使用環境,用戶便能夠做出對信息對象取捨的決定,選擇適合用戶使用的資源。
⑶ 什麼是元數據
元數據(Meta Data)是關於數據倉庫的數據,指在數據倉庫建設過程中所產生的有關數據源定義,目標定義,轉換規則等相關的關鍵數據。同時元數據還包含關於數據含義的商業信息,所有這些信息都應當妥善保存,並很好地管理。為數據倉庫的發展和使用提供方便。
元數據是一種二進制信息,用以對存儲在公共語言運行庫可移植可執行文件 (PE) 文件或存儲在內存中的程序進行描述。將您的代碼編譯為 PE 文件時,便會將元數據插入到該文件的一部分中,而將代碼轉換為 Microsoft 中間語言 (MSIL) 並將其插入到該文件的另一部分中。在模塊或程序集中定義和引用的每個類型和成員都將在元數據中進行說明。當執行代碼時,運行庫將元數據載入到內存中,並引用它來發現有關代碼的類、成員、繼承等信息。
元數據以非特定語言的方式描述在代碼中定義的每一類型和成員。元數據存儲以下信息:
程序集的說明。
標識(名稱、版本、區域性、公鑰)。
導出的類型。
該程序集所依賴的其他程序集。
運行所需的安全許可權。
類型的說明。
名稱、可見性、基類和實現的介面。
成員(方法、欄位、屬性、事件、嵌套的類型)。
屬性。
修飾類型和成員的其他說明性元素。
一、元數據的優點
對於一種更簡單的編程模型來說,元數據是關鍵,該模型不再需要介面定義語言 (IDL) 文件、頭文件或任何外部組件引用方法。元數據允許 .NET 語言自動以非特定語言的方式對其自身進行描述,而這是開發人員和用戶都無法看見的。另外,通過使用屬性,可以對元數據進行擴展。元數據具有以下主要優點:
自描述文件。
公共語言運行庫模塊和程序集是自描述的。模塊的元數據包含與另一個模塊進行交互所需的全部信息。元數據自動提供 COM 中 IDL 的功能,允許將一個文件同時用於定義和實現。運行庫模塊和程序集甚至不需要向操作系統注冊。結果,運行庫使用的說明始終反映編譯文件中的實際代碼,從而提高應用程序的可靠性。
語言互用性和更簡單的基於組件的設計。
元數據提供所有必需的有關已編譯代碼的信息,以供您從用不同語言編寫的 PE 文件中繼承類。您可以創建用任何託管語言(任何面向公共語言運行庫的語言)編寫的任何類的實例,而不用擔心顯式封送處理或使用自定義的互用代碼。
二、屬性。
.NET Framework 允許您在編譯文件中聲明特定種類的元數據(稱為屬性)。在整個 .NET Framework 中到處都可以發現屬性的存在,屬性用於更精確地控制運行時您的程序如何工作。另外,您可以通過用戶定義的自定義屬性向 .NET Framework 文件發出您自己的自定義元數據。有關更多信息,請參見利用屬性擴展元數據。
三、元數據的意義
說到元數據的意義,可以從其應用目的來談的。雖然做數據倉庫言必稱元數據,必稱技術、業務元數據,但其到底用於何處?離開了目標去談元數據,就發現元數據包含太多的東西,因為他是描述數據的數據嘛。
還是那客戶關系系統來比喻,這個系統維護客戶信息當然是有目的的,是要用這些信息進行一些自動的流程處理、去挖掘一些客戶潛在的價值、做好客戶服務。當然沒有必要去維護客戶的生命特徵信息,諸如指紋、犯罪史等,這些信息跟客戶關系管理的目標關系不大。元數據也是如此,你可以將所以數據的結構、大小、什麼時間創建、什麼時間消亡、被那些人使用等等,這些信息可以延伸得太廣,如果不管目標,而試圖去建一個非常完美的元數據管理體系,這是一種絕對的"自上而下"做法,必敗無疑。
四、元數據列舉
基於應用,可以將元數據分成以下的若干中。
數據結構:數據集的名稱、關系、欄位、約束等;
數據部署:數據集的物理位置;
數據流:數據集之間的流程依賴關系(非參照依賴),包括數據集到另一個數據集的規則;
質量度量:數據集上可以計算的度量;
度量邏輯關系:數據集度量之間的邏輯運算關系;
ETL過程:過程運行的順序,並行、串列;
數據集快照:一個時間點上,數據在所有數據集上的分布情況;
星型模式元數據:事實表、維度、屬性、層次等;
報表語義層:報表指標的規則、過濾條件物理名稱和業務名稱的對應;
數據訪問日誌:哪些數據何時被何人訪問;
質量稽核日誌:何時、何度量被稽核,其結果;
數據裝載日誌:哪些數據何時被何人裝載;
五、元數據開發應用的標准化框架
1、數字圖書館資源組織框架
2. 元數據開發應用框架
2.1 元數據的基本意義 Metadata(元數據)是「關於數據的數據」;
元數據為各種形態的數字化信息單元和資源集合提供規范、普遍的描述方法和檢索工具;
元數據為分布的、由多種數字化資源有機構成的信息體系(如數字圖書館)提供整合的工具與紐帶。
離開元數據的數字圖書館將是一盤散沙,將無法提供有效的檢索和處理。
3. 元數據應用環境
3.1 Metadata的應用目的
(1)確認和檢索(Discovery andentification),主要致力於如何幫助人們檢索和確認所需要的資源,數據元素往往限於作者、標題、主題、位置等簡單信息,Dublin Core是其典型代表。
(2)著錄描述(Cataloging),用於對數據單元進行詳細、全面的著錄描述,數據元素囊括內容、載體、位置與獲取方式、製作與利用方法、甚至相關數據單元方面等,數據元素數量往往較多,MARC、GILS和FGDC/CSDGM是這類Metadata的典型代表。
(3)資源管理(Resource Administration),支持資源的存儲和使用管理,數據元素除比較全面的著錄描述信息外,還往往包括權利管理(Rights/Privacy Management)、電子簽名(Digital Signature)、資源評鑒(Seal of Approval/Rating)、使用管理(Access Management)、支付審計(Payment and Accounting)等方面的信息。
(4)資源保護與長期保存(Preservation and Archiving),支持對資源進行長期保存,數據元素除對資源進行描述和確認外,往往包括詳細的格式信息、製作信息、保護條件、轉換方式(Migration Methods)、保存責任等內容。
3.2 Metadata在不同領域的應用 根據不同領域的數據特點和應用需要,90年代以來,許多Metadata格式在各個不同領域出現
例如:
網路資源:Dublin Core、IAFA Template、CDF、Web Collections
文獻資料:MARC(with 856 Field),Dublic Core
人文科學:TEI Header
社會科學數據集:ICPSR SGML Codebook
博物館與藝術作品:CIMI、CDWA、RLG REACH Element Set、VRA Core
政府信息:GILS
地理空間信息:FGDC/CSDGM
數字圖像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images
檔案庫與資源集合:EAD
技術報告:RFC 1807
連續圖像:MPEG-7
3.3 Metadata格式的應用程度
不同領域的Metadata處於不同的標准化階段:
在網路資源描述方面,Dublin Core經過多年國際性努力,已經成為一個廣為接受和應用的事實標准;
在政府信息方面,由於美國政府大力推動和有關法律、標準的實行,GILS已經成為政府信息描述標准,並在世界若干國家得到相當程度的應用,與此類似的還有地理空間信息處理的FGDC/CSDGM;
但在某些領域,由於技術的迅速發展變化,仍然存在多個方案競爭,典型的是數字圖像的Metadata,現在提出的許多標准都處於實驗和完善的階段。
3.4 Metadata格式「標准化」程度問題
Metadata開發應用經驗表明,很難有一個統一的Metadata格式來滿足所有領域的數據描述需要;即使在同一個領域,也可能為了不同目的而需要不同的但可相互轉換的Metadata格式。
同時,統一的集中計劃式的Metadata格式標准也不適合Internet環境,不利於充分利用市場機制和各方面力量。
但在同一領域,應爭取「標准化」,在不同領域,應妥善解決不同格式的互操作問題。
4. 元數據結構
4.1 總體結構定義方式 一個Metadata格式由多層次的結構予以定義:
(1)內容結構(Content Structure),對該Metadata的構成元素及其定義標准進行描述。
(2)句法結構(Syntax Structure),定義Metadata結構以及如何描述這種結構。
(3)語義結構(Semantic Structure),定義Metadata元素的具體描述方法。
4.2 內容結構
內容結構定義Metadata的構成元素,可包括: 描述性元素、技術性元素、管理性元素、結構性元素(例如與編碼語言、Namespace、數據單元等的鏈接)。
這些數據元素很可能依據一定標准來選取,因此元數據內容結構中需要對此進行說明,例如MARC記錄所依據的ISBD,EAD所參照的ISAD(G),ICPSR所依據的ICPSR Data Preparation Manual。
4.3 句法結構
句法結構定義格式結構及其描述方式,例如元素的分區分段組織、元素選取使用規則、元素描述方法(例如Dublin Core採用ISO/IEC 11179標准)、元素結構描述方法(例如MARC記錄結構、SGML結構、XML結構)、結構語句描述語言(例如EBNF Notation)等。
有時,句法結構需要指出元數據是否與所描述的數據對象捆綁在一起、或作為單獨數據存在但以一定形式與數據對象鏈接,還可能描述與定義標准、DTD結構和Namespace等的鏈接方式。
4.4 語義結構 語義結構定義元素的具體描述方法,例如 描述元素時所採用的標准、最佳實踐(Best Practices)或自定義的描述要求(Instructions)。
有些元數據格式本身定義了語義結構,而另外一些則由具體採用單位規定語義結構,例如Dublin Core建議日期元素採用ISO 8601、資源類型採用Dublin Core Types、數據格式可採用MIME、識別號採用URL或DOI或ISBN;
又如OhioLink在使用VRA Core時要求主題元素使用A&AT、TGM和TGN,人名元素用ULAN。
5. 元數據編碼語言與製作方式
5.1 元數據編碼語言
元數據編碼語言(Metadata Encoding Languages)指對元數據元素和結構進行定義和描述的具體語法和語義規則,常稱為定義描述語言(DDL)。
在元數據發展初期人們常使用自定義的記錄語言(例如MARC)或資料庫記錄結構(如ROADS等),但隨著元數據格式的增多和互操作的要求,人們開始採用一些標准化的DDL來描述元數據,例如SGML和XML,其中以XML最有潛力。
5.2 元數據製作方式
(1)專門編制模塊(例如對MARC、GILS、FGDC等)
(2)數據處理時自動編制(例如對Dublin Core等)
(3)數據物理處理時自動編制(例如數字圖像掃描時的某些元數據參數)
(4)共享元數據(例如OCLC/CORC、IMESH
6. 元數據互操作性
6.1 元數據互操作性問題
由於不同的領域(甚至同一領域)往往存在多個元數據格式,當在用不同元數據格式描述的資源體系之間進行檢索、資源描述和資源利用時,就存在元數據的互操作性問題(Interoperability):
多個不同元數據格式的釋讀、轉換和由多個元數據格式描述的數字化信息資源體系之間的透明檢索。
6.2 元數據格式映射
利用特定轉換程序對不同元數據元格式進行轉換,稱為元數據映射(Metadata Mapping/Crosswalking)。
目前已有大量的轉換程序存在,供若幹流行元數據格式之間的轉化,例如
Dublin Core與USMARC; Dublin Core與EAD
Dublin Core與GILS; GILS與MARC TEI
Header與MARC FGDC與MARC
也可利用一種中介格式對同一格式框架下的多種元數據格式進行轉換,例如UNIverse項目利用GRS格式進行各種MARC格式和其它記錄格式的轉換。格式映射轉換准確、轉換效率較高。不過,這種方法在面對多種元數據格式並存的開放式環境中的應用效率明顯受到限制。
6.3 標准描述框架
解決元數據互操作性的另一種思路是建立一個標準的資源描述框架,用這個框架來描述所有元數據格式,那麼只要一個系統能夠解析這個標准描述框架,就能解讀相應的Metadata格式. 實際上,XML和RDF從不同角度起著類似的作用。
XML通過其標準的DTD定義方式,允許所有能夠解讀XML語句的系統辨識用XML_DTD定義的Metadata格式,從而解決對不同格式的釋讀問題。
RDF定義了由Resources、Properties和Statements等三種對象組成的基本模型,其中Resources和Properties關系類似於E-R模型,而Statements則對該關系進行具體描述。
RDF通過這個抽象的數據模型為定義和使用元數據建立一個框架,元數據元素可看成其描述的資源的屬性。
進一步地,RDF定義了標准Schema,規定了聲明資源類型、聲明相關屬性及其語義的機制,以及定義屬性與其它資源間關系的方法。另外,RDF還規定了利用XML Namespace方法調用已有定義規范的機制,
6.4 數字對象方式
建立包含元數據及其轉換機制的數字對象可能從另一個角度解決元數據互操作性問題。
Cornell/FEDORA項目提出由內核(Structural Kernel)和功能傳播層(Disseminator Layer)組成的復合數字對象。
內核里,可以容納以比特流形式存在的文獻內容、描述該文獻的元數據、以及對這個文獻及元數據進行存取控制的有關數據。
功能傳播層,主功能傳播器(PrimitiveDisseminator)支持有關解構內核數據類型和對內核數據讀取的服務功能,還可有內容類型傳播器(Content-Type Disseminators),它們可內嵌元數據格式轉換機制。
例如,在一個數字對象的內核中存有MARC格式的元數據,在功能傳播層裝載有請求Dublin Core格式及其轉換服務的內容類型傳播器。當數字對象使用者要求讀取以Dublin Core表示的元數據時,相應的內容類型傳播器將通過網路請求存儲有Dublin Core及其轉換服務程序的數字對象,然後將被請求數字對象中的MARC形式元數據轉換為Dublin Core形式,在輸出給用戶。
7. 幾點建議
跟蹤元數據發展、積極參與制定元數據標准、加快元數據應用、注意國際接軌。
加快研究有效利用元數據進行檢索(包括異構系統透明檢索)、相關性學習、個性化處理等的機制。
加快研究元數據與數字對象和數字化資源體系有機整合的途徑與方法。
推進研究利用元數據進行基於知識的數據組織和知識發現。
⑷ 什麼是元數據
元數據最本質、最抽象的定義為:data about data 。它是一種廣泛存在的現象,在許多領域有其具體的定義和應用。
數據倉庫
在數據倉庫領域中,
元數據按用途分成技術元數據和業務元數據。首先,元數據能提供基於用戶的信息,如記錄數據項的業務描述信息的元數據能幫助用戶使用數據。其次,元數據能支持系統對數據的管理和維護,如關於數據項存儲方法的元數據能支持系統以最有效的方式訪問數據。具體來說,在數據倉庫系統中,元數據機制主要支持以下五類系統管理功能:
(1)描述哪些數據在數據倉庫中;
(2)定義要進入數據倉庫中的數據和從數據倉庫中產生的數據;
(3)記錄根據業務事件發生而隨之進行的數據抽取工作時間安排;
(4)記錄並檢測系統數據一致性的要求和執行情況;
(5)衡量數據質量。
詳情參考網路
http://ke..com/link?url=ldlAaR5k1DEEj4i-55P58_PXUMm4PW9LCpSG8p-me9uaRNaBj0td0kZmphGniADo
⑸ 什麼是元數據
元數據(Metadata),又稱中介數據、中繼數據,為描述數據的數據(data about data)。
元數據作用是:
1、描述數據屬性(property)的信息,用來支持如指示存儲位置、歷史數據、資源查找、文件記錄等功能。
2、元數據算是一種電子式目錄,為了達到編制目錄的目的,必須在描述並收藏數據的內容或特色,進而達成協助數據檢索的目的。
元數據的應用舉例:
1、數據結構:數據集的名稱、關系、欄位、約束等;
2、數據部署:數據集的物理位置;
3、數據流:數據集之間的流程依賴關系(非參照依賴),包括數據集到另一個數據集的規則;
4、質量度量:數據集上可以計算的度量;
5、度量邏輯關系:數據集度量之間的邏輯運算關系;
6、ETL過程:過程運行的順序,並行、串列;
7、數據集快照:一個時間點上,數據在所有數據集上的分布情況。
(5)用戶自定義元數據什麼意思擴展閱讀:
元數據的優點:
1、自描述:元數據自動提供 COM 中 IDL 的功能,允許將一個文件同時用於定義和實現。運行庫模塊和程序集甚至不需要向操作系統注冊。結果,運行庫使用的說明始終反映編譯文件中的實際代碼,從而提高應用程序的可靠性。
2、設計:元數據提供所有必需的有關已編譯代碼的信息,以供用戶從用不同語言編寫的 PE 文件中繼承類。用戶可以創建用任何託管語言(任何面向公共語言運行庫的語言)編寫的任何類的實例,而不用擔心顯式封送處理或使用自定義的互用代碼。
⑹ 什麼叫元數據
元數據(Meta Date),主要記錄數據倉庫中模型的定義、各層級間的映射關系、監控數據倉庫的數據狀態及ETL的任務運行狀態。一般會通過元數據資料庫(Metadata Repository)來統一地存儲和管理元數據,其主要目的是使數據倉庫的設計、部署、操作和管理能達成協同和一致。
元數據是數據倉庫管理系統的重要組成部分,元數據管理是企業級數據倉庫中的關鍵組件,貫穿數據倉庫構建的整個過程,直接影響著數據倉庫的構建、使用和維護。
元數據不僅定義了數據倉庫中數據的模式、來源、抽取和轉換規則等,而且是整個數據倉庫系統運行的基礎,元數據把數據倉庫系統中各個鬆散的組件聯系起來,組成了一個有機的整體。
⑺ C#中的元數據是什麼意思
元數據概述:元數據是一種二進制信息,用以對存儲在公共語言運行庫可移植可執行文件 (PE) 文件或存儲在內存中的程序進行描述。將您的代碼編譯為 PE 文件時,便會將元數據插入到該文件的一部分中,而將代碼轉換為 Microsoft 中間語言 (MSIL) 並將其插入到該文件的另一部分中。在模塊或程序集中定義和引用的每個類型和成員都將在元數據中進行說明。當執行代碼時,運行庫將元數據載入到內存中,並引用它來發現有關代碼的類、成員、繼承等信息。
元數據以非特定語言的方式描述在代碼中定義的每一類型和成員。元數據存儲以下信息:
程序集的說明。
標識(名稱、版本、區域性、公鑰)。
導出的類型。
該程序集所依賴的其他程序集。
運行所需的安全許可權。
類型的說明。
名稱、可見性、基類和實現的介面。
成員(方法、欄位、屬性、事件、嵌套的類型)。
屬性。
修飾類型和成員的其他說明性元素。
元數據的優點
對於一種更簡單的編程模型來說,元數據是關鍵,該模型不再需要介面定義語言 (IDL) 文件、頭文件或任何外部組件引用方法。元數據允許 .NET 語言自動以非特定語言的方式對其自身進行描述,而這是開發人員和用戶都無法看見的。另外,通過使用屬性,可以對元數據進行擴展。元數據具有以下主要優點:
自描述文件
公共語言運行庫模塊和程序集是自描述的。模塊的元數據包含與另一個模塊進行交互所需的全部信息。元數據自動提供 COM 中 IDL 的功能,允許將一個文件同時用於定義和實現。運行庫模塊和程序集甚至不需要向操作系統注冊。結果,運行庫使用的說明始終反映編譯文件中的實際代碼,從而提高應用程序的可靠性。
語言互用性和更簡單的基於組件的設計
元數據提供所有必需的有關已編譯代碼的信息,以供您從用不同語言編寫的 PE 文件中繼承類。您可以創建用任何託管語言(任何面向公共語言運行庫的語言)編寫的任何類的實例,而不用擔心顯式封送處理或使用自定義的互用代碼。
屬性
.NET Framework 允許您在編譯文件中聲明特定種類的元數據(稱為屬性)。在整個 .NET Framework 中到處都可以發現屬性的存在,屬性用於更精確地控制運行時您的程序如何工作。另外,您可以通過用戶定義的自定義屬性向 .NET Framework 文件發出您自己的自定義元數據。有關更多信息,請參見利用屬性擴展。
元數據和PE文件結構:
元數據存儲在 .NET Framework 可移植可執行文件 (PE) 文件的一個部分中,而 Microsoft 中間語言 (MSIL) 則存儲在 PE 文件的另一部分中。文件的元數據部分包含一系列的表和堆數據結構。MSIL 部分包含 MSIL 和引用 PE 文件元數據部分的元數據標記。當使用工具(例如,使用 MSIL 反匯編程序 (Ildasm.exe) 來查看代碼的 MSIL 或使用運行庫調試器 (Cordbg.exe) 來執行內存轉儲)時,您可能會遇到元數據標記。
⑻ 什麼是資料庫的元數據
1、元數據是進行數據集成所必需的 數據倉庫最大的特點就是它的集成性。
2、它不僅體現在它所包含的數據上,還體現在實施數據倉庫項目的過程當中。一方面,從各個數據源中抽取的數據要按照一定的模式存入數據倉庫中,這些數據源與數據倉庫中數據的對應關系及轉換規則都要存儲在元數據知識庫中;
3、另一方面,在數據倉庫項目實施過程中,直接建立數據倉庫往往費時、費力,因此在實踐當中,人們可能會按照統一的數據模型,首先建設數據集市,然後在各個數據集市的基礎上再建設數據倉庫。
4、不過,當數據集市數量增多時很容易形成"蜘蛛網"現象,而元數據管理是解決"蜘蛛網"的關鍵。如果在建立數據集市的過程中,注意了元數據管理,在集成到數據倉庫中時就會比較順利;
5、如果在建設數據集市的過程中忽視了元數據管理,那麼最後的集成過程就會很困難,甚至不可能實現。