A. 元数据库
元数据是“关于数据的数据”,存在于电子信息环境中,用于描述资源的属性,呈现其关系,支持资源发现、管理与有效利用(徐筱红,2006),是对所采集到的数据的说明。一般来说,它有两方面的用途:首先,元数据能提供基于用户的信息,如记录数据项的业务描述信息的元数据能帮助用户使用数据;其次,元数据能支持系统对数据的管理和维护,如关于数据项存储方法的元数据能支持系统以最有效的方式访问数据。具体来说,在塔里木河流域生态环境动态监测及辅助决策支持系统综合数据库系统中,元数据机制主要支持以下几类系统管理功能:①描述哪些数据在综合数据库中;②定义要进入数据库中的数据和从数据库中产生的数据;③记录并检测系统数据一致性的要求和执行情况;④衡量数据质量。
(一)元数据分级与特征
1.元数据分级
基本元数据:提供地理数据源基本文档所需要的最少的元数据元素集。
完全元数据:提供完整的地理数据源(单独的数据集、数据集系列、各种地理要素)文档所需要的必选的和可选的元数据元素集。它完整地定义全部元数据,以便标识、评价、摘录、使用和管理地理信息。
2.元数据特征
(1)名称:赋给元数据实体或元素的标记。
(2)标识码:计算机中使用的定义每个元数据实体和元素的唯一代码。代码结构为:XXXXXX
前2位为元数据子集,2位数字码;中间2位为元数据实体/独立元素,2位数字码;后2位为元数据实体包含的元素,2位数字码。
(3)定义:对元数据实体和元素的说明。
(4)性质:说明元数据实体或元素是否总是出现,或有时出现的描述符。描述符分别为:M-必选;C-一定条件下必选;O-可选。
(5)条件:说明何种条件下元数据子集、实体或元素是必选的。如果对所说明的条件成立,那么该子集、实体或元素就是必选的。
(6)最大出现次数:指定元数据实体或元素在实际使用时,可能重复出现的最大次数。只出现一次的表示为“1”,重复出现的表示为“N”。
(7)数据类型:表示元数据元素的一组不同的值,例如,“文本”、“整型”、“短语”、“坐标串”、“实型”和“日期”。
(8)值域:指定每个元数据元素的取值范围。“任意长文本”表示所述内容不受限制,实型数和基于代码的整型数等只能使用一个限定的(闭合的)值域内的值。
(二)元数据库主要内容
塔里木河流域生态环境动态监测系统的元数据包括数字影像图、数字栅格图、数字高程模型、数字线划图等。大部分数据都有相应的国家或行业元数据标准规范,有国家或行业标准的按照标准规范采集;没有规范的,按照元数据的分级特征进行定义。主要包括有关数据源、数据分层、成果归属、空间参照系、数据质量(包含数据精度和数据评价)、数据更新、图幅接边等方面的信息(周骋等,2006)。其主要内容描述如下:
(1)标识信息:是唯一标识数据集的元数据信息。包括数据集名称、发布时间、版本、语种、摘要、现状、空间范围(地理范围、时间范围)、表示方式、空间分辨率、信息类别。
(2)数据质量信息:是数据集质量的总体评价。包括数据集内容完整性说明、数据集在概念、值域、格式和拓扑关系等方面的一致性程度、位置精度(空间位置绝对精度和相对精度)、时间精度(表示时间的精确程度、现势性、有效性)、属性精度(数据集属性分类正确性、属性值的精度和正确性)、数据质量保证措施。
(3)数据字典信息:包含数据集应用、数据源及生产数据集时所用工艺方法等信息。
(4)空间参照系信息:数据集使用的空间参照系统的说明。包括基于地理标识的空间参照系统、基于坐标的空间参照系统。
(5)内容信息:描述数据集的主要内容。包括主要要素类型名称及相应的属性名称、影像数据集内容概述(波长、波段、灰阶等级、合成处理方式)、栅格数据集内容概述(格网尺寸、格网尺寸单位、格网行列数、格网起始点坐标)。
(6)元数据参考信息:包括元数据发布或更新的时间,以及建立元数据单位的联系信息。
以上6类由两个公共数据类型联系,公共数据类型包括:
(1)覆盖范围信息:数据集的空间范围(经纬度坐标、地理标识符)、时间范围(起始时间、终止时间)、垂向范围(最小垂向坐标值、最大垂向坐标值、计量单位)。
(2)负责单位联系信息:与数据集有关的单位标识(负责单位名称、联系人、职责)和联系信息(电话、传真、通信地址、邮政编码、电子信箱地址、网址)。
(三)元数据入库
元数据信息是一个纯文本文件,在生产时采集了多项数据,它是与图形数据、属性数据紧密联系在一起的,按照每幅图一个文本文件存储。为了实现数据库系统中元数据与数据体的集成化管理,以及元数据与数据体的一体化相互检索查询,需将元数据信息空间化。采取的技术方法就是将元数据文件与图幅结合表联系起来,将每一幅图形的区域作为一个目标对象,所采集的多项元数据信息作为其属性项,构成一个以图幅结合表为基础的矢量格式元数据集。同图形数据坐标系统一样,元数据采用地理坐标系统,整个流域则以Coverage格式整体存储,数据处理完成后全部导入到Oracle9i数据库中。
B. 元数据技术在实物地质资料资源信息化中的应用
王静茹
(国土资源部实物地质资料中心,三河065201)
摘要 本文从元数据概念出发,结合实物地质资料信息化现状,对实物地质资料采取元数据技术实现数字化进程中的若干问题进行了探索。重点论述了元数据技术在实物地质资料信息化的重要性和可行性,阐明了在实物地质资料领域应用元数据技术可以避免其他行业在数字化进程中遇到的问题,从而更有效的实现数据共享,对促进实物地质资料成果的交流和推广,有着十分重要的意义。
关键词 元数据;实物地质资料;信息化;应用
1 概述
信息化、数字化使信息资源提供者和使用者之间突破时间、空间、地域的限制,使信息资源实现更广时空范围内的共享。随着科技水平的不断进步,交流范围的不断拓展,对数字化的信息资源采取标准化、专业化处理,已成为信息资源提供者和使用者的共同要求。目前,很多领域在数字化时选择了元数据处理技术,它通过采用普遍适用的数据标准,使信息资源具有很强“可读性”、科学性和先进性,实现了信息资源的数字化和更大范围共享,满足了不同使用者的差异性要求,取得了很好的社会效益和经济效益。
2 元数据概念与技术特点
2.1 元数据的基本概念
元数据最本质的定义是关于数据的数据(data about data)。元数据可以为各种形态的信息资源(或称本体)提供规范、普遍的描述方法和检索工具,为分散的、由多种资源组成的信息体系提供整合的工具与纽带。
元数据的功能或作用主要为描述、资源发现、数据管理、访问控制、数字化保存、内容分级等诸多方面。按照元数据的主要功能,元数据一般可分为描述性元数据、管理型元数据、结构性元数据、保存性元数据等。描述性元数据是用来描述、发现和鉴别数字化信息对象,它主要描述信息资源的主题和内容特征。管理型元数据是以管理资源对象为目的的属性元素,包括资源对象的显示、注解、使用、长期管理等方面的内容。结构性元数据用于定义一个复杂的资源对象的物理结构,以利于信息检索和显示。元数据最基本的功能是通过数据元素集定义资源对象的各类属性,这些属性的大量实例可以表达为关系型数据库中的表,从而能够利用数据库系统或各类应用软件进行管理。保存性元数据是以保存资源对象为信息系统的开发目的,特别注重资源对象长期保存有关的属性。
元数据的提供者可以根据本体的不同,有侧重地实现某些功能。如对实物地质资料而言,由于其历史价值一般较高,要求长期保存并能基本维持其原貌,但在自然条件下,要达到这一要求具有相当的难度,必须支付相当昂贵的日常维护成本。在数字化背景下,则完全可以实现永久“虚拟”保存功能,从这一角度说,实物地质资料元数据可以认为是保存性元数据,另外,实现资源发现等其他功能也比较重要。
2.2 元数据技术特点
简单地说,元数据技术是指基于元数据标准而实现资源数字化的一整套标准、流程的总称。元数据标准是经过标准化组织认可的元数据方案。
(1)元数据标准将成为未来数字化的普遍标准。数字化是随着互联网的产生而产生的。同时,随着互联网语言标准的变化,数字化语言标准将作适应性调整和变化。目前网络环境下的数字化成果大多数基于第二代互联网语言标准。研究表明,随着互联网的飞速发展,下一代万维网——语义万维网(Semantic Web)将赋予万维网上所有资源唯一的标识,并在资源之间建立机器可处理的各类语义联系,元数据将是语义万维网的语义基础。随着新一代万维网的普及和推广,目前的大多数非元数据数字化成果将面临被淘汰,或是付出高成本将其转换为元数据标准。
(2)元数据技术以资源数字化为前提,以元数据集为内核。资源数字化是采取元数据技术的前提和基础,从理论上来说任何资源都可别标识,都可以进行数字化处理,也都可以采取元数据技术,但限于技术条件和效益—成本约束,有些资源无法(或不值得)数字化,因此也不宜使用元数据技术。
(3)元数据强烈依赖网络平台。形象地说,元数据是在网络环境下,计算机之间进行交流的语言,元数据既看不见,又摸不着,不是一种可视语言,它只有依托网络平台,其所描述的本体才能表达和展现出来,元数据对网络环境具有强烈的依赖性,离开网络,就无从谈论元数据。
3 元数据技术在实物地质资料信息资源应用中的重要性和可行性
实物地质资料一般无法复制,即使随着科学技术水平的提高和分析手段的改进,能够在特定条件下实现部分重置,但成本也是很高的。再加上同样高昂的采集成本,一份实物地质资料,其直观的经济价值就相当可观。
实物地质资料的最主要的功能是为长期、可持续地研究、分析我国基础地质、矿产资源等方面提供基础性研究样本。因此,实物地质资料的社会性和公益性价值是无法用金钱来衡量的,是一种形成于历史、发掘于现代、惠及后世的极其宝贵的社会资源。但是,由于实物地质资料大部分以实体形态存在(如岩心、矿心、岩石样本等),移动困难,资料使用者只好采取实地观察的形式,给使用者造成很大的不便。而且,这些实物资料在移动过程中易于损毁,造成无法弥补的损失。因此,利用先进的技术方法,改进和提高分析手段,对加强实物地质资料保管、分析研究和提高其使用效率,具有十分重要的意义。元数据技术就可以很好地解决这一问题,它可以在不见实物的情况下,利用网络平台,实现对实物地质资料物理、化学等属性特征的分析研究工作。在这一过程中,元数据扮演了实物“替代品”的角色,即使实体被损毁或丢失,通过元数据技术采集的信息仍可以达到“恢复”实体的效果。实体与虚拟体的分离,可以减轻对实体的维护压力,降低损耗和维护成本,亦可延长实体的使用寿命。
按照元数据技术原理,资源是可以被标识的任何东西,既可以是实体的,也可以是抽象的。实物地质资料主要以实体形态存在,包括岩心、矿心、软泥心、岩石、矿石、矿物、岩石光片、薄片、重砂等,另外,如分析材料、物理性实验结论、化验成果等则以抽象形态存在。从理论上来说,实物地质资料也是一种资源,无论其是实体形态,还是抽象形态,均可以采取元数据技术进行处理,因此,采取元数据技术在理论上是可行的。
国家已经发布了地理信息元数据(ISO 19115—2003(E)Geographic information-Metadata.GB/T 19710—2005)和国土资源信息核心元数据标准(TD/T 1016—2003),对指导和推进元数据技术在地质领域的应用起到了重要的作用。2007年12月7日,中国地质调查局发布了《地质信息元数据标准》,这一系列与元数据有关的重要标准的发布,标志着在地质领域应用元数据技术已经有了成熟的制度基础。
元数据技术是以信息数字化为实践基础,以网络为背景,以元数据集为内核,因此首先要求资源的数字化,其次对信息平台有强烈的依赖性。随着《实物地质资料管理办法》的颁布实施,实物地质资料的管理逐步规范化、制度化,实物地质资料中心已经根据国土资源部“关于建立健全地质资料网络服务体系”的通知要求,建立了自己的信息平台。岩心扫描技术和图像分析技术也越来越成熟,也使实物地质资料数字化成为现实。在实物地质资料领域采取元数据技术,在硬件方面已经没有无法逾越的障碍。
因此,在实物地质资料领域应用元数据技术,在理论上、制度上、硬件等方面已经具备成熟条件,完全可以根据元数据标准实现实物地质资料资源信息化,建立实物地质资料元数据集。
4 结论与建议
目前许多发达国家已经进入数字化时代,我国也加大了对数字化的投入和建设,相对于其他领先行业和领域,如石油行业,实物地质资料领域处于较落后的位置,数字化建设基本刚刚起步,但正是这种明显的劣势,通过各方面的努力,却可以转化为优势,即在起步阶段就采取高技术标准,就完全可以避免重走其他行业在探索阶段所必须经历的弯路,大幅度降低成本。采用元数据这一“通用”语言,就可以实现数据在国际国内间的互换,对促进实物地质资料成果的交流和推广,有着十分重要的意义。
目前,实物地质资料管理工作依旧以传统的实体整理为主,数字化成果较少且尚处于起步阶段,而且国家及有关部门对实物地质资料数字化还没有强制提出采用元数据标准。但是,元数据技术作为下一代网络信息资源整理技术的发展方向和新标准,现在数字化技术条件下的实物地质资料数字化成果将难以适应新技术发展的要求,也势必会阻碍实物地质资料的深入开发和广泛共享。因此,根据网络新技术发展要求,尽快尽早地采用元数据技术实现实物地质资料的数字化,为全社会提供更广泛的公益性服务,是实物地质资料整理、应用的重要课题之一。
C. 地理信息系统知识点
地理信息系统是一门综合性学科,结合地理学与地图学以及遥感和计算机科学,已经广泛的应用在不同的领域,是用于输入、存储、查询、分析和显示地理数据的计算机系统,接下来我为你整理了地理信息系统知识点,一起来看看吧。
1、什么是GIS?它具有什么特点?
答:地理信息系统(GIS , Geographic Information System)是在计算机硬、软件系统支持下,对现实世界(资源与环境)的研究和变迁的各类空间数据及描述这些空间数据特性的属性进行采集、储存、管理、运算、分析、显示和描述的技术系统
特点有:
○1具有采集、管理、分析和输出多种地理空间信息的能力;
○2以地理研究和地理决策为目的,以地理模型方法为手段,具有空间分析、多要素综合分析和动态预测的能力;并能产生高层次的地理信息。
○3具有公共的地理定位基础,所有的地理要素,要按经纬度或者特有的坐标系统进行严格的空间定位。
○4由计算机系统支持进行空间地理数据管理,并由计算机程序模拟常规的或专门的地理分析方法,作用于空间数据,产生有用信息,完成人类难以完成的任务。
○5地理信息系统从外部来看,它表现为计算机软硬件系统;而其内涵确是由计算机程序和地理数据组织而成的地理空间信息模型,是一个逻辑缩小的、高度信息化的地理系统。信息的流动及信息流动的结果,完全由计算机程序的运行和数据的交换来仿真
2、GIS与其它信息系统有什么区别
答:第一,GIS有别于DBMS(数据库管理系统),GIS具有以某种选定的方式对空间数据进行解释和判断的能力,而不是简单的数据管理,这种能力使用户能得到关于数据的知识,因此,GIS是能对空间数据进行分析的DBMS,GIS必须包含DBMS。
第二,GIS有别于MIS(管理信息系统),GIS要对图形数据和属性数据库共同管理、分析和应用,GIS的软硬件设备要复杂、系统功能要强;MIS则只有属性数据库的管理,即使存贮了图形,也是以文件形式管理,图形要素不能分解、查询、没有拓扑关系。管理地图和地理信息的MIS不一定就是GIS,MIS在概念上更接近DBMS。
第三,GIS有别于地图数据库,地图数据库仅仅是将数字地图有组织地存放起来,不注重分析和查询,不可能去综合图形数据和属性数据进行深层次的空间分析,提供辅助决策的信息,它只是GIS的一个数据源。
第四,GIS有别于CAD系统,二者虽然都有参考系统,都能描述图形,但CAD系统只处理规则的几何图形,属性库功能弱,更缺乏分析和判断能力。
3、简述GIS的构成
答:GIS构成:硬件平台、软件平台、空间数据、应用人员、GIS模型。
4、简述GIS的发展。
答:地理信息系统的发展的四个阶段 :
第一阶段:60年代起源于北美:加拿大国家土地调查局为了处理大量的土地调查资料,于60年 代开始建立地理信息系统(CGIS),于70年代初投入产品生产;同一时期的美国哈佛大学的计算机图形与空间分析实验室,建立通用的制图软件包,竭力发展空间分析模型和软件
第二阶段:70年代是GIS发展的巩固阶段:美国、加拿大、英国、西德、瑞典和日本等国对地理信息系统的研究均投入了大量的人力、物力、财力,研究不同专题、不同规模、不同类型的各具特色的地理信息系统。
第三阶段:80年代为地理信息系统的大发展阶段:计算机的迅速发展和普及,地理信息系统也逐 步走向成熟,并在全世界范围内全面地推向应用阶段。
第四阶段:90年代至今为地理信息系统的应用普及时代 :由于计算机的软硬件均得到飞速的发展,网络已进入千家万户,地理信息系统已成为许多机构必备的工作系统,尤其是政府决策部门在一定程度上由于受地理信息系统影响而改变了现有机构的运行方式、设置与工作计划等。从美国的 “国家信息基础设施:行动计划(National Information Infrastructure ,简称NII)” 建设到数字地球的提出,由“数字地球”细化到“数字中国”、“数字省区”、“数字城市” 、“数字小区”直到“企业信息化”、“电子商务”、“数字通讯”、“虚拟现实”等众多的信息化领域的工作已全面铺开。
5、举例说明GIS可应用的行业
测绘与地图制图 资源调查与管理 城乡规划 灾害监测 环境保护 国防 宏观决策支持
如:防火信息系统、水质管理、城市土地利用信息系统、电信资源管理、铁路地理信息系统、公安警用地理信息系统、医疗机构信息查询等
1、说说地理空间模型是怎样建立的?
(1)地球椭球体模型:以大地水准面为基准建立的。地球的形状接近于椭圆绕其短轴形成的椭球体,通过扁率表示椭球体的扁平程度。大地水准面与具有微小扁率的旋转椭球面非常接近,可用旋转椭球体代替大地球体。
(2)地球表面:最自然的面,包括海洋底部、高山、高原等在内的固体地球表面。——太复杂,难以建模,各种量算也非常困难。
(3)大地水准面:相对抽象的面,是静止海平面的延伸。以它为基准,可以用水准仪测量地球自然表面上任意点的高程。——海平面的起伏将导致测量的不确定。大地水准面所包围的球体,叫大地球体
2、GIS中为什么要考虑地图投影?
答:GIS以地图方式显示地理信息。地图是平面,而地理信息则是在地球椭球上,因此地图投影在GIS中不可缺少。
GIS数据库中地理数据以地理坐标存储时,则以地图为数据源的空间数据必须通过投影变换转换成地理坐标;而输出或显示时,则要将地理坐标表示的空间数据通过投影变换变换成指定投影的平面坐标。
GIS中,地理数据的显示可根据用户的需要而指定投影方式,但当所显示的地图与国家基本地图系列的比例尺一致时,一般采用国家基本系列地图所用的投影。
3、地理空间实体的三要素是什么?它们之间的关系是怎样的?
答:地理空间试题三要素是点、线、面三种要素,分别用点状、线状、面状符号表示。其中,点要素是有位置,无宽度和长度的抽象的点;线要素是有长度,但无宽度和高度 用来描述线状实体的,通常在网络分析中使用较多,度量实体距离。面要素则具有长和宽的目标,通常用来表示自然或人工的封闭多边形,一般分为连续面和不连续面。
4、 空间数据的基本特征有哪些?地理信息的数字化描述方法有哪些?
5、 答:有
属性特征:描述空间对象的特性,即是什么,如对象的类别、等级、名称、数量等。
空间特征:描述空间对象的地理位置以及相互关系,又称几何特征和拓扑特征,前者用经纬度、坐标表示,后者如交通学院与电力学院相邻等。
时间特征:描述空间对象随时间的变化
方法有:显性描述和隐性描述。计算机对空间实体的显性描述也称栅格数据结构,对地理实体的隐性描述也成矢量数据结构。所以有栅格法和矢量法可以表示空间信息。
6、 什么是元数据?为什么要使用元数据?
答:元数据是关于数据的描述性数据信息,说明数据内容、质量、状况和其他有关特征的背景信息。其目的是促进数据集的高效利用,并为计算机辅助软件工程服务。
元数据的作用和意义:
(1)帮助数据生产单位有效的维护和管理数据;
(2)提供有关数据生产单位的各种有关信息供用户查询;
(3) 帮助用户了解数据;
(4) 提供有关信息,以便用户处理和转换有用数据。
(5) 采用元数据可以便于数据共享。
1、数据库的定义:是为一定目的服务,以特定的数据存储的相关联的数据集合
2、数据库的特征:
(1)在数据库中的数据独立于应用,从而实现了数据共享,减少了信息冗余,提高了数据的利用效率。
(2)在数据值中建立了联系,体现逻辑性和科学性。
(3)复杂的数据模型,为数据的安全与保护提供了基础。
(4)数据保护性特征
3、数据库管理系统
定义:在信息系统中,应用程序对数据库中的数据的访问,是通过一个能对数据库进行定义、建立、维护、管理、查询、通讯等基本操作的核心软件而进行的。功能:数据库的定义、数据库的维护、数据库之间的通讯。
4、地理信息系统数据库(GIS数据库)及其特点
定义: GIS数据库是关于特定区域内一定地理要素特征的数据集合。
特点:(1)不仅存贮有关对象的属性数据,同时还存储有关对象的空 间定位数据,且二者具有不可分割的紧密联系。(2)数据量特别大。(3)数据的应用广泛。
5、数据模型:数据库系统中关于数据和联系的逻辑组织的形式表示。数据库领域采用的数据模型有层次模型、网状模型和关系模型,其中应用最广泛的是关系模型。
6、传统数据库在管理空间数据时的局限:
(1)管理的是不连续的、相关性较小的数字和字符。
(2)管理的实体类型较少,并且实体类型之间通常只有简单、固定的空间关系。
(3)存储的数据通常为等长记录的数据;
D. 什么是元数据,在gis数据库中它的作用是什么
元数据:描述数据的数据,对数据及信息资源的描述性信息,为数据仓库的发展和使用
从GIS数据库从面来看:元数据可看做 一行行 记录
E. 元数据的作用和意义是什么
元数据(Meta Date),主要记录数据仓库中模型的定义、各层级间的映射关系、监控数据仓库的数据状态及ETL的任务运行状态。一般会通过元数据资料库(Metadata Repository)来统一地存储和管理元数据,其主要目的是使数据仓库的设计、部署、操作和管理能达成协同和一致。
元数据是数据仓库管理系统的重要组成部分,元数据管理是企业级数据仓库中的关键组件,贯穿数据仓库构建的整个过程,直接影响着数据仓库的构建、使用和维护。
构建数据仓库的主要步骤之一是ETL。这时元数据将发挥重要的作用,它定义了源数据系统到数据仓库的映射、数据转换的规则、数据仓库的逻辑结构、数据更新的规则、数据导入历史记录以及装载周期等相关内容。数据抽取和转换的专家以及数据仓库管理员正是通过元数据高效地构建数据仓库。
用户在使用数据仓库时,通过元数据访问数据,明确数据项的含义以及定制报表。
数据仓库的规模及其复杂性离不开正确的元数据管理,包括增加或移除外部数据源,改变数据清洗方法,控制出错的查询以及安排备份等。
元数据可分为技术元数据和业务元数据。技术元数据为开发和管理数据仓库的IT 人员使用,它描述了与数据仓库开发、管理和维护相关的数据,包括数据源信息、数据转换描述、数据仓库模型、数据清洗与更新规则、数据映射和访问权限等。而业务元数据为管理层和业务分析人员服务,从业务角度描述数据,包括商务术语、数据仓库中有什么数据、数据的位置和数据的可用性等,帮助业务人员更好地理解数据仓库中哪些数据是可用的以及如何使用。
由上可见,元数据不仅定义了数据仓库中数据的模式、来源、抽取和转换规则等,而且是整个数据仓库系统运行的基础,元数据把数据仓库系统中各个松散的组件联系起来,组成了一个有机的整体
F. 什么是元数据
元数据的英文名称是“Metadata",它是“关于数据的数据”在地理空间信息中用于描述地理数据集的内容、质量、表示方式、空间参考、管理方式以及数据集的其他特征,它是实现地理空间信息共享的核心标准之一。目前,国际上对空间元数据标准内容进行研究的组织主要有三个,分别是欧洲标准化委员会(CEN/TC287)、美国联邦地理数据委员会(FGDC)和国际标准化组织地理信息/地球信息技术委员会(ISO/TC211)。空间元数据标准内容分两个层次。第一层是目录信息,主要用于对数据集信息进行宏观描述,它适合在数字地球的国家级空间信息交换中心或区域以及全球范围内管理和查询空间信息时使用。第二层是详细信息,用来详细或全面描述地理空间信息的空间元数据标准内容,是数据集生产者在提供空间数据集时必须要提供的信息。
元数据主要有下列几个方面的作用:
(1)用来组织和管理空间信息,并挖掘空间信息资源,这正是数字地球的特点和优点所在。通过它可以在广域网或因特网上准确地识别、定位和访问空间信息。
(2)帮助数据使用者查询所需空间信息。比如,它可以按照不同的地理区间、指定的语言以及具体的时间段来查找空间信息资源。
(3)组织和维护一个机构对数据的投资。
(4)用来建立空间信息的数据目录和数据交换中心。通过数据目录和数据交换中心等提供的空间元数据内容,用户可以共享空间信息、维护数据结果,以及对它们进行优化等。
(5)提供数据转换方面的信息。使用户在获取空间信息的同时便可以得到空间元数据信息。通过空间元数据,人们可以接受并理解空间信息,与自己的空间信息集成在一起,进行不同方面的科学分析和决策。描述空间信息的元数据标准体系内容按照部分、复合元素和数据元素来组织,它们是依次包含关系,前者包含后者,即:后者依次组成前者。具体分为8个基本内容部分和4个引用部分,由12个部分组成,其中标准化内容包括标识信息、数据质量信息、数据集继承信息、空间数据表示信息、空间参照系信息、实体和属性信息、发行信息以及空间元数据参考信息等内容,另外还有4个部分是标准化部分中必须引用的信息,它们为引用信息、时间范围信息、联系信息及地址信息。元数据标准内容体系是通过元数据网络管理系统来实现的,该系统主要由权限验证功能(服务器端验证)、输入和合法性校验功能(客户端校验)、查询功能(服务器端查询)与返回和显示功能(服务器端格式化查询结果并返回,客户端显示)等组成。利用空间元数据网络管理系统作为空间交换站的共享软件可基本上实现空间信息的网络共享。
G. 【第一节】元数据概念及其作用
按照传统的定义,元数据(Metadata)是关于数据的数据,任何文件系统中的数据都分数据与元数据,数据是指普通文件中的实际数据,而元数据指用来描述一个文件的特征的系统数据,诸如访问权限、文件拥有者以及文件数据块的分布信息(inode...)等等。在集群文件系统中,分布信息包括文件在磁盘上的位置以及磁盘在集群中的位置。用户需要操作一个文件必须首先得到它的元数据,才能定位到文件的位置并且得到文件的内容或相关属性。
比如:我们要访问linux上一个文件,我们是不是要知道这个文件的路径,文件名?如下图:
从上面图可以看到,我们我们访问一个路径 /home/hadoop/test
那么这个路径就是这个目录的一个元数据信息,当然目录下面有三个文件,每个文件对应的权限rw,属于哪个用户,组,每个文件大小,创建时间,文件名这些都是这个目录的元数据,而我们真实的数据就是在da.log,deal.py里的数据如下图:
如果我们想知道上面这些表里要查询数据,是不是需要写sql:
select * from tb_ky
那么这样查出来的数据就是保存在此表的真实数据
这张表的元数据也显然可见,那就是
表名,表所在的库,表中的字段名,字段类型,长度,是否为空,用的什么引挚,编码等。
其实说为什么要用元数据,就是元数据能给我们带来哪些作用,这样的问题网上答案太多了,不同的行业有不同的观点,就我们从大数据数据仓库来说吧,一般的公司做数仓时,都会多层架构的搭建,比如普遍的 ODS,DWD DWE DM等这样三四层的结构,那么上一层的数据要依赖与下层,这就可以看到我们的数据从最低层到最高层的有向流动。那么我们元数据就可以做下面的事了:
H. 空间元数据的主要作用
:
帮助数据生产单位有效地管理和维护空间数据,建立数据文档,并确保即使在其主要工作人员离退,也不会失去对数据状况的了解。
提供有关数据生产单位的数据存储、数据分类、内容、质量、数据交换网络及数据销售等方面的信息,便于用户查询检索地理空间数据。
帮助用户了解数据,以便就数据是否能满足要求作出正确判断。
目前,国际上对空间元数据标准内容进行研究的组织主要有三个,分别是欧洲标准化委员会(CEN/TC287)、美国联邦地理数据委员会(FGDC)和国际标准化组织地理信息/地球信息技术委员会(ISO/TC211)。
理方式以及数据集的其他特征。地理空间信息中的元数据(简称空间元数据),通过提供地理空间信息的这些特征资料,来达到实现地理空间信息的有效管理和合理共享的双重目的。对于数据生产者,一方面通过提供空间元数据,及时发布有效的地理空间数据,最大限度地发挥已有地理空间信息的价值,另一方面根据空间元数据的内容有效地管理和维护已有地理空间数据。对于各级的数据交换中心,则根据数据生产者提供的空间元数据,实现地理空间信息的快速检索和准确定位,最终达到数据共享的目的。空间元数据最主要的作用在于对数据用户提供的极大方便。方便数据用户查询检索有效的地理空间数据,了解已有的地理空间数据信息,选择合适的地理空间数据,促使地理空间数据的再利用。
I. 什么是元数据技术
元数据(Metadata)简单地说,就是“关于数据的数据”,它是关于数据质量、状况和其他特性的描述性信息。主要用于描述数据集,也用于描述数据集系列和各个要素及属性。在地理信息领域,主要是指说明地理资料数据集的一些信息,主要包括:数据集编码、数据集名称、资料类别、要素或项目名称、数据集内容关键词、数据起止时间、数据空间范围、比例尺/分辨率、数据表达方式、数据质量状况、数据存储介质、数据存储格式、数据量、数据来源、数据集所使用语种、数据集作者信息、元数据作者信息、数据集存放地点、数据集索取方式,以及数据尺度、数据更新周期和数据空间参考系及坐标等等。
在GIS和土地信息系统中,包含有多源、多时相、多尺度、多分辨率和多种类型的数据。如何组织和管理好这些数据,快速、有效地访问和获得所需的数据,将是一个非常突出的问题。元数据技术即是用来帮助解决这些问题的。
元数据技术内容主要包括元数据的标准、获取、管理及发布技术。