① 什么是数据湖
什么是数据湖数据湖是一个集中式存储库,是一种以原生格式存储各种大型原始数据集的数据库,它允许以任意规模存储所有结构化和非结构化数据。数据湖的概念最初是由大数据厂商提出的,表面上看,数据都是承载在基于可向外扩展的HDFS廉价存储硬件之上的。
什么是数据湖
数据湖的一部分价值是把不同种类的数据汇聚到一起,另一部分价值是不需要预定义的模型就能进行数据分析。
在商业智能和数据仓库还没有被淘汰的今天,大数据分析和大数据湖正在向更多类型的实时智能服务发展,这些实时的智能服务可以支持实时的决策制定。
使用数据湖能够在更短的时间内从更多来源利用更多数据,并使用户能够以不同方式协同处理和分析数据,从而做出更好、更快的决策。
② 什么是数据湖泊
数据湖或hub的概念最初是由大数据厂商提出的,表面上看,数据都是承载在基于可向外扩展的HDFS廉价存储硬件之上的。但数据量越大,越需要各种不同种类的存储。最终,所有的企业数据都可以被认为是大数据,但并不是所有的企业数据都是适合存放在廉价的HDFS集群之上的。
数据湖或hub的概念最初是由大数据厂商提出的,表面上看,数据都是承载在基于可向外扩展的HDFS廉价存储硬件之上的。但数据量越大,越需要各种不同种类的存储。最终,所有的企业数据都可以被认为是大数据,但并不是所有的企业数据都是适合存放在廉价的HDFS集群之上的。
③ 数据管理,数据治理,数据中心,数据中台,数据湖都是什么意思,有什么关系呢
1. 数据治理与数据管理:治理是管理的管理。管理需遵循一定的标准规范体系、流程和组织角色分工,这些由数据治理定义。管理的执行依据是治理规范体系。
2. 数据中台与数据湖:数据湖通常是云服务商提出的概念,指企业结构化和非结构化数据均可存储于服务商处。数据湖即大规模存储设施,数据存储后不立即清洗加工,通过开放接口提供查询、计算和流处理等功能,方便用户使用存储的数据。
3. 数据中心:数据中心原在BI系统应用中常见,目前特指IT基础设施,如大型云数据机房。在BI系统或数据中台中使用较少,偏重于IT硬件基础设施层面。
④ 数据湖是什么意思
数据湖(DataLake)是一个集中式存储库,一个以原生格式存储各种大规模原始数据集的数据库,它允许以任何规模存储所有结构化和非结构化数据。数据湖的概念最初是由大数据厂商提出的。从表面上看,数据被加载到基于HDFS的廉价存储硬件上,这些硬件可以扩展。