组织数据结构的最佳方法

数据中心、数据湖和数据仓库之间的区别,以及如何在组织中有效地使用它们。

数据中心、数据的湖泊而且数据仓库这些都是数据和分析领导者投资的重要领域,以支持日益复杂、多样化和分布式的数据工作负载。Gartner的研究发现,57%的数据和分析领导者正在投资数据仓库,46%在使用数据中心,39%在使用数据湖。

“数据中心、数据湖和数据仓库不是可互换的替代品”

虽然数据和分析领域的领导者对这些术语很熟悉,也从技术提供商那里听说过它们,但许多人并不理解它们之间的区别。“数据中心、数据湖和数据仓库不是可互换的替代品,”他说泰德·弗里德曼,尊敬的Gartner副总裁分析师。

Friedman补充说,数据和分析领导者必须了解这三种数据结构的目的,以及它们在现代数据管理基础设施中可以共同扮演的角色,以最好地支持特定的业务需求。

数据仓库、数据湖、数据中心

数据仓库存储众所周知的结构化数据。它们支持预定义的和可重复的分析需求,这些分析需求可以扩展到组织中的许多用户。数据仓库适合于复杂的查询、高级别的并发访问和严格的性能要求。

数据湖收集未精炼的数据(即原始形式的数据,具有有限的转换和质量保证)和从各种源系统中捕获的事件。数据湖通常支持数据准备、探索性分析和数据科学活动。

数据中心是概念上、逻辑上和物理上的“中心”,用于在集中管理(即广泛使用)和本地管理的数据(通常是一次性数据)之间协调语义(以支持治理和共享数据)。它们实现了数据的无缝流和治理。

Gartner展示了数据仓库、数据湖和数据中心都是重要的投资领域,以及它们是如何用于数据和分析工作的。

认识到它们的焦点是如何不同的

数据仓库和数据湖有一个共同的焦点——支持组织的分析需求。相比之下,数据中心并不专注于数据的分析使用。它们不长期存储详细数据。

它们支持数据共享,并对跨组织的各种应用程序和流程流动的数据应用治理控制。例如,数据和分析主管可以使用数据中心来改进数据表单业务应用程序到数据仓库或数据湖的交付。

这三种结构最好结合使用

虽然理解它们在架构中的不同角色很重要,但数据和分析领导者必须认识到,当组合使用这些结构时,它们给组织带来的价值。

例如,可以通过数据中心将数据交付给分析结构(数据仓库和数据湖),数据中心充当中介和治理点。越来越多的组织正在应用数据中心架构作为跨业务共享和治理所有关键数据的焦点;例如,将点对点集成替换为更专注于在各种操作应用程序和流程之间同步关键数据的体系结构。

“数据仓库、数据湖和数据中心的选择不是一个‘或者’,”Friedman说。“现代数据管理基础设施需要是动态的——随着时间的推移演变架构模式,支持新的连接并支持不同的用例。”

高德纳数据与分析峰会

加入世界上最重要的数据和分析高管的聚会,与Gartner专家一起分享技术、商业等方面的宝贵见解。

Gartner Terms of- Use and 隐私策略。< / > "> 登录您的账户 访问您的研究和工具" class="eloqua-text"> 登录您的账户 " class="optin-text">