组织数据结构的最佳方法

数据中心、数据湖和数据仓库之间的区别以及如何在您的组织中有效地使用它们。

数据中心、数据的湖泊而且数据仓库对于数据和分析领导者来说,这些都是支持日益复杂、多样化和分布式数据工作负载的重要投资领域。高德纳的研究发现,57%的数据和分析领导者正在投资于数据仓库,46%正在使用数据中心,39%正在使用数据湖。

“数据中心、数据湖和数据仓库不是可互换的替代品”

虽然数据和分析领域的领导者对这些术语很熟悉,也从技术提供商那里听说过它们,但许多人并不理解其中的区别。“数据中心、数据湖和数据仓库不是可互换的替代品,”他说泰德·弗里德曼, Gartner杰出副总裁分析师。

Friedman补充说,数据和分析领导者必须理解这三种类型的数据结构的目的,以及它们在现代数据管理基础设施中共同扮演的角色,以最好地支持特定的业务需求。

数据仓库、数据湖和数据中心

数据仓库存储众所周知的结构化数据。它们支持预定义的和可重复的分析需求,可以跨组织中的许多用户进行扩展。数据仓库适合复杂的查询、高级并发访问和严格的性能要求。

数据湖收集未经细化的数据(即原始形式的数据,具有有限的转换和质量保证)和从各种源系统中捕获的事件。数据湖通常支持数据准备、探索性分析和数据科学活动。

数据枢纽是概念上、逻辑上和物理上的“枢纽”,用于在中央管理的(即广泛使用的)数据和本地管理的数据(通常是一次性使用的数据)之间进行语义中介(以支持治理和共享数据)。它们支持数据的无缝流动和管理。

Gartner展示了数据仓库、数据湖和数据中心都是重要的投资领域,以及它们是如何在数据和分析工作中使用的。

认识到它们在重点上的不同

数据仓库和数据湖有一个共同的焦点——支持组织的分析需求。相比之下,数据中心并不关注数据的分析使用。它们不会长时间存储详细的数据。

它们支持数据共享,并对跨组织的各种应用程序和流程的数据流动应用治理控制。例如,数据和分析领导者可以使用数据中心来改进从业务应用程序到数据仓库或数据湖的数据交付。

这三种结构最好组合使用

虽然理解它们在体系结构中的不同角色很重要,但数据和分析领导者必须认识到这些结构在组合使用时给组织带来的价值。

例如,可以通过数据中心将数据交付到分析结构(数据仓库和数据湖),数据中心充当中介和治理点。越来越多的组织正在应用数据中心架构作为跨业务共享和治理所有关键数据的焦点;例如,用更集中的体系结构取代点到点集成,以便在各种操作应用程序和流程之间同步关键数据。

弗里德曼说:“数据仓库、数据湖和数据中心的选择不是一个‘或’。“现代数据管理基础设施需要是动态的——随着时间的推移发展架构模式,启用新的连接并支持不同的用例。”

高德纳数据与分析峰会

参加全球最重要的数据和分析高管聚会,与Gartner专家一起分享技术、业务等方面的宝贵见解。

Gartner Terms of Use 和隐私政策。< / > "> 登录到您的帐户 访问您的研究和工具

" class="eloqua-text"> 登录到您的帐户 访问您的研究和工具" class="optin-text">