数据结构概念在整个分析师社区中越来越可信,与知识图多年来所做的大致相同。这两种技术都将所有相关数据链接到特定的业务目的,这就是为什么世界上最成功的公司采用这些数据的原因。

亚马逊的知识图保留了其庞大的产品阵列的元数据;谷歌捕获的关于感兴趣的网络实体的详尽列表的数据。鲜为人知的组织定期部署这些机制,从全面的客户视图到制造流程,应有尽有。

数据结构 与知识图运动有着独特的共生关系,因为它们大大简化了从填充这些平台的无数来源中提取数据的过程。反过来,知识图提供了一些基本功能,使数据结构能够实现这一目标。

因此,数据结构被视为协调和集成数据的最成熟手段,这一点非常重要。当以知识图技术为燃料时,这些结构创建最佳方法,将所有类型的数据对齐,以实现任何单一业务目的。

数据集成成熟度

尽管有几种相互竞争的数据结构定义(其中许多取决于传播这些定义的特定供应商),但几乎所有定义都指定了收集、集成、管理数据和共享数据的一致方法,而不管数据类型、格式、技术或位置的差异如何。数据结构被认为是最成熟的数据集成 方式, 因为它们组织了数据质量、数据表示、元数据管理和半结构化、非结构化和结构化数据的交换的治理细节,同时提供了所有数据的单一访问点。它们优于涉及(按成熟度的升序)的替代方法:

  • 孤岛:以单个数据库和应用程序中的数据为特征,思洛存储器需要为需要来自多个来源的信息的每个业务案例编写一个新的应用程序。

  • 主数据管理和数据仓库:尽管这些方法打算支持单一版本的真相,但此功能被跨组织的多个仓库和 MDM 域所破坏。此外,它们的关系技术不适合非结构化数据和机器学习,而不用利用昂贵的数据集市解决特定的业务问题。

  • 数据湖:这些存储库将所有数据并分,而不考虑结构变化,但本质上缺乏可持续的数据质量、元数据管理和可追溯性治理手段

这些图表对于在 访问管理、 数据来源和数据质量方面管理内容至关重要,同时统一了用于描述这些资产的术语。具有数字资产知识图的数据结构受益于后者对组织中每个数据库和应用程序中、跨业务线的内容的了解。这些图形感知存储库了解有关此类数据的一切,包括 dbs 中包含的表、列和数据类型、它们的架构、所有者和它们用于的应用程序、它们在哪些计算机上运行等。这一基本知识是支持数据结构协调和集成数据能力的基础。

前端知识图

作为回报,前端知识图(即 Google、Amazon、客户 360s 和其他任务关键目的的介绍中描述的知识图)受益于数据结构在数据转换方面的能力。这种方法协调数据的主要好处是它对于ETL或ELT的单一 、易于重复的处理。这些整体结构的这一维度对于填充知识图表至关重要,需要各种信息来完善业务功能,例如 LinkedIn 的图表,该图表将世界上大多数劳动力与过去和现在的雇主连接在一起。

事实上,此领域的紧急开发使知识图更易于实现,同时通过实体建模方法加倍努力实现其企业价值。组织只需定义推动其业务的关键实体(医疗保健部门的患者、财务客户等),然后根据时间将它们的所有信息转换为简单的事件对象。此类信息通常包括与患者或客户的互动、其现有历史记录和其他相关因素。这样,所有不同的数据都以统一的形状对齐,支持对数据结构中统一的任何源进行临时分析。这种均匀性也是机器学习功能工程的理想的选择。

手牵手

知识图和数据结构是集成、分析和创建数据驱动技术知情操作的最佳组合。后端数字资产知识图加强数据结构的治理能力。这些综合框架简化了整合努力的转型,以持续提供前端、业务目的知识图和形成具体知识所需的数据种类。它们共同为企业提供来自所有来源的相关信息,以优化数据货币的决策和盈利能力

Comments are closed.