为了了解大数据的当前和未来状况, 我们与来自28个组织的 31名 it 高管进行了交谈。我们问他们: “你认为什么是成功的大数据计划的最重要因素?”
使用案例
- 选择正确的项目–一个明确定义的问题, 这是一个痛点。从小开始, 简单。它需要规划和组织的支持以及高管的赞助。这就需要通过新的政策和程序进行文化变革。
- 根据公司和项目的规模, 有必要制定计划。这个计划不一定要从一开始就完美;它可以通过一个试点项目进行细化。然而, 在启动大数据计划之前, 有必要定义: 1) 大数据技术触及的项目。2) 具有关键能力的关键人物。3) 时间范围。4) 成功因素/指标, 以检查的过程中, 以确定项目是否在轨道上 (仍然有用)。5) 正确的工具来接收、转换和分析数据, 并最终将结果可视化。该工具还应与各种其他开源和广泛使用的数据分析和数据可视化工具无缝集成。
- 收集他们需要的数据, 并确定他们在数据中的价值。公司不知道他们想用 ai 做什么。定义他们试图解决的业务问题是转型的。让他们看看自己的业务数据, 以及他们拥有的数据中的价值主张在哪里。他们用这些数据做出了什么决定?ml 依赖于可以自动做出的决策的统计信息。
- 任何大数据计划都应该考虑以下因素: 1) 你想推动哪些业务决策?2) 哪些技术和分析方法将有助于实现这些决定?3) 您计划如何实施从大数据中获得的见解?4) 你要跟上的质量尺寸是什么?5) 项目团队中的人员需要什么样的技能?
- 从组织上讲, 必须有一套明确的目标和实现这些目标的任务。这似乎很明显, 也不是大数据举措所独有的, 但往往缺失。 从技术上讲, 使用多种不同的工具和数据模型查看数据的灵活性非常重要。大多数重要的应用程序都需要多个数据模型。即使一开始你似乎可以用一个模型 (如关系表) 做所有的事情, 你也经常会发现在项目中期有一个新的要求、机会或工具, 可以更好地使用不同的模型。对数据源进行清查和评估数据质量也是至关重要的。重要数据通常分布在多个孤岛上, 因此互操作性和数据转换是成功项目的关键部分。
数据
- 最重要的元素是将数据从应用程序获取到处理它的位置
客户有许多不同的数据源–很难维护主数据引用, 而且您最终会得到大量的重复。主数据管理 (mdm) 问题是可以应用于其余数据的上下文。它是有大数据的 ai/ml 的基石。弥合筛选数据的差距, 使科学家和分析师更加有效。
你想完成什么?
工具
- 在过去的五年里, 我们一直在将数据输入数据湖。现在我们看到需要从我们的数据中获得更好的见解和结果。预测分析, ml, ai, 更深入的模式匹配。关联和查找数据湖中的数据模式。增强数据湖中的分析数据。第一种方法是使用图形来计算新信息的能力。将这些点与新的数据集连接。ml 更强大, 因为我们现在能够更快地分析更多的数据。内置的 ml 内的图形使我们能够看到医生/病人是如何形成一个社区。预测最好通过图形本身来解决
它能够提供证据, 因为它更容易看到连接和路径。
其他
- 把操作的一侧弄好。您需要能够可靠地运行解决方案以满足业务需求。我们专注于使用活动应用程序操作大数据。应用程序始终处于打开状态, 我们对操作有纪律。
- 在数据方面取得成功的最佳做法是什么?五件事: 1) 文化–改变事物, 拥有数据驱动的文化。让企业中的执行赞助商利用数据进行创新。其中一个有用的工具是跨公司数据和分析社区, 用于共享项目、见解、方法和数据。2) 如何围绕收集、创建、摄入、管理、使用来收集、创建、接收、获取见解。所需的各类技能。集中式-数据工程非常专注于构建数据资产。分析和科学家分散与业务一致。3) 如何在敏捷、精益的世界中构建路线图。确定两年战略举措。管理风险, 物联网, 收集/使用客户数据。收集更多数据, 更好地分析, 获取洞察并将其集成到业务流程系统中。4) 坚持寻找见解并将其投入生产。它们会影响哪些业务流程?我们可以做出哪些预测来帮助客户?如何集成到业务流程或系统中。5) 正确调整数据治理的大小。希望超级用户能够访问大量数据。相反, 您不希望高级用户不适当地访问和使用数据。审核如何查找洞察、数据的血统、以这种方式适当同意使用数据。
- 在过去五年中, 从构建数据湖中获得预期设置-很容易获得数据, 但我们如何获得价值呢?有多种挑战。大多数人都不容易使用该系统。只有牧师, 软件工程师, 可以进入数据湖。其次, 数据往往处于原始状态, 诚信没有保障, 治理也不到位 “
重置对数据湖和大数据之旅的期望。您可以采取的后续步骤-继续使用传统的数据仓库、数据集市方法。如果在云中有不同的选项, 或者您可以查看数据即服务的理念。以思维的速度自助。灵活、灵活, 提供自助服务体验。
以下是我们与谁交谈:
- cheryl martin, v. p. 研究首席数据科学家, areion
- 亚当·斯密, 首席运营官,自动化洞察
- amy o ‘ connor, cloudera首席数据和信息官
- colin britton, devo首席战略官
- oj ngo, 首席技术官, dh2i 联合创始人
- 艾伦·韦因图布首席技术官办公室, dremio
- dennis duckworth,动物区产品营销总监
- nikita ivanov, gridgain systems创始人兼首席技术官
- tom zawacki, infugroup首席数字官
- ramesh menon, infoworks产品副总裁
- ben slate, instaclustr首席产品官
- 杰夫·弗里德, intersystems产品管理总监
- bob hollander, intervision服务与业务发展高级副总裁
- ilya pukko, jitterbit首席建筑师
- rosaria silipo, 首席数据科学家和tobias koetter, 大数据经理兼柏林办事处主任, knime
- bill peterson, v. p. 工业解决方案, mapr
- 杰夫·希利, vertica 产品营销,微焦点
- 德里克·史密斯, 首席技术官和联合创始人,纳韦戈首席执行官凯蒂·霍夫斯
- michael lafleur,普罗尼解决方案架构全球主管
- stephen blum, cto, pubnub
- scott parker, sinequa产品营销总监
- 克拉克·帕特森, 产品营销主管,流线型
- 鲍勃·夏娃, tibco高级董事
- 徐宇, 创始人兼首席执行官, 托德·布拉什卡, 首席技术官,虎格图
- bala venkatrao, 产品 v. p., unravel
- madhup mishra,产品营销副总裁,alex gorelik, 创始人兼首席技术官,水线数据