大数据

fsimage 元数据的 hdfs 离线分析

概述 hdfs 是 hadoop 的一部分, 它有一个命令来下载当前的命名代码快 … Read More

卡夫卡春靴教程

apache 卡卡卡是一个分布式流媒体平台, 具有发布和订阅记录流、以容错方式存 … Read More

成为数据驱动型企业意味着什么, 如何成为一个企业

在当今的数字经济中, 人们普遍认为, 企业必须成为数据驱动型企业, 以提高企业绩 … Read More

[视频]python 编程简介

搜索分布式一致性原理分析和数据, 第1部分

前两篇文章 (这里和这里) 描述了 es 集群的组成、主选举算法、主更新元过程, … Read More

搜索分布式一致性原则分析: 元数据

在上一篇文章中, 我们讨论了群集组合、节点发现、主选择、错误检测、群集缩放等。本 … Read More

什么是数据验证?

数据验证是一种检查数据准确性和质量的方法, 通常在导入和处理之前执行。它也可以被 … Read More

数据湖与数据仓库

数据湖和数据仓库是业务分析的关键技术, 但两者之间的差异可能令人困惑。他们有什么 … Read More

非结构化数据是一个 oxymoron

严格地说, “非结构化数据” 在术语上是矛盾的。数据必须 … Read More

简单的超级: 超级套装

项目简介 本文是关于安装和配置超级酷和令人钦佩的 d3 图表呈现从您的数据库直接 … Read More

差距统计的可视化介绍

我们以前已经看到了如何实现 k 手段。但是, 该算法的结果在很大程度上取决于参数 … Read More

数据科学家和数据分析人员所需的技能 [视频]

在本视频中, 我们将讨论数据分析和数据科学的概念, 成为数据分析师或数据科学家所 … Read More

15行以下代码中的流推文 + 一些交互式数据可视化

介绍: 在本教程中, 我将向您展示使用 twitter 的 api 从 twit … Read More

什么是数据分析?

数据分析是检查现有源中的数据并汇总有关该数据的信息的过程。您可以分析数据, 以确 … Read More

识别数据仓库在暂存和加载到 dwh 过程中的质量问题

这是关于在每个 dwh 阶段识别数据完整性问题系列中的第四个博客。 在研究数据暂 … Read More

搜索分布式一致性原理分析, 第1部分

弹性搜索 (es) 是最常见的开源分布式搜索引擎。它基于 lucene (一个信 … Read More

使用 docker 撰写在单次单击中安装弹性堆栈

弹性团队做了一个伟大的工作包装成 docker 图像的各种弹性堆栈压实器。 然而 … Read More

创建数据策略

什么是数据策略? 想象一下这种熟悉的情况: 作为公司的分析师, 你的任务是吸收组 … Read More

使用物化视图来处理涡轮充电 bi, 而不是专有中间件

在商业智能 (bi) 领域, 查询性能一直是一个问题, 许多 bi 用户会很乐意 … Read More

什么是数据孤岛?

数据筒仓是组织中与组织的其他部分隔离且无法访问的信息集合。删除数据孤岛可以帮助您 … Read More