大数据

程序员 12 小时惊魂记:凌晨迁移数据出大事故!

有一个读者问我:你认为一个程序员具备什么样的能力,才算得上是厉害的程序员?我答: … Read More

哈多普怎么了?你现在该怎么办?

Apache Hadoop 于 2006 年出现在 IT 舞台上,承诺为组织提供 … Read More

Apache Flume 和数据管道

什么是阿帕奇流卢姆? Apache Flume 是一种高效、分布式、可靠且容错的 … Read More

支付中台的几个面向:支付业务、资金核算、面向风控等切面

手哥架构宝典之支付系统1.0发布后,很多架构师朋友表示受益匪浅,询问支付系统2. … Read More

网易云音乐热评的规律,44万条数据告诉你

本文转载自凹凸数读 网易云的每日推荐里藏着你听过的歌,你听过的歌里藏着你的故事。 … Read More

PostgreSQL:针对新手用户的简单 C 扩展开发(和性能优势)

PostgreSQL 的一大特点是它的可扩展性。我的同事和高级PostgreSQ … Read More

这七个非技术领域称大数据为”大爸爸”

在”大数据:将改变我们生活、工作和思考方式的革命”中,维 … Read More

Hadoop YARN:调度性能优化实践

背景 YARN作为Hadoop的资源管理系统,负责Hadoop集群上计算资源的管 … Read More

DLP:它是什么,为什么你需要它

什么是 DLP? 数据丢失防护 (DLP) 是指用于防止数据丢失或泄漏的策略和工 … Read More

两个世界中的精华:数据科学和数学

数学不是关于数字、方程、计算或算法的:它是关于理解的。• 威廉·保罗·瑟斯顿 有 … Read More

干货: 五种常见数据复制技术详解

根据IDC的相关数据统计,2018年全球的数据复制存储市场规模就已经超过了500 … Read More

使用 Apache Kafka 的实时流处理第 4 部分:用例

在前几篇文章中,我们已经在理解卡夫卡和卡夫卡-流中使用的基本术语方面有所建言。在 … Read More

斯托内公司概述

在硅谷的 IT 新闻之旅中,我有机会与StorONE的首席执行官兼创始人Gal … Read More

熊猫数据帧函数(行和列操作)

在我的第一篇文章中,我给出了一些函数的教程,这些函数将帮助您使用 Pandas … Read More

元数据管理成功需要有效的活动元数据

随着当今数据不断移动,自动化数据管理战略对于实现运营目标和建立竞争优势至关重要。 … Read More

名声、困难和有用性

皮埃尔·费马最出名的是两个定理,被称为他的”最后”定理和 … Read More

使用 Apache Kafka 第 1 部分进行实时流处理

如今,随着物联网和智能设备的兴起,我们以前所未有的速度生成数据。使用分布式计算, … Read More

公司概述: iX 系统

我有机会会见了布雷特戴维斯,执行副总裁销售和营销,摩根利特伍德,产品管理,和克里 … Read More

上万条数据撕开微博热搜的真相!

作者:徐麟,某互联网公司数据分析狮,个人公众号数据森麟(id:shujusenl … Read More

Salesforce收购Tableau意味着什么?

在客户关系管理软件巨头Salesforce宣布收购商业智能工具Tableau后不 … Read More