大数据

使用 Apache OpenNLP 探索 NLP 概念

介绍 在查看了许多基于Java/JVM的 NLP 库后,我决定选择Apache … Read More

完整的阿帕奇火花集合 [教程和文章]

在本期”最佳 DZone”中,我们汇编了有关数据处理的最 … Read More

探索 Apache NiFi 1.10:参数和无状态引擎

Apache NiFi 现已在 1.10 中提供! https://issues … Read More

主机代管与内部数据中心:什么对您的业务更好?

业务存储和管理是企业日常运营不可或缺的一部分。随着业务的增长,必须解决数据存储问 … Read More

通过委派增强春季数据存储库

我最近写了几篇关于科特林代表团的帖子。在此过程中,我认识到了将其应用于 Spri … Read More

弹性搜索 = 6.4.3

弹性 – 6.4.3 使用弹性工作很有趣。只需使用查询字符串 URL … Read More

万亿级消息背后: 小米消息队列的实践

目录 业务背景 架构与关键问题 性能与资源优化 平台化效率 小米消息中间件的规划 … Read More

挑重点,详解华为最新 “一奖两组”

继开源GaussDB,成立鲲鹏智能数据产业联盟数据库产业推进组等之后,华为围绕数 … Read More

完整的数据科学LinkedIn概况指南

为什么数据科学家应该使用LinkedIn 迄今为止,全世界注册的LinkedIn … Read More

阿帕奇点火:RDBMS集成

场景 在上一篇文章中,我们创建了一个分区缓存,并开发了一个基本的网格缓存框架。在 … Read More

变异距离

如果您有两个序列,一个是另一个序列的排列,如何测量两个序列之间的距离? 这篇文章 … Read More

合理建立Hadoop数据库的7个步骤

数据湖的概念起源于大数据的出现——且数据已成为企业的核心 … Read More

如何可视化数据组合

图表最常见的用途之一是说明部分到整体的关系,又名。”数据组合&#82 … Read More

牛奶吧:构建数据驱动型文化

人员 • 分析师 • 数据 在旧金山的JOIN数据会议上,我们的社区领导布雷克· … Read More

云徙助力良品铺子「双11」:成为5.6亿背后的技术力量

每逢双十一时节,品牌的种草之心被推到顶峰。在密集的信息交汇中,消费者希望获取有价 … Read More

数据科学数学和统计学的完整指南

正如乔希·威尔斯曾经说过的 “数据科学家比任何程序员都更善于统计,也 … Read More

大数据是个技术,数据库才是它最好的产品形态

星环科技(以下简称:星环)的定位是大数据基础软件公司,而非数据库公司,却在数据库 … Read More

在裸机云上运行大数据分析

大数据分析可以定义为用于处理复杂数据集以发现市场趋势、相关性和隐藏数据模式的技术 … Read More

数据虚拟化 – 数据湖的演变

数据湖的诞生 以关系数据库技术为中心的传统数据中心理念正在迅速发展。 大数据的采 … Read More

109 数据科学面试问答

准备面试并不容易。对于您将被问到的数据科学面试问题,存在很大的不确定性。不管你有 … Read More