Chronosphere是两位前尤伯工程师,马丁·毛(CEO)和罗布·斯基林顿(CTO)的创意。

我最近和毛马丁谈过,你可以听到下面的采访全文。

在 Uber 工作并采用 Kubernetes 和云原生体系结构时,两人意识到没有工具可以处理和存储此类设置生成的所有监视数据,更不用说使用它做任何有用的操作了。通过这一实现,他们构建了自己的开源解决方案(称为M3)并将其扩展为最大的监控系统之一。

您可能还喜欢:数字颠覆者:Airbnb、特斯拉和优步如何利用软件创新来转变整个行业

2019年,两人决定离开优步,专注于建设Chronosphere,该公司使企业能够利用M3。

M3 与其他监控解决方案有何不同

虽然有许多监视解决方案声称它们是企业级的,并且能够处理 1000 万个时间序列数据,但许多解决方案在满足大型组织的数据存储要求方面却不足。随着技术堆栈变得越来越复杂,即使这还不够,这是 M3 的用处,它能够处理 10s 的 10 亿个时间序列数据。

M3 也是可靠的。虽然大多数其他监控解决方案在单个云提供商上运行,但 Chronosphere 跨多个区域和多个云提供商运行,以获得最佳可靠性。

M3 如何处理这么多数据?

Uber 中实施的第一个监控解决方案使用了现成的开源技术,但这些技术不是为时间序列用例量身定制的。团队从零开始构建一些东西,因为没有任何可用的东西可以胜任这项任务。

团队从底层存储引擎的新时间序列数据库开始,然后分层高度可靠的引入管道和能够查询这些数十亿个时间序列数据的可扩展查询引擎。

如果不深入到代码中,很难确切知道M3是如何实现这一目的的。在初始检查时,这可能是由于基于组件的体系结构,M3 分为四个组件

  • 分布式时间序列数据库,,M3协调员,允许M3DB作为普罗米西斯的长期存储。
  • 分布式查询引擎M3Query,具有 PromQL 和石墨(M3QL 即将推出)的本机支持。
  • 聚合层 M3Aggregor 作为专用指标聚合器/向下采样器运行,允许以不同分辨率以不同的保留处存储指标。
  • 您可以使用Docker或手动在单节点模式下启动 M3,并使用 Kubernetes(或类似的业务流程协调器)进行群集。

    运行后,您可以通过 REST API 或通过 gRPC 终结点与 M3 进行交互。

    适合企业

    开箱即用,M3 提供裸骨监控要点,如用于跟踪时间序列数据的仪表板和图形。还有一个警报引擎,它根据配置的阈值通知,并联系到标准通知引擎。

    Chronosphere 采用 M3 并添加了大量专有企业用例功能,包括:

    • 映射到组织结构的多租户控件 – 添加资源分配以提高稳定性,并使团队能够忽略来自其他方的指标。
    • 可视化、警报引擎和分析工具,使数据有用。
    • 跨多个云提供商完全托管、运行和管理,实现终极可靠性。
    • 一键式代理部署 – 外出并发现每个终结点指标并自动引入它们。
    • 基于终结点指标的预生成仪表板。
    • 异常检测 – 在后台运行,并根据历史数据自动生成警报阈值。非常适合在黑色星期五等事件中遇到异常流量的电子商务企业。

    1100万美元的初创公司的下一步是什么?

    Chronosphere 的增长最初是启动的,因为团队已经拥有 M3,人们正在使用它,从而加快了他们上市的时间。因此,他们得以通过A系列基金筹集1 100万美元。

    随着越来越多的企业迁移到Kubernetes和容器等技术,Chronosphere正在寻求介入并缓解两个主要的痛点:不可靠和规模成本。

    即使在 Uber 时代,M3 也用于监控组织在多个城市的所有产品,帮助实时监控不仅技术,而且业务运营方面,因此对于其他企业来说,也有很大的潜力企业在那里。

    虽然该团队没有真正验证Chronosphere的使用范围,但它目前在《福布斯》全球2000年15强中仍在生产(他们知道)

    更多信息

    计时赛团队将在欧洲库贝康,加上他们今年将在纽约和西雅图举行一些DevOps日。敬请关注他们的社交频道了解更多信息。

    进一步阅读

    可观察性与监视

    10分钟内的库伯内特斯:完整指南

    库贝内特斯的工作原理

Comments are closed.