你的Garmin设备显示你的恢复状况不佳,WHOOP应用程序也将你当天的健康状态标记为“红色”,你的静息心率偏高,心率变异性却很低,因此该应用建议你休息。但问题是:你其实并没有感到身体不适。

对于处于生育年龄的女性来说,很有可能是你的可穿戴设备误将黄体期的某些症状解读为过度训练或生病的结果。这是因为这些设备检测到的症状,实际上它们并不真正了解其含义。

让我们来详细分析一下这一现象究竟是如何发生的——从传感器开始,到算法的运作过程,最终找出导致准确率出现差异的原因所在。

目录

月经周期对你的生物体征究竟有何影响

在讨论传感器和算法之前,我们首先需要了解它们实际上是在检测什么。月经周期并不是可穿戴设备收集的数据中的“干扰因素”,而是一个会改变人体生理状态的真正因素,任何与恢复或健康相关的算法都会依赖于这些生理变化。

有三种生理信号能够反映这一变化过程。

静息心率

多项研究通过持续监测可穿戴设备的数据证实,从卵泡期到黄体期,人的静息心率会增加2到7次/分钟。有一项针对91名女性的前瞻性研究观察到,在黄体中期,她们的静息心率比月经期间高出3.8次/分钟。

心率变异性

另一方面,心率变异性会朝相反的方向发生变化。具体来说,一项针对1000多名参与者的元分析表明,在月经周期的卵泡期到黄体期期间,由迷走神经调节的心率变异性会下降。

例如,有研究报告称,在卵泡期,SDNN数值为154毫秒,而在黄体期则降至136毫秒,这意味着心率变异性减少了12%。孕酮是导致这种变化的原因。具体而言,孕酮会激活肾素-血管紧张素系统,增加总血容量,提高心率峰值,并减弱副交感神经的作用。而雌激素则会降低心率(具有负性变时作用),从而增加心率变异性。

因此,在黄体期中期,人们的心率峰值虽然会增加,但心率变异性却会下降。对于那些不知道当前处于月经周期哪个阶段的监测算法来说,这种变化组合往往会被解读为压力、疾病或过度训练的信号。

皮肤温度

在这三种生理指标中,皮肤温度的变化是最被深入研究的。由于孕酮的作用,排卵后基础体温会升高0.3–0.7°C,这一现象已经被人们认识了100多年,也是传统生育监测方法的基础。

我们的Oura戒指所收集的数据也显示,在黄体期期间,皮肤温度通常会升高。而在排卵前不久,由于雌激素的作用导致体温突然下降,皮肤温度也会短暂下降。

关键在于:这些生理指标在每个周期中都会以相同的方式发生变化。如果算法将这些指标分开进行处理,那么其分析结果就会出现错误。

可穿戴设备是如何检测这些生理指标的

PPG传感器及其实际检测功能

可穿戴设备是通过光容积脉搏血氧饱和度监测技术来测量心率和心率变变异性的。这类传感器会发出绿色光来检测心率,或者同时发射红光和红外光来检测SpO2值。光线被血液吸收的程度会受到血液容量的影响,因此当心脏跳动、血液在毛细血管中流动时,从皮肤反射回来的光强会在每次心跳时都有所不同。这种光强的变化就被称为PPG波形。

可穿戴设备会根据PPG波形数据来计算两次心跳之间的间隔时间。虽然测量心率相对简单,只需要统计每分钟的心跳次数即可,但测量心率变异性则需要精确的时间测定,因为这项指标是用来检测连续两次心跳之间时间差值的,因此信号的质量在这里起着至关重要的作用。

传感器在皮肤上的放置位置也会对测量结果产生重要影响。一般来说,像Oura和Ultrahuman这样的手指佩戴设备,所检测到的PPG信号质量要比Apple Watch、Garmin或WHOOP这类手腕佩戴设备更准确。这是因为手指部位的毛细血管密度更高,因此脉搏幅度更大,且受运动干扰的因素也更少。

手环设备通过更为先进的信号处理技术来弥补这一缺陷。但这样做总会付出一定的代价。例如,Oura Ring 4为用户提供了具有自适应配置功能的18路多层波长光敏电阻传感器。

温度传感器:连续检测与点测检测

当前可穿戴设备中使用的温度传感器实际上测量的是皮肤温度,而非核心体温。这类被称为热敏电阻的传感器能够通过检测电阻值的变化来感知温度变化。

虽然皮肤温度与核心体温之间存在关联,但两者并不完全相同。皮肤温度会受到室内温度、天气状况以及皮肤表面血流变化等因素的影响。

即便如此,通过对皮肤温度进行连续性的夜间监测,仍可能比传统的基础体温测量方法获得更准确的信息。在采用生育意识监测法时,人们通常会在每天早晨起床前进行体温测量。如果漏测一次或睡眠质量不佳,都可能会影响检测结果的准确性。

而可穿戴设备则采用了不同的检测方式。通过整夜收集温度数据,这些设备能够识别出长期存在的生理变化趋势,从而减少短期波动对检测结果的影响。

诸如苹果手表8系列及后续版本、Fitbit Sense以及Oura Ring等设备都配备了温度传感器。大多数智能手环监测的是个体基础体温的变化幅度,而非具体的绝对体温值。这种设计使得识别排卵后的体温升高现象变得更加容易。

算法的工作原理

基于日历的检测方法与基于生理数据的检测方法

或许最基础的月经周期检测方式就是通过日历模型来进行的。用户只需输入自己月经开始的日期,应用程序就会计算出平均周期长度,并据此预测未来的可生育期。

Clue、Flo等应用以及苹果早期发布的经期追踪工具都是基于这种原理设计的。这类算法非常简单,完全不需要任何传感器数据的支持。

不过,日历模型检测方法的最大问题在于其准确性。虽然这些方法适用于周期规律性较强的女性群体,但实际上许多女性的生理周期并不如此规律。例如,在检测排卵时间时,相关研究显示,仅使用日历模型进行预测时,平均误差为3.44天。

此外,日历模型仅根据用户输入的日期来预测月经周期各阶段,而基于生理数据的检测方法则会分析体温、心率及心率变异性等传感器数据,从而更准确地判断排卵时间以及周期变化。例如,Oura Ring就是通过监测心率和体温来检测排卵的,其预测误差平均仅为1.26天。

机器学习如何划分周期阶段

机器学习算法并不会使用单一指标来确定用户当前处于月经周期的哪个阶段。相反,它们会分析来自可穿戴设备的多项生理指标数据,这些指标包括皮肤温度、心率、心率变异性,而在某些情况下还会包括皮肤电活动数据。

随着时间的推移,机器学习算法能够弄清楚哪些周期阶段与特定的生理变化相对应。例如:

  • 黄体期的特征是皮肤温度上升以及心血管指标发生变化。

  • 排卵会导致体温和心率模式出现变化。

  • 月经期也会表现出独特的生理变化组合。

  • 卵泡期通常是最难识别的阶段,因为其生物特征并不明显,且这些特征往往与其他周期阶段的特征重叠。

一项发表在2025年的研究中指出,机器学习算法能够有效地识别月经期、排卵期和黄体期。不过,当将卵泡期也纳入分析范围时,检测结果的准确性会有所下降。

正因如此,现代的周期追踪应用已经变得相当复杂,它们不再仅仅依赖体温这一指标。每当设备捕捉到更多的生理信号时,识别月经周期各阶段的能力就会进一步提升。

还有一些其他技术也在不断发展,比如Vivoo FlowPad,这类设备试图直接收集与月经健康相关的数据,而不是通过可穿戴传感器来间接推算这些数据。

为何会出现准确性差异

可穿戴设备的局限性在于,许多与月经周期阶段相关的生理指标其实并不仅仅出现在月经周期中。

以心率偏高、心率变异性降低以及皮肤温度上升这些指标为例,这些变化确实可能发生在黄体期,但同时也可能由其他因素引起,比如疾病、睡眠不足、压力、饮酒,甚至时差反应等。

此外,个体差异也是影响月经周期追踪准确性的另一个因素。有些女性在月经周期中会出现体温和心率变异性等方面的显著变化,而另一些女性的这些指标则变化很小。

正因为如此,大多数月经周期追踪算法都需要根据个人的生理数据来建立基准值,而不是使用群体平均数据。也就是说,女性提供的关于自己月经周期的数据越多,算法就越能准确地识别出她的个人生理规律。

实际应用中的周期感知算法

直到2025年,大多数可穿戴设备仍将周期追踪与恢复状态视为两个相互独立的概念。Oura成为首家将这两者联系起来的大型企业。

它更新的算法会考虑在黄体期常见的静息心率升高、心率变异性降低以及体温升高的现象。该算法不会自动降低用户的“准备状态得分”,而是会判断这些变化是否属于月经周期中的正常现象。

这一设计有效减少了月经周期后半段出现错误低的“恢复状态得分”的情况。2026年,Oura进一步开发了专门针对周期、生育能力、怀孕及更年期等主题的人工智能模型。

WHOOP则采用了另一种方法:它通过名为“心血管幅度”的指标来检测整个周期中心率及心率变异性的变化。这种测量方式并不关注周期的各个具体阶段,而是着眼于激素变化所带来的整体生理影响。

Natural Cycles成为首个获得FDA批准可用于避孕目的的生育应用程序。该应用借助用户佩戴的可穿戴设备(如Apple Watch、Oura Ring、Garmin或自家开发的NC Band)来收集用户的体温数据。

Garmin、Fitbit和Samsung虽然也能追踪月经周期,但这些数据与它们所使用的恢复状态评估指标之间基本上是相互独立的。

总结

归根结底,问题在于可穿戴设备所收集的数据与那些被设计用来分析恢复状态的算法之间存在不匹配之处。

PPG传感器和体温传感器能够让可穿戴设备准确检测到月经周期中发生的各种变化,而且这些传感器的性能也相当不错。多参数机器学习技术则有助于对周期的各个阶段进行可靠的分类,尤其是排卵期发生的变化。

然而问题在于,许多恢复状态评估算法都是基于以男性样本为数据基础进行训练的,在这些数据中,激素周期中的变化被视为“干扰因素”。因此这些算法无法区分黄体期的生理状态与疾病初期的症状。传感器本身无法解决这个问题,只有通过改进算法设计才能找到解决办法。

对于那些利用可穿戴设备API开发健康应用的人来说,我们已经能够获取包含当前周期阶段信息的健康数据。Oura通过特定的接口提供这些数据,Apple则将其整合到了HealthKit的HKCategoryTypeIdentifier中,WHOOP也将这些数据纳入了它的恢复状态评估模型中。

然而问题在于,这些平台使用不同的API、数据模型和集成技术来获取数据。虽然Oura、Apple HealthKit和WHOOP提供的健康指标可能相似,但在采样频率、预处理方法以及指标定义等方面仍可能存在差异,这就使得开发出能在不同平台上一致运行的算法变得十分困难。

这种缺乏标准化的问题也导致了训练数据方面的困扰。由于各种平台存储和处理数据的方式不同,Oura、Apple Watch和WHOOP收集的数据并不总能被轻松地合并在一起。因此,研究人员和开发者在进行模型训练之前,需要花费额外的精力来整理和规范这些数据。

<目前虽然已经配备了各种传感器,相关模型也在不断得到改进,但现有的应用程序接口仍然存在碎片化的问题,而且训练数据的缺乏也是一个客观存在的现实。这些正是当前需要重点解决的关键问题。

Comments are closed.