基于熵测量的心肺运动试验中呼吸参数可预测性研究:趋势校正与参数优化的重要性

【字体: 时间:2025年09月30日 来源:Physiological Reports 1.9

编辑推荐:

  本文系统探讨了熵测量(ApEn/SampEn)在心肺运动试验(CPET)中评估呼吸模式可预测性的应用,创新性提出使用LOESS0.75残差法校正运动数据趋势,揭示了呼吸周期数(N)和容差系数(r)对熵值的显著影响,为客观诊断呼吸功能障碍(DB)提供了重要方法论支撑。

  

1 引言

呼吸功能障碍(DB)表现为异常呼吸模式,伴随相应症状且无器质性病因,在SARS-CoV-2疫情期间备受关注,被认为与呼吸困难等症状密切相关。DB类型包括过度通气和 erratic breathing(不规则呼吸),后者以潮气量(VT)大幅波动为特征。心肺运动试验(CPET)是评估运动受限主要原因的重要工具,在COVID-19疫情中被广泛用于调查SARS-CoV-2感染后不明原因呼吸困难,并用于描述DB模式如过度通气和 erratic breathing。
尽管识别不规则呼吸模式具有临床意义,但目前方法主要依赖主观评估,通过视觉解读未过滤图表进行判断,这种主观性受到批评。开发客观、可重复的DB标志物有助于通过建立规范值、确定诊断截断值以及评估DB模式与症状之间的关联来增强诊断信心。
最近评估了使用局部加权散点平滑(LOESS0.75)的方法,表明其能够高精度、低偏倚地测量运动期间呼吸参数的趋势值周围离散度。位置度量(如均值)和离散度量(如标准差和方差)是描述数据集的一种方式,另一种描述DB的方式可能是使用基于熵测量的规律性统计,其能够评估时间序列中潮气量和呼吸频率的不可预测性。规律性统计和位置及离散度量均可从未过滤的逐周期数据中获得,其中一个呼吸周期代表一个数据点。
呼吸参数可预测性的概念对于DB的客观描述具有潜在意义,可作为位置和离散度量以及图表主观分析的补充。在此背景下,一些研究人员最近使用未经趋势校正的熵测量来描述运动期间的DB,显示出区分正常与异常呼吸模式的潜在诊断能力。然而,熵的概念依赖于复杂的数学计算,许多不同参数可能影响其正确解释。
本文旨在:
  1. 1.
    展示在报告规律性统计时,报告基础数据集的离散度量(更具体地说是标准差)的重要性。
  2. 2.
    展示运动期间趋势对SampEn和ApEn值的影响,并提供在使用含趋势数据时计算SampEn和ApEn的解决方案。
  3. 3.
    解释分析的呼吸周期数对SampEn和ApEn值的影响,以及为何报告每位患者分析的呼吸周期数很重要。
  4. 4.
    解释用于计算容差区间“r”的系数对SampEn和ApEn值的影响,以及为何报告该系数很重要。

2 材料与方法

2.1 熵测量

熵测量是一种使用非线性动力学分析或规律性统计的数学方法,用于评估时间序列数据集中的混沌(即“不可预测性”)。熵测量包括样本熵(SampEn)和近似熵(ApEn)等。SampEn(m, r, N)是条件概率的负自然对数,即两个序列在“m”个点相似的情况下,在下一个点(即在容差区间“r”内)保持相似的概率,其中自匹配不包含在概率计算中。ApEn基于与SampEn相同的数学原理,但自匹配包含在概率计算中。
为了计算序列是否保持接近或在容差区间内,分析了Y轴上数据序列的最高点和最低点之间的距离。由于这种差异的幅度在计算中不重要,而是该幅度超出或保持在容差区间内的概率重要,因此SampEn和ApEn不提供数据的离散度量。对于这两种熵方法,必须在计算前指定不同参数。这些参数是“N”(分析时间序列中的数据总量)、“m”(时间序列内分析序列的长度)以及用于计算“r”(容差区间)的“系数”。用于计算“r”的系数使ApEn值最大化,被认为是ApEn计算最合适的值。
R统计软件中SampEn和ApEn的默认设置包括m=2和r=0.2*标准差(SD)。“N”由分析的序列固定。在CPET期间,当使用呼吸参数的未过滤(即逐周期)数据时,“N”由呼吸周期数固定。由于SampEn和ApEn基于概率的对数,且概率取0到1之间的任何值,因此理论上SampEn和ApEn可以取0到无穷大之间的任何值。较高的SampEn和ApEn值代表更“不可预测”的数据。
对于SampEn和ApEn的计算,使用了m=2。本文不详细讨论改变参数“m”的影响,进一步解释可 elsewhere。通常,对于CPET期间分析的数据类型,由于数据量相对较小,使用默认参数m=2可能是合理的。改变“m”将显著影响熵计算,因此必须报告。

2.2 使用的模拟

本文使用了先前发表的模拟,该模拟评估了移动标准差(MSD)和LOESS在描述趋势参数周围数据离散度方面的性能。完整的方法和模拟结果已发表。简而言之,模拟基于SARS-CoV-2感染后诊断为DB的患者真实数据。该病例系列用于设定目标模拟参数,以确保模拟场景与真实运动数据 plausible。
使用模拟是因为此过程允许了解真实参数,这在真实数据中是不可能的。首先模拟了无趋势且已知数据离散度的数据(对于呼吸频率(BF),SD为2/min、4/min和6/min;对于潮气量(VT),SD为60 mL、270 mL和500 mL)。将趋势应用于模拟数据以模拟运动。然后测试了两种方法(MSD和LOESS),并计算了它们的偏倚(即使用测试方法获得的VT或BF离散度的平均值与真实离散度之间的差异)和精密度(即测试方法测量的VT或BF离散度的SD)。
这些模拟表明,在大多数模拟运动场景中,LOESS总体上比MSD更精确且偏倚更低。因此得出结论,在大多数场景中,可以使用跨度为0.75的LOESS(LOESS0.75)以非常高的精密度和低偏倚描述呼吸参数的离散度。

2.3 熵测量的趋势校正

LOESS方法是可用于抑制数据趋势的众多统计方法之一。一旦拟合了LOESS的非参数回归线,就会自动生成残差。残差代表每个点与LOESS回归线之间的垂直差异。如果LOESS与数据集的匹配良好,残差将以0为中心,残差的SD将密切代表趋势参数周围的离散度。在这种情况下,残差也代表趋势抑制后的数据集。残差也可用于计算数据集趋势抑制后的熵。

2.4 呼吸周期数、用于计算r的系数和趋势对熵测量影响的评估

在本文中,使用了先前发表的BF和VT模拟,不包括带有叹息的模拟,因为评估异常值对熵测量的影响超出了本研究范围。因此使用了9个模拟场景中的6个(3个VT模拟和3个BF模拟)。为了评估熵的特性,在大多数模拟中使用了固定的“N”(即呼吸周期数)为300,因为它近似于用于创建模拟的病例系列中的平均呼吸周期数。“N”仅在专门评估变化“N”的模拟中不同于300。参数“m”固定为2。
然后:
  1. 1.
    通过使用模拟场景中(ApEn – SampEn)/(“r”系数)关系,测量了ApEn最大化的容差区间“r”系数。
  2. 2.
    使用在无趋势模拟中使ApEn值最大化的容差区间“r”系数测量了SampEn和ApEn。
  3. 3.
    使用LOESS0.75方法获得的残差测试了趋势对SampEn和ApEn测量的影响,并将模拟的SampEn和ApEn值与应用趋势后的值进行比较。
  4. 4.
    通过用各种“N”重复相同模拟,评估了模拟场景中ApEn-SampEn与“N”的关系。

2.5 两个真实案例中关注趋势影响的示例

使用了先前研究中两名诊断为DB患者的逐周期数据,以说明如何在CPET期间显示熵测量,如何计算和可视化SDtrend/SDtrue比率,并强调其影响。为此,使用了原始逐周期VT数据,计算了“N”(熵计算中包含的呼吸周期数),并确定了原始逐周期数据集的均值和标准差(SD),这反映了SDtrend。然后对数据应用LOESS回归以获得残差,从而能够计算趋势周围的离散度(即SDtrue)。随后计算了SDtrend/SDtrue比率。在原始和去趋势的逐周期数据上计算了ApEn0.2和SampEn0.2。用于计算容差区间的系数固定为0.2,如 suggested 是分析大多数真实数据的可接受参数。

3 结果

3.1 使用LOESS0.75进行离散度量的一般解释

表1和表2分别展示了BF和VT的模拟结果。计算使用LOESS0.75的离散度预计对所有趋势产生完全模拟的离散度。例如,在BF模拟中,SD为2/min,应用线性趋势后,LOESS0.75测量的平均离散度(±SD)为1.99(±0.01),应用指数趋势后为2.05(±0.03)。LOESS0.75方法的偏倚可计算为平均离散度减去模拟(即真实)离散度。在指数趋势的情况下,偏倚为0.05(即2.05–2),精密度定义为测量的SD,为(±0.03)。类似推理适用于所有模拟。
另一方面,简单计算应用趋势后数据集的SD并不能测量趋势周围的离散度,并且显著受趋势本身影响。例如,计算模拟SD为2/min并应用线性趋势的数据的SD,得到SD为6.39(±0.11)。

3.2 熵测量、趋势影响和离散度影响

无趋势(平坦)数据的平均SampEn和ApEn值分别为1.64和1.33,在六个模拟中保持一致。应用趋势后,SampEn和ApEn值系统性地降低,幅度各异。例如,将线性趋势应用于分散度为2/min的BF模拟后,ApEn值从1.33(±0.03)降至0.77(±0.03)。对于相同趋势但模拟分散度为4/min和6/min,ApEn值分别从1.33(±0.03)降至1.13(±0.03)和1.24(±0.04)。有趣的是,对于给定趋势,当模拟分散度较大时,ApEn的下降较小。如表1和表2所示,这一观察适用于BF和VT模拟以及所有应用趋势。
熵的最大下降发生在将线性趋势应用于模拟分散度为2/min的BF时,ApEn值从1.33±0.03降至0.77±0.03。熵的最小下降发生在将指数趋势应用于模拟分散度为6/min的BF时,ApEn值从1.33±0.03降至1.25±0.04。最大下降(从1.33±0.03到0.77±0.03)对应于应用趋势后测量的SD(SDtrend)与模拟SD(SDtrue)之间的最高比率。在此示例中,比率SDtrend/SDtrue为6.39/2=3.20。相反,ApEn的最小下降(从1.33±0.03到1.25±0.04)与SDtrend(7.63)和SDtrue(6)之间的最小比率相关,即7.63/6=1.27。事实上,在所有场景中,ApEn和SampEn的下降可以通过SDtrend和SDtrue之间的比率预测。这种关系如图2所示,该图显示了ApEn和SampEn值随SDtrend/SDtrue比率的变化。

3.3 使用LOESS0.75校正趋势对熵测量的影响

如前所述,LOESS0.75方法可用于通过使用其测量的残差来抑制趋势。如表1和表2所示,当在LOESS0.75残差上计算SampEn和在LOESS0.75残差上计算ApEn时,结果非常接近模拟数据测量的熵(即数据集的真实熵)。例如,将线性趋势应用于模拟分散度为2/min后,在LOESS0.75残差上计算的ApEn为1.33(±0.03),与应用趋势前在初始数据上计算的ApEn相同。图3绘制了在LOESS0.75残差上计算的SampEn值和在LOESS0.75残差上计算的ApEn值随SDtrend/SDtrue值的变化,表明使用此方法计算的熵值在大多数场景中与预测熵值密切匹配。
然而,在某些情况下,ApEn和SampEn值与模拟值不同。例如,在表2中,对于应用对数趋势后分散度为60 mL的VT模拟,在LOESS0.75残差上测量的ApEn值为1.28(±0.03),而在模拟数据集上计算的值为1.33(±0.03)。使用LOESS0.75残差的校正方法在熵计算中剩余的误差归因于LOESS0.75方法本身的偏倚和不精确性。这通过将ApEn和SampEn值叠加在SDtrend/SDtrue比率上以及将在LOESS0.75残差上测量的ApEn和SampEn值叠加在SDLOESS0.75/SDtrue比率上来说明,其中SDLOESS0.75对应于应用趋势到模拟数据集后使用LOESS0.75方法计算的SD。如图4所示。

3.4 系数“r”对熵测量的影响

图5显示了当修改用于计算容差区间“r”的系数时,SampEn和ApEn的演变。SampEn随着应用更高的“r”系数值而降低。另一方面,ApEn遵循钟形曲线模式,在系数为0.35时达到峰值,从而使其值最大化。其他VT模拟以及使用不同分散度值的BF模拟产生了完全相同的(ApEn – SampEn)/(“r”系数)关系。
详细检查图5,当用于计算容差区间的系数修改时,SampExhibit表现出逻辑行为,并代表真实熵测量的无偏估计。确实,如图5所示,系数越低,SampEn的熵越高。这对于ApEn不成立。ApEn over用于计算“r”的系数的关系具有钟形曲线,其中ApEn的值在给定系数值处最大(图5)。低于此值,ApEn应在系数减少时增加。因此,低于使熵最大化的系数,ApEn产生真实熵的有偏估计。在所有模拟SD程度中观察到相似的ApEn-SampEn/(“r”系数)关系,表明分散幅度对这种关系没有影响。这种相同的关系, across all magnitudes of dispersion,可以通过用于生成数据的相同过程解释(数据随机生成,遵循相同长度的正态分布)。不同类型的数据集预计会产生不同的ApEn-SampEn/(“r”系数)关系,特别是使ApEn最大化的系数值。
当计算ApEn时,建议使用使ApEn值最大化的容差区间系数,这允许估计最大的信号复杂性。这已在模拟和真实数据中进行了评估。对于真实数据,这通常代表为每位患者计算容差区间的个体系数。这如图7和图8所示,其中使ApEn最大化的系数在真实个体中分别为0.24和0.26。一些人开发了自动确定该系数的方法。然而,对每位患者使用不同的系数使得患者之间的比较变得困难。处理此问题的另一种方法是使用具有固定系数计算容差区间的SampEn(例如0.2)。确实,当修改用于计算容差区间的系数时,SampEn是真实可预测性的无偏统计量。
总体而言,ApEn-SampEn/(“r”系数)关系具有主要影响。首先,我们可以看到,对于相同的
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号