基于机器学习方法的新生儿行为神经学评估中高风险足月婴儿的差异性项目功能表现(应用于新生儿重症监护病房)

《Frontiers in Neuroscience》:Differential item functioning in neonatal behavioral neurological assessment in high-risk full-term infants in NICU based on a machine learning approach

【字体: 时间:2025年11月18日 来源:Frontiers in Neuroscience 3.2

编辑推荐:

  本研究采用Rasch模型评估高危早产儿NICU住院期间NBNA的心理测量学特性,发现部分项目存在群体差异(性别、分娩方式),但BIC未显示显著偏差。结论支持NBNA的有效性,但需注意视觉反应等额外维度的潜在影响。

  本研究聚焦于高风险足月婴儿在新生儿重症监护病房(NICU)期间的神经行为评估工具——新生儿行为神经评估(NBNA)的测量特性。通过引入Rasch分析模型与广义部分信用模型结合Lasso正则化方法(GPCMlasso),研究团队试图深入探讨NBNA在不同群体中的测量有效性与潜在偏差。研究对象为543名足月婴儿,平均年龄约为14.26天,涵盖多种NICU入院原因,包括产前和产后相关疾病。研究结果显示,NBNA在测量神经行为方面具有良好的心理测量特性,能够反映婴儿的神经发育水平,但在某些项目中仍存在不足,如评分设计不合理可能导致信息失真。研究结论强调了NBNA在临床评估中的重要性,同时指出其在实际应用中仍需进一步优化以减少偏差。

### 研究背景与意义

在NICU中,新生儿因各种医学原因接受密切监测,这些婴儿在出院后往往面临更复杂的发育挑战。研究表明,这些婴儿在成长过程中可能表现出比同龄健康儿童更为显著的发育迟缓、运动功能障碍、社交沟通障碍等。这些问题可能在学龄前阶段逐渐显现,如入学时表现出注意力缺陷、学习困难等。因此,早期识别这些婴儿的神经行为特征,是预防长期健康风险的关键。NBNA作为一种评估工具,旨在通过观察婴儿的行为、肌张力、原始反射、行为状态等指标,提供关于神经行为状态的初步信息。然而,现有的研究尚未完全揭示NBNA在不同发育背景下的测量有效性。

NBNA的构建基于神经行为的三个主要维度:神经系统完整性、行为表现以及应激或戒断反应。这些维度被用于评估婴儿的神经发育水平,并提供可用于早期干预的依据。然而,当前的评估工具在捕捉这些复杂行为方面仍存在局限性。例如,一些项目可能无法准确反映婴儿的神经行为特征,或者评分标准不够精细,导致信息偏差。因此,本研究通过引入Rasch模型和机器学习方法,试图更全面地评估NBNA的测量特性,为临床提供更可靠的依据。

### 方法与数据分析

本研究采用Rasch模型和GPCMlasso方法对NBNA的项目进行分析。Rasch模型是一种基于项目反应理论的心理测量模型,它通过将原始得分转换为对数单位,构建一个具有连续性的测量尺度。这种模型的优势在于它能够独立地估计个体的能力和项目难度,而不依赖于总分,从而减少由于个体差异导致的测量误差。此外,Rasch模型还能够检验项目与个体之间的拟合情况,判断其是否符合心理测量的基本假设。

为了进一步分析潜在的测量偏差,研究团队引入了GPCMlasso模型,该模型结合了广义部分信用模型(GPCM)与Lasso正则化方法,能够同时处理多个协变量(如分娩方式、性别、疾病类型等),并有效识别是否存在与这些变量相关的项目功能差异(DIF)。Lasso方法通过引入惩罚项,能够筛选出最可能影响测量结果的变量,从而提高模型的稳定性与解释力。

研究团队使用WINSTEPS软件和R语言进行数据分析,通过对项目拟合度、信度、效度、维度分析以及DIF检测,全面评估NBNA的测量质量。例如,项目拟合度(infit MNSQ和Zstd)被用来衡量项目与模型的匹配程度,而项目信度指数(如分离指数)则用于评估NBNA在区分不同神经发育状态婴儿方面的能力。此外,通过主成分分析(PCA)进一步检验NBNA的维度特性,确保其仅测量一个主要的神经行为维度。

### 研究结果与分析

研究结果显示,NBNA的项目在整体上符合Rasch模型的假设,能够有效捕捉神经行为特征。然而,也有部分项目表现出不合理的评分功能。例如,某些项目未能按照预期的评分分布进行,导致信息不准确。具体而言,有四个项目(编号6、18、19、20)的评分分布不符合预期,尤其是在“清醒”这一类别中,几乎没有婴儿获得0分,这可能表明评分标准不够细致,无法准确反映婴儿的神经状态。

此外,研究团队还发现,NBNA的评分结构中存在一些冗余或不合理的设计。例如,某些项目的评分阈值设置不当,导致不同评分之间的界限过于狭窄,难以区分不同神经发育水平的婴儿。这种情况可能影响NBNA的测量精度,使其在临床实践中产生误导性结果。例如,项目15(“吸吮反射”)可能被随机表现所影响,而不是反映真实的神经发育状况,因此需要在评分时更加谨慎。

在维度分析方面,NBNA解释了51.3%的测量方差,表明其主要测量的是神经行为的单一维度。然而,研究团队还发现,NBNA在视觉反应方面具有额外的测量成分,这表明视觉行为可能在神经行为评估中扮演重要角色。这一发现与之前关于婴儿视觉反应与神经发育关系的研究相吻合,说明视觉反应可以作为评估神经行为的重要指标之一。

在DIF分析中,研究团队发现,虽然BIC方法未检测到任何项目存在显著的测量偏差,但AIC方法识别出九个项目在不同性别或分娩方式的婴儿中表现出差异。例如,某些项目在男性婴儿中更容易获得高分,而女性婴儿则可能在某些方面表现较差。这一结果可能与性别相关的神经发育差异有关,但需要更多的研究来验证这一假设。此外,研究还指出,某些项目在不同群体中的表现存在不一致性,这可能意味着这些项目无法准确反映神经行为特征,而更多地受到其他非神经因素的影响。

### 研究讨论与启示

研究团队指出,NBNA的测量特性在某些方面仍然存在不足。首先,评分设计的不合理可能导致信息失真。例如,某些项目的评分阈值设置不当,使得不同评分之间的界限过于狭窄,无法准确区分婴儿的神经行为表现。其次,NBNA的测量维度可能过于单一,未能充分涵盖婴儿的神经行为特征。虽然研究发现NBNA主要测量神经行为的一个维度,但其在视觉反应方面的额外表现表明,可能需要对评估工具进行优化,以更全面地反映婴儿的神经行为特征。

此外,研究还强调了性别在神经行为评估中的潜在影响。尽管NBNA的某些项目在不同性别婴儿中表现出差异,但这种差异是否具有普遍性仍需进一步研究。例如,某些项目在男性婴儿中更容易获得高分,而女性婴儿则可能在某些方面表现较差,这可能与性别相关的神经结构差异有关。然而,这些差异是否具有临床意义,仍需更多的数据支持。

研究团队还提到,GPCMlasso模型在检测DIF方面具有优势,因为它能够同时处理多个协变量,并通过正则化方法减少多变量之间的共线性问题。这种方法不仅提高了模型的稳定性,还使得DIF分析更加精确。然而,由于样本量的限制,研究团队未能充分检测所有可能的DIF类型,尤其是非均匀DIF。这可能意味着某些项目在不同子群体中的表现存在不一致性,需要进一步的研究来验证。

### 临床意义与应用

本研究的结果对临床实践具有重要意义。首先,NBNA能够有效评估高风险足月婴儿的神经行为特征,为早期干预提供依据。然而,由于某些项目可能存在评分偏差,临床医生在解读NBNA结果时需要更加谨慎。例如,某些项目可能受到环境因素或其他非神经因素的影响,因此需要结合其他评估工具,以确保结果的准确性。

其次,研究结果提示,NBNA的评分标准可能需要进一步优化。例如,某些项目在评分时未能充分区分不同神经发育水平的婴儿,这可能导致误判。因此,临床医生在使用NBNA时,应关注评分阈值的合理性,并在必要时对评分标准进行调整,以提高测量的准确性。

此外,研究还强调了性别在神经行为评估中的潜在影响。虽然NBNA的某些项目在不同性别婴儿中表现出差异,但这些差异是否具有临床意义仍需进一步研究。因此,临床医生在使用NBNA时,应结合婴儿的性别、分娩方式等背景信息,以更全面地评估其神经行为状态。

### 研究局限与未来方向

尽管本研究在评估NBNA的测量特性方面取得了一定成果,但仍存在一些局限性。首先,样本量在某些子群体中存在不平衡,这可能影响DIF分析的准确性。例如,某些子群体(如早产儿或低出生体重儿)的样本量较小,导致无法充分检测所有可能的DIF类型。其次,GPCMlasso模型主要用于检测均匀DIF,因此无法识别非均匀DIF。这可能意味着某些项目在不同子群体中的表现存在不一致性,需要进一步的研究来探讨。

未来的研究可以考虑扩大样本量,以提高DIF分析的准确性。此外,还可以探索非均匀DIF的检测方法,以更全面地评估NBNA的测量特性。同时,研究团队建议对NBNA的评分标准进行优化,以减少评分偏差,提高测量的准确性。这可能包括调整评分阈值、增加评分维度,或引入更精细的评分标准,以更全面地反映婴儿的神经行为特征。

### 总结与展望

本研究通过Rasch模型和GPCMlasso方法,全面评估了NBNA在高风险足月婴儿中的测量特性。结果显示,NBNA在测量神经行为方面具有良好的心理测量质量,能够有效区分不同神经发育水平的婴儿。然而,某些项目可能存在评分偏差,影响测量的准确性。因此,研究团队建议在临床实践中对NBNA的评分标准进行优化,并结合其他评估工具,以更全面地评估婴儿的神经行为状态。

未来的研究可以进一步探讨NBNA的评分设计,以减少评分偏差,提高测量的准确性。此外,还可以扩大样本量,以提高DIF分析的可靠性,并探索非均匀DIF的检测方法。通过这些努力,NBNA有望成为更可靠的神经行为评估工具,为高风险婴儿的早期干预提供更坚实的理论基础和实践依据。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号