《Scientific Reports》:Exploring the role of breastfeeding, antibiotics, and indoor environments in preschool children atopic dermatitis through machine learning and hygiene hypothesis
以往的研究虽然已经发现了许多与 AD 相关的遗传和环境因素,但面对 AD 患病率的持续上升,人们不禁思考,是否还有关键因素被忽视了呢?这时,“卫生假说” 进入了大家的视野。该假说认为,早期病原体暴露对免疫系统发育至关重要,这或许能解释 AD 发病率上升的现象。与此同时,先进的机器学习算法也为研究各种风险因素之间的相互作用提供了新的视角。在这样的背景下,为了更深入地了解早期儿童抗生素使用、纯母乳喂养持续时间、室内环境因素与儿童 AD 之间的关系,来自新疆医科大学、上海健康医学院附属周浦医院等机构的研究人员开展了这项具有重要意义的研究,相关成果发表在《Scientific Reports》上。
研究人员采用了基于社区的病例对照研究设计,通过分层随机抽样,从乌鲁木齐的 40 个行政区中选取了 6 个,又从每个行政区随机选择 8 - 12 所幼儿园,总共 60 所,对其中被医生诊断为 AD 的儿童进行研究。同时,按照性别、年龄和种族,为每个病例匹配 4 个没有 AD 诊断的儿童作为对照。研究人员设计了标准化问卷,内容涵盖一般人口统计信息、儿童喂养状况、儿童和家庭成员 AD 患病率以及生活环境等方面。
在统计分析阶段,研究人员使用 Epi Data 3.1 建立数据库,运用 R 4.3.0 软件对数据进行分析处理。对于缺失数据,非随机缺失的根据原因进行填充,随机缺失的则通过多重填补链式方程(Multiple Imputation by Chained Equations,MICE)进行填充。运用χ2检验进行单因素分析,采用多变量逻辑回归分析与学龄前儿童 AD 发生相关的因素,并计算优势比(Odds Ratio,OR)和 95% 置信区间(Confidence Interval,CI)。此外,研究人员还进行了分层分析和构建可解释的机器学习模型,以深入探究各因素的作用。
多变量分析结果显示,父亲哮喘、父亲过敏性鼻炎(Allergic Rhinitis,AR)、父亲 AD、母亲 AR 和母亲 AD 是儿童 AD 的遗传相关风险因素。母亲怀孕期间住所装修是 AD 的室内环境风险因素;孩子在 0 - 1 岁接受 3 次及以上抗生素治疗,患 AD 的风险显著增加;纯母乳喂养 4 个月及以上的孩子,AD 风险也有所上升。而有哥哥姐姐和低出生体重则是 AD 的保护因素。
按父母特应性疾病病史和孩子出生方式进行分层分析
分层分析表明,纯母乳喂养 4 个月及以上和早期使用 3 次及以上抗生素对 AD 主要呈现有害影响,而有哥哥姐姐和低出生体重则主要呈现保护作用。母亲有过敏相关疾病时,纯母乳喂养 4 个月及以上对 AD 的风险影响较低;父亲有过敏相关疾病时,会增加母乳喂养导致 AD 的风险。父亲有过敏相关疾病时,3 次及以上抗生素使用对 AD 的风险影响较低。同时,父母有过敏相关疾病会显著降低有哥哥姐姐和低出生体重对 AD 的保护作用。
机器学习模型构建和特征评估
研究人员通过网格搜索策略获得模型的最优参数,结果显示随机森林模型在训练集和测试集上的表现最优。XGBoost 和随机森林模型的全局重要性评估表明,母乳喂养持续时间、有哥哥姐姐和低出生体重在 AD 预测中占据重要地位。研究人员还基于随机森林模型构建了在线 AD 预测工具,可用于识别 2 - 8 岁儿童的 AD 风险。
研究结论表明,父母特应性疾病病史、母亲怀孕期间室内装修、纯母乳喂养 4 个月及以上以及孩子第一年使用 3 次及以上抗生素,均显著增加学龄前儿童患 AD 的风险。而有哥哥姐姐和低出生体重与 AD 风险呈负相关,这支持了卫生假说。机器学习分析确定,父母患 AD 或 AR 的儿童是未来预防 AD 的重点人群。减少抗生素过度使用对控制儿童 AD 可能至关重要。