编辑推荐:
儿童虐待和忽视是严重的公共卫生问题,传统预防项目效果不佳且评估受限。研究人员开展 “Hello Baby” 项目预测风险模型(PRM)研究。结果显示该模型能有效识别高风险家庭,比简单筛选方法更精准,对预防儿童虐待意义重大。
在社会的各个角落,儿童本应在温暖的呵护下茁壮成长,然而儿童虐待和忽视现象却如阴霾般笼罩,成为了一个亟待解决的重大公共卫生问题。在美国,每年都有大量疑似儿童虐待和忽视的案件被上报到儿童保护系统(CPS),其中许多孩子被证实受到了伤害,更有甚者因此失去生命。这些遭受虐待的孩子,不仅在身体上承受痛苦,在心理、教育、就业等多个方面也会受到长期的负面影响,这无疑给他们的未来蒙上了一层厚厚的阴影。
为了预防儿童虐待,政府投入了资金,开展了各类预防项目。但这些项目面临着诸多困境,比如初级预防项目参与率和完成率低,难以在人群层面发挥有效作用,尤其是对于那些高风险或高需求的家庭。而且,现有的预防项目评估也很有限,真正能显著降低儿童虐待发生率的项目屈指可数。同时,要精准识别那些孩子面临较高虐待风险的家庭,并让他们参与到预防项目中,也并非易事。
在这样的背景下,阿勒格尼县人类服务部(DHS)与研究团队合作开展了一项极具意义的研究。他们致力于开发和验证一种预测风险模型(PRM),并应用于 “Hello Baby” 项目中。该项目旨在通过这个模型,将家庭和新生儿按照因虐待导致儿童在 3 岁前被带离家庭的预测风险,分为三个服务优先级,为不同风险等级的家庭提供相应的服务 ,从而更有针对性地预防儿童虐待。这一研究成果发表在了《Prevention Science》杂志上。
研究人员为开展此项研究,采用了一系列关键技术方法。他们构建了一个研究数据集,数据来源于阿勒格尼县 2012 - 2015 年出生儿童的匿名记录,涵盖了出生记录、县数据仓库中的综合数据等。通过这些数据对预测特征进行编码,然后将研究数据按照 70 - 30 的比例分为训练集和测试集。利用 R 包 glmnet 中的最小绝对收缩和选择算子(LASSO)正则化逻辑回归算法训练模型,并通过十折交叉验证对 lambda 参数进行调优 。此外,从县数据仓库中提取未用于训练的广泛验证结果,以测试模型识别高风险家庭的能力。
研究人员首先对数据进行了详细分析。研究数据集包含 52,520 例出生记录,这些数据展示了母亲和父亲的多种特征信息,如母亲的年龄、教育程度、种族,父亲的年龄、教育程度、种族等,同时也呈现了不同结果的发生率,像儿童在 3 岁前被带离家庭的比例为 18.13‰,儿童保护服务机构(CPS)为孩子(或兄弟姐妹)开设案件的比例为 37.47‰等。
接着,研究人员对 “Hello Baby” PRM 的预测准确性进行了测试。分析聚焦于未用于模型训练的 13,155 例出生记录(即测试集)。“Hello Baby” 项目将预测分数处于所有出生记录前 5% 的家庭定义为高风险家庭,并为其提供优先服务。结果显示,该模型的受试者工作特征曲线下面积(AUC)达到 0.93(95% 置信区间 [0.92, 0.95]),前 5% 风险组中儿童在 3 岁前被带离家庭的比例(召回率)为 19.9%,且该组占测试样本中 3 岁前被带离儿童总数的 54.1%(精确率) 。这表明该模型在识别高风险家庭方面具有较高的准确性。
随后,研究人员对模型进行了广泛验证。他们从县数据仓库中提取了多种未用于训练的验证结果,包括儿童和母亲的多种不良事件,如儿童死亡率、母亲无家可归、母亲入狱等。计算发现,被确定为 “Hello Baby” 优先服务的儿童,遭遇虐待相关的近乎死亡或死亡事件的相对风险是其他儿童的 5.54 倍(95% 置信区间 [3.41, 9.00]) 。这充分说明,即使模型是为预测儿童被带离家庭而训练的,但它也能有效识别出那些面临严重伤害高风险的幼儿。同时,在其他不良事件方面,如母亲急诊室就诊、入狱等,被确定为优先服务的家庭相对风险也较高。
最后,研究人员还对比了简单规则方法和 PRM。他们尝试用基于贫困(以医疗补助资格为代理)或年轻母亲年龄等简单规则来确定 5% 的出生队列接受 “Hello Baby” 优先服务,并重新计算所有不良事件的相对风险。结果发现,这些简单替代方法在识别最有可能经历不良事件的儿童和家庭方面,远不如 PRM 精准。例如,用 PRM 确定的家庭,虐待相关死亡的相对风险为 5.54,而简单替代方法的相对风险仅在 2.8 - 3.3 之间。
综上所述,这项研究成果意义非凡。“Hello Baby” PRM 展示出利用行政记录对新生儿群体进行被动筛查的可行性,能精准识别出那些因虐待导致儿童早期被带离家庭风险远高于其他新生儿的家庭和儿童,且与其他不良事件也存在显著关联。同时,PRM 在为预防服务确定家庭优先级方面,比基于简单规则的方法更为准确和精细。不过,该研究也存在一定的局限性,比如数据的可用性限制了模型的推广,部分数据缺失(如部分出生记录中父亲信息缺失)也可能影响模型的准确性 。但总体而言,这项研究为儿童虐待预防提供了新的方向和有力工具,有望推动相关领域在精准预防方面取得更大的进展,让更多儿童免受虐待的侵害。