编辑推荐:
在特殊需求个体评估面临诸多难题的背景下,研究人员开展 “Fast and effective assessment for individuals with special needs form optimization and prediction models” 研究。结果显示多种模型表现良好,随机森林模型最优。该研究为评估提供新途径,助力精准诊断与干预。
在现代教育体系中,特殊需求个体的评估至关重要,然而当前的评估方法却存在诸多困境。据统计,约 13% 的 6 - 18 岁人群有特殊需求,对他们在认知、生活、语言及社交等多方面能力的准确评估,是提供合适教育和支持服务的关键。但标准化测试虽被广泛使用,却难以全面评估所需技能,且存在诸多弊端。比如,单一测量工具无法涵盖所有领域,测试过程耗时久,每位被测试者诊断程序需 4 - 14 小时,平均使用 11 种不同测试或量表。同时,评估还面临测量工具陈旧、环境不佳、专家不足等问题,这些都导致评估结果不准确,使个体难以获得恰当的教育机会和服务。为解决这些问题,来自土耳其相关研究机构的研究人员开展了一项旨在优化心理评估表单并构建预测模型的研究,该研究成果发表在《BMC Psychology》杂志上。
研究人员使用了多种关键技术方法。首先,数据来源于土耳其某指导与研究中心,收集了 2019 - 2023 年间 1814 名 6 - 12 岁疑似特殊需求儿童的心理评估请求表,这些表单包含多方面初步诊断数据及六个诊断类别。然后,运用 SMOTE 方法平衡数据集,采用最小 - 最大缩放法对数据进行归一化处理,通过递归特征消除(RFE)方法选择最优特征子集,最后利用 K 近邻(KNN)、随机森林(RF)、朴素贝叶斯(NB)和支持向量机(SVM)等监督分类算法构建模型并进行评估。
下面来看具体的研究结果:
- 特征选择结果:通过 RFE 与 k 折交叉验证相结合的方法,从 171 个项目中筛选出 48 个关键特征。这一过程中,若移除某个特征导致模型的准确率、Kappa 值和交叉熵等指标下降超过 1%,则保留该特征。最终得到的模型准确率可达 90% 以上,AUC 为 0.913,表明该特征子集能有效提高模型的分类成功率。
- 分类结果:对比多种监督分类方法,发现所有方法都有较高的准确率和 Kappa 值,且交叉熵较低。其中,随机森林分类器表现最佳,准确率达到 0.92,Kappa 值为 0.89,交叉熵为 2.41。通过进一步分析精确率、召回率和 F1 分数等指标,发现各模型在整体上都具有较高的类别区分能力,但也存在一些误分类情况。例如,KNN 在自闭症谱系障碍(ASD)和身体残疾(PI)等类别中存在少量误判;随机森林在 PI 类别中有一定比例的误分类;朴素贝叶斯在某些具有相似症状模式的类别间容易混淆;支持向量机在区分 ASD 与其他类别时存在困难。此外,研究还确定了每个诊断类别中最重要的变量,并创建了相应的预测分类模型,给出了模型的截断值用于诊断。
在结论与讨论部分,该研究提出的创新方法具有重要意义。它突破了传统评估方法的局限,将来自个体家庭、教育和社会环境的非结构化数据系统地整合到评估中,利用机器学习技术提高了评估的准确性和可靠性。与传统方法相比,该方法能更全面地考虑个体情况,有望减少初始分类中的错误率,避免个体因错误分类而无法获得合适的支持和干预。然而,研究也存在一定局限性。数据仅来自特定地理区域和特定年龄段儿童,模型在不同人群中的通用性有待验证;模型可能出现误分类情况,影响个体发展;此外,还需进一步考虑数据一致性、模型标准化以及伦理合规性等问题。未来研究可从扩大数据集范围、加强技术基础设施建设、优化数据收集工具、探索多源数据融合等方面展开,以提升模型性能,更好地服务于特殊需求个体的心理和教育评估。