自动化机器学习研究全景:从元学习、超参数优化到迁移学习的演进与展望
《ARTIFICIAL INTELLIGENCE REVIEW》:A literature review on automated machine learning
【字体:
大
中
小
】
时间:2025年11月12日
来源:ARTIFICIAL INTELLIGENCE REVIEW 13.9
编辑推荐:
本刊编辑推荐:为解决机器学习模型开发复杂、专业门槛高的问题,研究人员对自动化机器学习(AutoML)领域进行了系统性文献综述。该研究追溯了AutoML从早期元学习(MtL)、超参数优化(HPO)和迁移学习(TL)到神经架构搜索(NAS)和自动化管道设计的演进历程,提出了基于元知识和元数据的统一框架,为研究人员提供了该领域的全景式概览,对推动AI民主化和加速数据驱动解决方案开发具有重要意义。
在人工智能蓬勃发展的今天,机器学习已成为推动各领域创新的核心驱动力。然而,构建高性能的机器学习模型通常需要专业的知识和大量的时间投入,这限制了机器学习技术的广泛应用。从数据预处理、特征工程到算法选择和超参数调优,每个环节都需要专业判断,使得机器学习应用开发成为只有少数专家能够驾驭的领域。这种高门槛不仅阻碍了机器学习技术的普及,也限制了其在更多领域的创新应用。
正是在这样的背景下,自动化机器学习(AutoML)应运而生,旨在将机器学习从业者从繁琐的重复性工作中解放出来,让更多非专业人士也能受益于机器学习技术。发表于《Artificial Intelligence Review》的这篇综述论文,由圣保罗大学的Edesio Alcobaca和André C. P. L. F. de Carvalho共同完成,对AutoML领域进行了全面而系统的梳理,为我们理解这一快速发展的领域提供了宝贵的地图。
研究人员采用系统性文献综述方法,检索了Scopus和Web of Science数据库中52篇高引用的综述论文,从历史演进、理论基础、方法论到应用前景,构建了完整的AutoML知识体系。研究发现,AutoML的概念并非全新,其根源可以追溯到20世纪70年代John Rice提出的算法选择问题,即"对于给定的新问题,哪种算法可能表现出最佳性能?"这一基础性问题至今仍是AutoML研究的核心。
关键技术方法包括系统性文献综述协议、元学习分类体系、超参数优化数学形式化、迁移学习领域-任务框架,以及基于元知识和元数据的统一理论框架。研究还涵盖了神经架构搜索方法和自动化管道设计技术,通过分析52篇精选综述论文建立了完整的分类体系。
历史演进方面,研究揭示了AutoML从基础理论到现代应用的发展轨迹。20世纪90年代见证了多个重要里程碑:Aha首次使用数据集特征进行算法选择并引入"元学习"术语;Brodley提出算法选择性优越性问题;Kohavi和John形式化了超参数优化问题。同时期,Pratt等人探索了神经网络间的权重迁移,而Ritter则认识到超参数自动优化的重要性。欧洲的StatLog和METAL项目进一步推动了这一领域的发展,为现代AutoML奠定了基础。
元学习部分,研究系统梳理了从元特征和模型两个维度的学习方法。基于元特征的方法通过提取数据集特征(通用特征、统计特征、信息论特征等)构建元模型,用于算法推荐、性能预测等任务。而基于模型的元学习则包括基于度量、模型和优化的方法,如原型网络、模型不可知元学习等,实现了"学会学习"的目标。
超参数优化研究涵盖了从单步优化到复杂管道设计的各种方法。除了传统的网格搜索和随机搜索,研究还详细分析了贝叶斯优化、进化算法等高级技术。特别值得关注的是神经架构搜索的发展,从全局搜索空间(单分支、多分支)到基于单元的搜索空间,显示了深度学习时代AutoML的特殊挑战和创新解决方案。
迁移学习部分,研究区分了元知识转移和持续元知识转移两种模式。前者包括微调、特征提取、零样本/小样本学习等经典方法,而后者则涉及持续学习、模块化网络等新兴方向,反映了AutoML系统适应动态环境的能力需求。
研究提出的统一框架将元数据定义为从基础学习过程中衍生的数据,而元知识则是通过学习如何学习而获得的知识。这一框架成功地将传统上相对独立的元学习、超参数优化和迁移学习领域联系起来,揭示了它们共同的理论基础和方法论共性。
在应用前景方面,研究展望了AutoML在增强可解释性、提高泛化能力、保障安全性等多个重要方向的发展趋势。特别是在线学习、联邦学习、多模态学习等新兴场景下的AutoML应用,展现了该技术适应未来复杂环境需求的潜力。
研究结论强调,AutoML不仅是一个技术工具,更是实现人工智能民主化的重要途径。通过自动化机器学习流程中的重复性任务,AutoML既可以帮助非专业人士应用机器学习技术,也能够辅助专家更高效地开发先进模型。随着技术的成熟,AutoML系统有望发展成为真正智能的数据科学助手,在新的智能时代扩展人类在数据驱动决策方面的专业知识。
这项研究的重要意义在于为快速发展的AutoML领域提供了系统性的梳理和前瞻性的视角,建立了统一的理论框架,指明了未来研究方向。对于从事人工智能研究和应用的学者、工程师以及决策者而言,这篇综述都是理解AutoML发展脉络和未来趋势的宝贵参考资料,对推动整个人工智能领域的发展具有重要价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号