深度神经网络集成与专家混合模型在天线建模中的性能对比研究
《IEEE Antennas and Propagation Magazine》:Comparison of Ensembles of Deep Neural Networks and Mixture of Experts for Antenna Modeling
【字体:
大
中
小
】
时间:2025年12月04日
来源:IEEE Antennas and Propagation Magazine 5.7
编辑推荐:
本刊编辑推荐:为解决天线设计中机器学习模型选择与设计空间影响的优化问题,研究人员开展了DNN、集成DNN和MoE三种模型在Yagi-Uda天线增益预测中的对比研究。结果表明设计空间范围对模型精度有显著影响(窄范围数据集精度提高一个数量级),新提出的MoE方法在宽参数范围内表现最优,为天线ML建模提供了重要的参数选择依据和实践指导。
在天线设计领域,机器学习技术正逐渐成为替代传统电磁仿真计算的重要工具。然而,面对复杂多变的天线参数空间,研究人员常常陷入两难选择:是采用简单的单一深度学习模型快速完成设计,还是投入更多计算资源构建复杂模型以追求更高精度?这一困境在实践应用中尤为突出,因为不同天线类型的设计参数范围差异显著,而目前尚缺乏系统性的指导原则来帮助工程师根据具体设计需求选择最合适的机器学习方法。
针对这一挑战,贝尔格莱德大学与哈利法科学技术大学的联合研究团队在《IEEE AntENNas and Propagation Magazine》上发表了创新性研究成果。该研究首次将专家混合模型引入天线建模领域,并与传统的单一深度神经网络和集成学习方法进行了全面对比。研究团队选择经典的Yagi-Uda天线作为研究对象,其包含四个关键设计参数:相邻导线间距(x1)、反射器半长度(x2)、驱动单元半长度(x3)和导向器半长度(x4)。
研究团队通过并行化WIPL-D电磁仿真软件生成了两个各包含10万个样本的数据集,这两个数据集的唯一区别在于设计参数的范围:Dataset 1的参数范围限定在[0.1λ, 0.4λ],而Dataset 2则扩展至[0.1λ, 0.8λ]。这种巧妙的实验设计使得研究人员能够系统评估设计空间范围对机器学习模型性能的影响。从图1可以明显看出,两个数据集中天线增益分布存在显著差异,这为后续的模型对比研究奠定了基础。
关键技术方法包括:采用矩量法薄线核进行电磁仿真生成训练数据;构建多层感知器DNN模型并优化隐藏层拓扑结构;建立基于平均输出的DNN集成模型;设计包含专家网络和门控网络的MoE架构;使用均方误差作为模型精度评估标准。
所有模型均在相同硬件环境下训练,采用Adam优化器,学习率设置为10-3,批次大小为512。训练过程中使用早停策略,当验证集损失函数连续50轮次未改善时终止训练。
单一DNN模型的实验结果显示,设计空间范围对模型性能有决定性影响。如图2所示,在Dataset 1上最优DNN拓扑结构的平均MSE仅为0.063 dB2,训练时间约150秒;而在Dataset 2上最佳模型的MSE升高至0.363 dB2,训练时间延长至193秒。这一结果证实了参数范围较窄的设计空间能够带来近一个数量级的精度提升。研究还发现,对于较简单的设计空间(Dataset 1),最优DNN拓扑包含120-180个神经元,而复杂设计空间(Dataset 2)则需要150-210个神经元。
集成学习方法通过组合多个DNN模型进一步提升了预测精度。如图3所示,在Dataset 1上,集成模型将MSE降低至0.025 dB2,比单一DNN提高了2.5倍,但训练时间相应增加至1410秒。在Dataset 2上,集成模型的改善幅度相对较小,MSE为0.22 dB2,精度提高1.65倍,训练时间延长至2280秒。这一结果表明,集成学习在简单设计空间中能带来更大收益,而在复杂问题中优势相对减弱。
专家混合模型作为本研究提出的新方法,采用了独特的架构设计(图4)。MoE由多个专家网络和一个门控网络组成,每个专家网络专门处理输入空间的不同子区域,门控网络则负责动态分配各专家的权重。这种设计使得MoE能够将复杂问题分解为多个较简单的子问题,由不同的专家网络分别处理。
MoE模型的实验结果令人鼓舞(图5)。在Dataset 1上,MoE的最佳MSE为0.032 dB2,训练时间340秒;在Dataset 2上,MSE为0.195 dB2,训练时间364秒。特别值得注意的是,在复杂设计空间条件下,MoE展现出了明显优势,其性能显著优于单一DNN和集成学习方法。
综合对比结果(图6、图7)揭示了三种方法在不同场景下的适用性。在窄设计空间(Dataset 1)条件下,Pareto前沿呈现出三个明显区域:单一DNN模型训练速度最快,MoE提供精度与时间的平衡折衷,集成学习则能达到最高精度但需要最长训练时间。而在宽设计空间(Dataset 2)条件下,MoE模型主导了Pareto前沿,展现出在这一复杂场景下的明显优势。
本研究通过系统性的实验分析,得出了若干对天线机器学习建模具有重要指导意义的结论。首先,设计空间的范围对模型性能有决定性影响,窄参数范围能够带来数量级级别的精度提升。这一发现提示天线设计者在构建训练数据集时,应谨慎确定参数范围,在保证设计需求的前提下尽可能缩小参数空间。
其次,研究验证了三种机器学习方法各自的优势领域。单一DNN适合对训练时间敏感的应用场景,集成学习在追求最高精度且计算资源充足时是最佳选择,而新提出的MoE方法则在复杂设计空间中表现卓越,同时在简单设计空间中也提供了良好的精度-时间平衡。
特别值得关注的是,MoE的成功应用验证了"分而治之"策略在天线建模中的有效性。通过门控网络动态分配专家权重,MoE能够将复杂的全局问题分解为多个相对简单的子问题,从而提高了学习效率和模型性能。这一机制为处理更复杂的天线设计问题提供了新思路。
从实践角度,本研究为天线设计师提供了明确的方法选择指南。当面对参数范围较窄的常规设计问题时,可以根据对精度和时间的权衡需求从三种方法中选择;而当处理参数范围宽、结构复杂的创新设计时,MoE成为了推荐首选。这一指导原则将有助于提高天线设计的效率和成功率。
该研究的另一个重要贡献在于建立了完整的机器学习天线建模评估框架,包括数据集生成、模型训练、性能评估和比较方法。这一框架可扩展到其他类型天线的建模研究,促进机器学习在天线设计领域的更广泛应用。
总之,本研究不仅解决了天线机器学习建模中的方法选择问题,还引入了创新的MoE方法,为领域发展提供了新的技术路径。研究结果对天线设计实践具有直接指导价值,同时建立的评估框架也为后续研究奠定了方法论基础。随着天线系统向更高频率、更复杂结构发展,这类智能建模方法的重要性将日益凸显。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号