利用近红外光谱技术与多通道注意力融合网络,对百合鳞茎提取物中的Regaloside B进行智能定量分析
《Microchemical Journal》:Intelligent quantification of Regaloside B in
Lilii Bulbus extracts utilizing near-infrared spectroscopy coupled with a multi-channel attention fusion network
【字体:
大
中
小
】
时间:2025年12月01日
来源:Microchemical Journal 5.1
编辑推荐:
近红外光谱结合多通道注意力融合网络(MCAF-Net)用于石斛中Regaloside B的快速高精度定量分析,传统模型经预处理和特征选择后性能提升,MCAF-Net在测试集上R2达0.94,RMSE 2.4 μg/mL,RPD 4.2,通过注意力机制识别关键光谱区域,为天然产物质量控制提供新方法。
近年来,随着中药现代化进程的加速,活性成分的精准检测技术成为行业关注的重点。以石斛(Lilii Bulbus)为代表的传统中药材,其干燥鳞茎经过复杂的水提醇沉工艺后,提取液中可能含有多糖、皂苷、黄酮类等十余种活性成分。其中,Regaloside B作为药理活性标志物,其含量检测直接影响制剂的质量评价。然而,传统检测手段如高效液相色谱法(HPLC)存在前处理复杂、耗时较长、溶剂消耗大等缺陷,难以满足现代制药企业对连续化生产过程中在线监测的迫切需求。
在光谱分析技术应用方面,近红外光谱(NIRS)凭借其非破坏性、快速扫描和绿色环保等优势,逐渐成为天然产物质量控制的重要工具。NIRS通过检测400-2500nm范围内的分子振动吸收信息,能够反映样品的化学组成和物理状态。研究团队针对Regaloside B在光谱特征上的特殊性展开系统研究,发现该化合物在近红外区域存在多个特征吸收峰,尤其是1450nm附近的宽峰与羟基和烷基的振动特征密切相关,而1160nm处的吸收峰则可能对应碳氢键的振动模式。这些光谱特征与Regaloside B的分子结构存在明确的对应关系,但传统方法难以有效分离复杂体系中重叠的吸收信号。
为解决这一技术难题,研究团队构建了多维度分析框架。在模型构建阶段,对比了经典统计模型与深度学习模型的性能差异。传统方法如偏最小二乘回归(PLSR)、支持向量回归(SVR)和人工神经网络(ANN)经过波段筛选和基线校正等预处理后,模型预测精度得到显著提升。其中,PLSR凭借其内在的正交性特征,在低浓度区间表现出优异的线性拟合能力;SVR通过核函数优化,在样本量较少时仍能保持较高的泛化性能;ANN通过多层非线性变换,有效捕捉光谱信号中的复杂关联性。但研究发现,当样本量超过200组且成分间存在强相关性时,这些传统模型的预测误差呈现明显增大趋势。
突破性进展体现在深度学习模型的创新设计上。研究团队提出的MCAF-Net模型通过三重技术整合,构建了多通道协同分析体系。首先,采用多尺度卷积结构分别处理原始光谱、一阶导数和二阶导数信息,有效分离不同频率范围的振动信号。其次,引入跨通道注意力机制,动态调整不同预处理方法下的特征权重,例如在1160nm附近增强烷基特征通道的敏感度,而在1450nm波段强化羟基特征通道的识别能力。最后,通过特征融合层将不同通道的提取结果进行非线性整合,显著提升了模型对复杂光谱特征的解析能力。
实验验证部分采用标准加样法构建样本矩阵,涵盖Regaloside B浓度范围从2.5-32.0μg/mL的梯度样本。通过交叉验证发现,MCAF-Net模型在测试集上的决定系数(R2)达到0.94,相对标准偏差(RSD)控制在5%以内,且重复性测试显示不同批次的模型性能波动小于1.5%。值得注意的是,该模型在低浓度区间(<5μg/mL)表现出更优的检测灵敏度,信噪比(S/N)较传统方法提升约40%,这主要得益于注意力机制对弱信号特征的增强作用。
在方法学创新方面,研究团队建立了光谱特征与化学结构关联的解析体系。通过可视化分析发现,MCAF-Net模型自动聚焦于三个关键光谱区域:1450-1500nm的羟基振动特征带、1630-1650nm的羰基伸缩振动带,以及2100-2200nm的糖苷键振动区。这些区域与Regaloside B分子结构中的羟基、羰基和糖苷键基团高度吻合,证实了模型对目标成分特征谱的精准识别能力。进一步对比分析显示,当光谱数据库扩展至500组样本时,MCAF-Net的预测稳定性(系数稳定性R2)仍保持0.92以上,而传统模型因特征工程依赖性强,稳定性显著下降。
该研究在工程应用层面具有显著创新价值。通过将NIRS与MCAF-Net模型结合,构建了无需前处理的在线检测系统,检测速度较HPLC提升20倍以上。在某中药提取车间的实测中,系统成功实现了每小时300批次样品的实时监测,检测误差控制在±3%以内。这种技术革新不仅解决了传统方法存在的周期长、溶剂消耗大等问题,更通过光谱特征的可解释性分析,为建立中药活性成分的质量指纹图谱提供了新思路。
在产业化推广方面,研究团队开发了基于嵌入式光谱仪的便携式检测设备。该设备通过微型化分光模块和低功耗神经网络芯片的结合,实现了实验室级检测性能的现场化应用。实测数据显示,设备在25℃±5℃、湿度40%-60%的典型车间环境下,仍能保持R2>0.91的稳定预测性能。此外,开发的标准化数据处理流程已纳入GMP文件体系,确保不同批次检测结果的可比性。
当前技术瓶颈主要集中在复杂基质干扰下的特征区分能力。针对提取液中可能存在的多糖等干扰物质,研究团队提出了动态权重分配策略:在特征提取阶段,通过构建"特征-干扰"关联矩阵,自动识别并抑制多糖在1100-1300nm波段的干扰信号。实验表明,该策略可使模型在含30%多糖干扰时的检测精度仍保持R2>0.88。
未来发展方向将聚焦于多组分协同检测。研究显示,Regaloside B与多种活性成分存在光谱特征重叠,特别是黄酮类化合物在1600-1700nm波段与Regaloside B的羰基振动带存在部分重叠。团队正在探索多目标谱学分析技术,通过构建多维特征空间,实现多种活性成分的同步检测。初步实验表明,引入随机森林特征选择算法后,模型的多目标检测能力提升约25%。
该研究成果为天然产物质量控制提供了新的技术范式。通过深度学习模型的可解释性分析,不仅明确了关键光谱特征的作用机制,还建立了"光谱特征-化学基团-药理活性"的关联图谱。这种将机器学习与化学计量学相结合的方法,为中药现代化过程中的质量控制标准化提供了重要技术支撑,相关成果已申请3项国家发明专利,并在2个GMP生产线上完成中试应用。
在行业影响方面,该技术使Regaloside B的检测成本从传统方法的0.8元/批次降至0.15元/批次,同时将质量稳定性从批次间的±8%提升至±3%以内。某大型制药企业应用该技术后,生产周期缩短40%,产品不合格率下降65%,直接经济效益达年均1200万元。这种技术转化不仅验证了人工智能在中药分析领域的应用潜力,更为行业智能化升级提供了可复制的实施路径。
随着《中药质量标志物》等新标准的实施,对活性成分的实时在线监测需求日益迫切。该研究通过深度学习模型与NIRS技术的有机融合,构建了具备自解释、自适应特性的新型检测体系。这种技术路线不仅适用于Regaloside B的检测,更为其他复杂中药体系的质控提供了方法论借鉴,对推动中医药产业高质量发展具有战略意义。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号