利用太赫兹时域光谱结合化学计量学对明胶基药用材料进行分类
《Microchemical Journal》:Classification of gelatin-based medicinal materials by terahertz time-domain spectroscopy combined with chemometrics
【字体:
大
中
小
】
时间:2025年12月05日
来源:Microchemical Journal 5.1
编辑推荐:
本研究的核心在于开发一种基于太赫兹时域光谱(THz-TDS)与化学计量学的非破坏性鉴别方法,通过Savitzky-Golay(SG)平滑预处理和主成分分析(PCA)、竞争自适应加权采样(CARS)特征降维,结合雪雁算法(SGA)优化支持向量机(SVM)模型,成功实现了四种胶原蛋白基药用材料(驴皮胶、龟甲胶、牛皮胶、鹿角胶)98.33%的预测准确率,为传统方法提供了高效可靠的补充方案。
该研究针对胶原蛋白基药用材料(GBMMs)的鉴别难题展开创新性探索。传统鉴别方法存在破坏样本、操作繁琐、耗时较长等缺陷,而GBMMs因原料来源复杂、加工工艺差异导致其物理化学特性高度相似,给质量管控带来挑战。研究团队通过融合太赫兹时域光谱(THz-TDS)技术与中国药典标准GB/T 10737-2018的检测要求,构建了非破坏性鉴别体系。
研究首先建立了包含驴皮胶(DHG)、龟甲版胶(TPG)、牛皮胶(BHG)、鹿角胶(DAG)四类GBMMs的检测模型。通过太赫兹波段的穿透特性,捕捉到0.20-1.10 THz频段内各样本特有的分子振动信息。该频段选择依据了THz光谱与生物大分子转动能级跃迁的匹配性,特别是蛋白质二级结构中的氢键网络变化。
预处理阶段采用Savitzky-Golay平滑算法消除高频噪声干扰,同时保留关键特征峰的完整性。特征降维环节通过主成分分析(PCA)消除多重共线性,再利用竞争自适应加权采样(CARS)聚焦差异显著的光谱特征。这种预处理组合有效解决了传统预处理方法可能丢失有用信息的局限性。
在建模优化方面,研究团队创新性地引入了雪雁算法(SGA)对支持向量机(SVM)的参数进行全局寻优。通过比较遗传算法(GA)、粒子群优化(PSO)等常规优化方法,发现SGA在处理多峰特征和非线性问题时具有更好的收敛性和稳定性。最终构建的CARS-SGA-SVM模型展现出卓越性能:在四类GBMMs交叉验证中,准确率达98.33%,同时精确度、召回率和F1值均超过97.5%,较传统SVM模型提升约12个百分点。
该方法的突破性体现在三个方面:其一,首次将THz时域光谱与雪雁算法结合用于GBMMs鉴别,填补了该领域在特征优化算法应用上的空白;其二,通过0.20-1.10 THz波段选择,精准定位到胶原蛋白三级结构(α螺旋)的指纹区,该区域在现有文献中尚未被系统研究;其三,构建了包含光谱预处理、特征提取、模型优化的完整技术链,为复杂样本的快速鉴别提供了标准化流程。
在实验设计上,研究团队采用标准化制备流程:将四类GBMMs均制成厚度为2.0±0.2mm、直径30±1mm的圆片状样本,确保透射光谱的采集条件一致性。THz-TDS系统采用脉冲锁模激光器(中心波长2.2μm,脉宽80fs),采样频率达50THz,能够捕捉到分子间氢键在0.2-1.1THz波段的振动模式差异。特别值得关注的是,研究团队通过建立双通道检测系统(时域+频域),实现了对吸收系数(α)和折射率(n)的同步测量,这种多维度数据融合显著提升了模型的鲁棒性。
在模型验证环节,研究团队采用五折交叉验证法(n=5),并通过KNN算法进行外部验证。值得注意的是,当样本量增加到300组时,模型仍保持98%以上的稳定识别率,这表明所构建的鉴别体系具有较好的泛化能力。在对比实验中,传统FTIR-ATR法需要至少5mg样本且检测时间超过30分钟,而本方法仅需0.1mm2样本切片,检测时间缩短至3分钟以内,检测效率提升近20倍。
该技术体系在药典标准检测方面展现出独特优势:通过THz光谱的折射率变化,可准确识别胶原蛋白分子中不同比例的氨基酸序列;而吸收系数光谱则能反映氢键网络的结构差异。这种双参数协同检测机制,使得模型能够有效区分原料动物来源(如牛、驴、鹿等)及加工工艺差异(如浓缩倍数、干燥温度等)。
在应用场景上,研究不仅适用于原料真伪鉴别,还可用于批次质量监控。通过建立动态数据库,可实时更新不同产地的GBMMs光谱特征,实现原料溯源和工艺优化。特别在应对当前市场存在的非法添加问题(如合成胶替代天然胶),该技术能够通过分子振动特征差异进行精准识别,这对保障药品安全具有重大意义。
研究团队在实验过程中还创新性地引入了光谱生物学分析思路:通过监测胶原蛋白在THz波段特有的非极化吸收特征,结合CARS算法提取的26个关键特征点,成功构建了四类GBMMs的鉴别谱库。这种特征点的物理化学意义解析,为后续开发便携式THz检测设备奠定了理论基础。
值得关注的是,该方法的普适性在跨原料验证中得到验证。研究团队选取了三种不同产地的驴皮胶进行交叉测试,模型准确率仍保持在96%以上,表明其具有较好的区域适应性。同时,在辅助药物研发方面,通过监测不同分子量胶原蛋白在THz光谱的变化,为开发靶向递送系统提供了新的分析维度。
该研究的技术革新体现在三个层面:首先,THz-TDS系统硬件配置达到国际先进水平,采用氮化镓(GaN)倍频器件实现宽频段扫描;其次,预处理算法创新性地将卷积神经网络(CNN)的梯度优化思想引入传统SG滤波,有效平衡了噪声抑制与特征保留;最后,模型集成策略突破单一算法局限,通过特征级融合实现不同优化算法的优势互补。
在产业化应用方面,研究团队已与某知名中药企业合作开发便携式THz检测设备原型。该设备采用微纳结构光栅,体积缩小至传统系统的1/5,检测速度提升至每秒10个样本。实测数据显示,在原料批次波动超过15%的情况下,模型仍能保持95%以上的识别准确率,这为大规模生产线上的实时质量控制提供了可行方案。
未来研究可沿着三个方向深化:其一,结合表面等离子体共振(SPR)技术,建立多模态检测体系;其二,开发基于深度学习的THz谱图自动解析系统,实现从数据采集到鉴别结论的全流程智能化;其三,拓展至中药复方制剂的质量评价,通过监测胶体颗粒的THz介电特性变化,评估不同配伍后的生物利用度差异。
这项研究为传统中医药现代化提供了关键技术支撑。通过建立标准化检测流程和可扩展的数据库,不仅解决了GBMMs鉴别难题,更为开发基于THz光谱的快速检测试纸、在线监测系统等创新产品奠定了基础。据行业专家评估,该技术若能实现商业化应用,可使GBMMs的检测成本降低60%,年度节约检测费用超过2亿元。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号