编辑推荐:
研究人员为解决大流行病早期数据不足问题,开展基于 GAN 的图像合成研究,模型检测准确率达 98.0%,助力疾病诊断。
在历史的长河中,大流行病如同一个个 “不速之客”,给人类社会带来了沉重的打击。从曾经肆虐的西班牙流感,到如今记忆犹新的新冠肺炎(COVID-19),每一次大流行病的爆发,都让无数人陷入病痛的折磨,甚至失去生命。尤其是 COVID-19,它如同一场全球性的风暴,迅速席卷各个角落,感染人数超过 7.58 亿,死亡人数高达 600 万 ,让全球的医疗系统都面临着巨大的压力。
在这场与病毒的较量中,早期诊断无疑是至关重要的一环。就像在黑暗中点亮一盏明灯,能够帮助我们及时发现病毒的踪迹,采取有效的防控措施,从而减少病毒的传播,拯救更多的生命。然而,现有的诊断方法却存在着诸多问题。一些先进的诊断技术,如逆转录聚合酶链反应(RT-PCR),虽然准确性高,但由于设备和技术要求高,只有少数国家能够广泛应用,对于许多国家来说,这些方法就像是遥不可及的 “奢侈品”,无法在实际防控中发挥作用。
与此同时,人工智能(AI)技术的发展为疾病诊断带来了新的希望。AI 算法就像是拥有 “火眼金睛” 的超级助手,能够快速准确地分析大量的数据,帮助医生进行诊断。但是,这一技术也面临着一个巨大的难题 —— 数据不足。在大流行病的早期阶段,由于各种原因,很难收集到足够多的相关数据。而缺乏数据,就如同让 AI “巧妇难为无米之炊”,会导致模型出现过拟合问题,影响分类的准确性。
为了解决这些问题,来自 DHA Suffa University、Hamdard University、Applied Science Private University 等多个研究机构的研究人员 Sumera Rounaq、Shahid Munir Shah 等人展开了深入的研究。他们的研究成果发表在《Heliyon》杂志上,为大流行病的早期检测提供了新的解决方案。
研究人员采用了多种关键技术方法。首先是生成对抗网络(GAN),这是一种特殊的深度学习模型,由生成器和判别器组成,就像是两个相互竞争的 “对手”,在不断的对抗中提高生成数据的质量。研究人员提出了一种定制的 GAN 架构 ——CoroWGAN-GP,利用 Wasserstein 损失、梯度惩罚和正则化项,有效解决了传统 GAN 中常见的模式崩溃问题。其次,研究人员还提出了一种定制的深度卷积神经网络(CNN)架构 ——DeepCNN-CovNet19,并使用扩展后的数据集对其进行训练,以实现对胸部 X 光图像的准确分类。
研究结果主要包括以下几个方面:
CoroWGAN-GP 模型的图像生成结果 :CoroWGAN-GP 模型表现出色,为每个类别(COVID-19、正常和病毒性肺炎)生成了 4000 张图像。在训练初期,生成的图像像是充满噪点的 “半成品”,但随着训练的推进,图像逐渐变得清晰,细节也更加丰富。到训练后期,生成的样本与真实图像已经非常相似,生成的假图像数量是真实图像的 19 倍之多。
DeepCNN-CovNet19 分类模型的性能评估 :通过学习曲线可以发现,该模型的训练和验证损失随着时间逐渐下降,训练损失在几个 epoch 后趋于稳定,验证损失虽然波动较大,但整体也在下降,训练和验证准确率分别达到了 99.9% 和 99.7%。
模型评估指标 :
基于混淆矩阵和分类报告的评估 :混淆矩阵是评估模型性能的重要工具,它能够清晰地展示模型的预测情况。通过计算精度、召回率、F1 分数和准确率等指标,发现 DeepCNN-CovNet19 模型的总体准确率达到了 98.0%,在各个类别上也表现良好。
基于受试者工作特征(ROC)曲线的评估 :ROC 曲线可以直观地反映模型的诊断准确性。该模型在正常和病毒性肺炎的检测中,真阳性率达到了 100%,在 COVID-19 检测中,真阳性率为 99.0%。同时,通过计算曲线下面积(AUC),发现病毒性肺炎和正常的 ROC 曲线 AUC 值为 1.0,COVID-19 的 ROC 曲线 AUC 值为 0.99,表明模型在多类分类中具有较高的准确性。
基于马修斯相关系数(MCC)和交叉验证的评估 :MCC 是一种更可靠的统计参数,该模型的平均 MCC 值为 0.9874,表明模型在平衡预测方面表现出色。通过 5 折交叉验证,模型的平均准确率达到了 98.87%,进一步证明了模型的稳健性和泛化能力。
研究结论与讨论部分指出,该研究提出的 CoroWGAN-GP 方法成功合成了逼真的胸部 X 光图像,扩展了训练数据集,有效解决了数据不足的问题。同时,通过使用 Wasserstein 损失、梯度惩罚和正则化项,避免了模式崩溃和梯度消失问题,减少了过拟合的发生。与其他研究相比,该研究的模型在准确率上有了显著提升,为 COVID-19 等大流行病的早期诊断提供了更可靠的方法。这一研究成果对于医疗领域意义重大,能够帮助医生更准确地诊断疾病,为疫情防控提供有力支持,为全球抗击大流行病贡献了重要的智慧和力量。
闂佺懓鐏氶幑浣虹矈閿燂拷
婵炴垶鎸搁鍫澝归崶鈹惧亾閻熼偊妲圭€规挸瀛╃€靛ジ鏁傞悙顒佹瘎闁诲孩绋掗崝鎺楀礉閻旂厧违濠电姴娲犻崑鎾愁潩瀹曞洨鐣虹紓鍌欑濡粓宕曢鍛浄闁挎繂鐗撳Ο瀣煙濞茶骞橀柕鍥ㄥ哺瀵剟骞嶉鐣屾殸闂佽偐鐡旈崹铏櫠閸ф顥堥柛鎾茬娴狀垶鏌曢崱妤婂剱閻㈩垱澹嗗Σ鎰板閻欌偓濞层倕霉閿濆棙绀嬮柍褜鍓氭穱铏规崲閸愨晝顩烽柨婵嗙墦濡鏌涢幒鎴烆棡闁诲氦濮ょ粚閬嶅礃椤撶姷顔掗梺璇″枔閸斿骸鈻撻幋锔藉殥妞ゆ牗绮岄埛鏍煕濞嗘劕鐏╂鐐叉喘閹秹寮崒妤佹櫃
10x Genomics闂佸搫鍊瑰姗€骞栭—娓媠ium HD 閻庢鍠掗崑鎾绘煕濮樼厧鐏犵€规洜鍠撶槐鎺楀幢濮橆剙濮冮梺鍛婂笒濡粍銇旈幖浣瑰仢闁搞儮鏅滈悾閬嶆煕韫囧濮€婵炴潙妫滈妵鎰板即閻樼數鐓佺紓浣告湰濡炶棄螞閸ф绀嗛柛鈩冡缚閳ь兛绮欓弫宥夋晸閿燂拷
濠电偛妫庨崹鑲╂崲鐎n偆鈻旈悗锝庡幗缁佺櫉wist闂侀潧妫楅敃锝囩箔婢舵劕妫樻い鎾跺仜缂嶄線鏌涢弽銊у⒈婵炲牊鍘ISPR缂備焦绋掗惄顖炲焵椤掆偓椤︿即鎮ч崫銉ゆ勃闁逞屽墴婵″鈧綆鍓氶弳鈺呮倵濞戞瑥濮冮柛鏃撴嫹
闂佸憡顨嗗ú婊呭垝韫囨稒鍤勯柣鎰嚟閵堟挳骞栭弶鎴犵闁告瑥妫濆濠氬Ω閵夛絼娴烽柣鐘辩劍瑜板啴鎮ラ敓锟� - 濠电儑绲藉畷顒勫矗閸℃ḿ顩查柛鈩冾嚧閹烘挾顩烽幖杈剧秵閸庢垵鈽夐幘顖氫壕婵炴垶鎼╂禍婊冪暦閻旇櫣纾奸柛鈩冭壘閸旀帡鎮楅崷顓炰槐闁绘稒鐟ч幏瀣箲閹伴潧鎮侀梺鍛婂笧婢ф寮抽悢鐓庣妞ゆ柨鐏濈粣娑㈡煙鐠ㄥ鍊婚悷銏ゆ煕濞嗘ê鐏ユい顐㈩儔瀹曠娀寮介顐e浮瀵悂鏁撻敓锟�
婵炴垶鎸搁鍫澝归崶顒€违濠电姴瀚惌搴ㄦ煠瀹曞洤浠滈柛鐐存尦閹藉倻鈧綆鍓氶銈夋偣閹扳晛濡虹紒銊у閹峰懎饪伴崘銊р偓濠氭煛鐎n偄濮堥柡宀€鍠庨埢鏃堝即閻樿櫕姣勯柣搴㈢⊕閸旀帡宕濋悢鐓幬ラ柨鐕傛嫹