
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用AWS云技术的音频情感检测应用程序
《Recent Advances in Computer Science and Communications》:Audio Emotion Detection Application Utilizing AWS Cloud
【字体: 大 中 小 】 时间:2025年11月09日 来源:Recent Advances in Computer Science and Communications CS2.5
编辑推荐:
音频情绪分析系统设计及性能验证。针对实时处理效率低和准确率不足的问题,提出基于AWS云服务的可扩展架构,采用卷积神经网络等机器学习模型,在SAVEE和RAVDESS数据集上分别达到94%和93%加权准确率,优于现有基线方法。
引言:如今,许多应用程序试图通过音频数据来理解用户情绪,从而提升用户的参与度和体验。然而,现有的系统往往缺乏实时处理和准确情感检测所需的效率。开发一个能够从音频文件上传中检测情感的系统,需要一个能够满足用户需求、确保数据安全处理,并集成人工智能服务进行情感分析的基础设施。关键挑战在于设计一个可扩展、安全、成本效益高且能够快速分析音频文件中情感的云架构。
目标:为了解决上述挑战,本文提出了一种基于云的系统,该系统允许用户上传音频文件,分析这些文件以识别情感(如愤怒、平静、厌恶、恐惧、快乐、中立、悲伤、惊讶等),并及时将检测到的情感反馈给用户。
方法:为了训练和测试所使用的模型,收集了两个开放数据集:Surrey Audio-Visual Expressed Emotion (SAVEE) 和 Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS),并使用 AWS 云服务进行训练。
结果与讨论:与现有的方法相比,所提出的方法在 RAVDESS 和 SAVEE 数据集上的表现更佳,分别实现了 93% 和 94% 的加权准确率,而四个基线方法的加权准确率分别为 RAVDESS 数据集的 71%、73% 和 77%,SAVEE 数据集的 67%。
结论:该系统架构设计得具有可扩展性和灵活性,适用于各种应用场景,从而显著增强了用户互动体验。
生物通微信公众号
知名企业招聘