首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于CNN和XLNet的音乐多模态情感分析方法
引用本文:张晶晶,陈伟,李庆珍.基于CNN和XLNet的音乐多模态情感分析方法[J].贵阳学院学报(自然科学版),2023(2):34-39.
作者姓名:张晶晶  陈伟  李庆珍
作者单位:1. 淮南联合大学人文与外国语学院;2. 淮南联合大学信息工程学院;3. 中国政法大学数据法治研究院
基金项目:2020年安徽省教育厅人文社会科学研究重点项目(项目编号:SK2020A0693);
摘    要:在情感分析领域,仅依靠文本等单一模态进行情感分析,限制了从多模态数据中提取多样化特征的能力,限制了情感分析结果的准确度和鲁棒性。为此,提出了融合音频分析网络和文本分析网络的多模态情感分析方法。其中,利用预训练卷积神经网络(CNN)和迁移学习技术进行基于Mel频谱图的音频情感分类,通过改进的XLNet模型执行歌词文本的特征提取和情感分类任务。CNN和XLNet输出包含概率权重和不同情感值的情感预测矩阵,最后使用堆叠集成方法合并不同模态的输出结果,完成多模态情感分类。在自建民族音乐数据集的消融实验证明,多模态方法具有良好的互补性,在情感识别任务中的性能显著优于单模态方法。公开数据集结果表明,所提方法的分类准确度达到83.75%,优于其他先进方法。

关 键 词:多模态数据  卷积神经网络  Mel频谱图  堆叠集成法  音乐情感分析
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号