首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 269 毫秒
1.
针对老年人的语音情感识别问题,提出一种基于语谱图的老年人语音情感识别方法。首先采用一种改进的基于先验信噪比的维纳滤波算法,针对老人语音情感库EESDB进行语音增强,选取合适的语音情感库,对语音进行语谱图特征提取与规范化,然后分析卷积神经网络(CNN)的结构并选定Cifar10网络对语谱图进行分类,最后采用3种方案进行对比实验。实验结果取得了较高的情感识别率,表明了该方法的有效性和可行性。  相似文献   

2.
为解决跨数据库语音情感识别领域中实验数据集特征不匹配的问题,提出一种基于时频原子的听觉注意特征提取模型.首先,为了提取频谱特征,引入听觉注意模型对多类情感特征进行有效的探测.然后,利用选择注意机制改进了提取的语谱图特征,其中包含的显著性信息与跨库识别性能有紧密联系.再引入Chirplet时频原子,通过形成的过完备原子库提高语谱图特征的信息量.来自多个数据库的样本具有多成分分布的特征,据此所提模型中的Chirplet扩大了特征向量在时频域上的尺度.实验结果显示,相比传统特征模型,所提方法性能有显著提升.此外,该方法在训练集和测试集来源不一致情况下具有更好的鲁棒性.  相似文献   

3.
传统语音情感识别算法模型结构较为简单,需要足够量级的训练数据才能使其具有一定的实用性.然而,在实际应用中可供训练的数据集较少.为解决上述问题,提出了一种语音情感深度迁移识别算法.通过属性分析表构建、特征提取、相关性计算等操作确定源域数据集,并在此基础上训练迁移学习并构建预训练模型,最终构成语音情感分类模型.实验结果表明...  相似文献   

4.
声目标识别技术研究   总被引:2,自引:0,他引:2  
本文对声目标识别的关键技术进行研究,探讨用小波分析来进行声信号处理和特征提取,用BP神经网络和支持向量机的模式分类方法来进行分类识别.通过对四种声信号的仿真实验表明,使用小波变换和人工神经网络技术及支持向量机分类技术相结合对声目标进行识别是有效、可行的.  相似文献   

5.
研究了使用卷积神经网络((Convolutional Neural Networks,CNNS)构造模式分类器,并用于文本/图像分割和文本检测的可能性.CNNs可以避免显式(直接)特征取样.更为重要的是,CNNs能直接运作于灰度图像,使其应用变得直截了当.对诸如卷积核尺度、网络收敛速度等具体算法实现问题进行了讨论,并给出CNNs在汉字文本/图像分割和文本检测方面的各种实验结果.  相似文献   

6.
对具有字数少、噪声多、特征稀疏等特点的中文产品评论数据建立了一种基于机器学习的情感分类模型,旨在提高情感倾向性判别的综合评价指标F值。结合知网(HowNet)情感词典提出了一种通过增加情感词比重的C-TF-IDF权重计算方法,弥补了词频-逆向文档频率IF-IDF仅依靠词频来衡量特征项权重的缺点。先对一步三分法和二步二分法的情感分类策略进行了实验对比分析;然后选取了一步三分法对不同特征提取数量下的情感分类效果进行了研究。实验结果表明,C-TF-IDF比TF-IDF更适合于中文产品评论数据的情感分类任务,F值可最低提高1.584%,最大提高2.267%。  相似文献   

7.
通过使用单次提取脑电信号的分类技术进行情绪词的脑电(EEG)识别研究.以中文情绪双字词为实验材料,通过其诱发的EEG信号,对正性词与中性词、负性词与中性词分别进行分类.使用时域正则化的共空间模式对单次提取脑电信号进行特征提取,并利用线性判别分析方法进行特征分类,分类准确率集中于55%~65%.置换检验验证了实验分类准确率的统计学显著性,表明了情绪词和中性词的成功识别,也有效地证实了基于脑电信号的语言情绪信息的可识别性.此外,在15名被试中,10名被试的负性词与中性词识别率显著,而仅有4名被试的正性词与中性词识别率显著,说明负性情绪更易被识别.  相似文献   

8.
目标噪声特征提取是被动声纳目标识别系统的关键技术。针对被动声纳目标识别,着重研究了一种调制连续谱特征提取方法,并采用自适应遗传BP算法的神经网络分类器对海上实录的三类目标噪声进行了分类识别,实验结果表明该被动声纳目标识别系统具有很好的分类效果。  相似文献   

9.
针对唇语识别过程中唇部特征提取和时序关系存在的问题,提出一种卷积神经网络(CNN)和双向长短时记忆网络(Bi-LSTM)相结合的深度学习模型。利用CNN学习唇部特征,并将学习到的唇部特征送入Bi-LSTM进行时序编码,通过Softmax进行分类。建立NUMBER DATASET和PHRACE DATASET两个大型汉语数据集以解决汉语唇语数据缺失问题。将该模型与传统的唇语识别方法在两个数据集上进行实验对比,发现在NUMBER DATASET上识别准确率为81.3%,比传统方法提高了8.1%,在PHRACE DATASET上识别准确率为83.5%,比传统方法提高了9%。实验结果表明该模型能有效提高唇语识别的准确率。  相似文献   

10.
光学字符识别中,特征提取与分类是最关键的步骤,文中采用Gabor变换来提取图像特征,结合最近邻分类器进行分类识别,实现了对中文字符的准确识别.实验表明,该方法具有较好的抗干扰性.  相似文献   

11.
文本自动分类技术是自然语言处理的一个重要的应用领域,是替代传统的繁杂人工分类方法的有效手段和必然趋势.本文简要介绍了文本分类的特征提取算法,并通过实验比较了各种提取算法在KNN中的性能.实验表明IG、MI、CE、χ2、WE五种特征提取方法在KNN分类器中性能接近,互信息(MI)特征提取方法随着特征数的提高分类性能提高地较快,当特征数目较小的时候分类性能极差.  相似文献   

12.
主要研究利用小波变换和径向基神经网络进行签名图像的分类识别.它包括不同签名图像和相似签名图像的分类识别.所提出的方法包括小波域的图像特征提取和利用径向基神经网络的模式分类.采用小波的多分辨分析方法对签名图像进行时频分析特别有效.熵和能量相关特征的概念用于小波域.径向基神经网络具有快速的收敛速度和分类能力.实验仿真证实了利用小波变换和径向基神经网络进行签名图像分类识别的有效性,且成功识别率100%.  相似文献   

13.
鉴于某双层圆柱壳体的机械振动噪声数据结构复杂、维数较高,工程上不宜直接分析,文章提出先对其进行特征提取后再进一步分析的思路,可有效简化数据结构,提高数据分析的准确度。选择工程上常用的主成分分析法(PCA)、核主成分分析法(KPCA)与独立成分分析法(ICA)对文中高维机械振动噪声数据进行特征提取。利用支持向量机(SVM)的分类识别能力,对经特征提取后不同工况下的噪声数据进行分类识别。依据正确识别率大小比较三种方法的特征提取效果,以选择针对某双层圆柱壳体机械振动噪声数据合适的特征提取方法。结论可为深入分析某双层圆柱壳体机械振动噪声数据的规律特点打下良好基础。  相似文献   

14.
结合Gabor小波变换的特征提取算法提出了一种基于决策模板的多分类支持向量机.该方法在对JAFFE基本表情数据库进行训练并测试时获得了较高的正确率,实验结果表明该方法是一种有效的表情识别算法.  相似文献   

15.
为解决水下目标的特征提取与识别问题,通过对被动地质呐目标噪声频谱特性的深入分析,给出了一种基于Welch谱估计的目标特征提取方法。对海上实录的多种型号和多种工况的大量噪声样本进行了特征提取,采用BP神经网络和最近邻法对噪声样本进行了分类识别实验,结果证实了所提方法的可行性和有效性。研究结果可以用于被动声呐目标识别。  相似文献   

16.
人脸表情是人类交流的一种重要的沟通方式,面部表情的识别有着广泛的应用领域,主要包括了人脸检测、表情特征提取和表情分类这3个关键环节。介绍了支撑向量机的基本原理,认为因其强大的分类能力,已被成功应用到人脸检测、人脸的姿态估计、人脸识别和语音情感识别中,且实验表明在表情识别方面亦能取得较高的识别率。  相似文献   

17.
为了提高脱机手写藏文字符的识别效果,提出了一种在小波变换基础上计算局部梯度方向直方图的特征提取方法.首先,对一个脱机手写藏文字符样本图像进行一次Haar小波变换,得到相应的一级近似分量;然后,将这个一级近似分量划分成几个等尺寸的子区域;最后,计算每个等尺寸子区域的局部梯度方向直方图,并将所有子区域的全部局部梯度方向直方图的值作为该字符图片的特征.在最近建立的脱机手写藏文字符样本数据库(THCDB)上的实验结果表明:提出的特征提取方法识别效率较高,且识别效果较好;和细节分量相比,近似分量对提高识别精度具有更大的贡献.  相似文献   

18.
将基于多个嵌入图组合形式的半监督判别分析(SDA)以及核SDA(KSDA)应用于全监督的语音情感识别.在语音信号样本情感成分的预处理阶段,从样本语段中提取出多种特征及其统计参数,包括基音、过零率、能量、持续长度、共振峰和MFCC(Mel频率倒谱系数).在将样本特征送入分类器之前的维数约简阶段,使用经过参数优化的SDA或KSDA进行降维.Berlin语音情感数据库上的实验表明,在使用多类SVM分类器时的全监督语音情感识别中,SDA优于其他一些先进的基于谱图学习的维数约简算法,如LDA,LPP,MFA等,而KSDA通过核化的数据映射,能够取得比上述所有算法更好的识别效果.  相似文献   

19.
深度神经网络模型通常使用注意力机制或融合卷积神经网络来提取特征,但由于注意力机制抓取的特征过于单一,存在提取特征不完善的问题。 将循环机制引入卷积神经网络中,构建了具有双循环结构的网络模型(DRCNN),从而改善模型的特征提取能力,将其与双向长短期记忆网络结合,提出一种带有注意力机制、特征提取能力更强的混合模型(BiLSTM-DRCNN)并应用于情感分类任务中。通过情感分类的实验分析表明,BiLSTM-DRCNN 神经网络模型具有比较好的性能,与融合卷积神经网络(CNN)和双循环长短期记忆神经网络(BiLSTM)模型相比,综合评价指标提高2%以上;与BiLSTM-CNN、Fusion Model 模型相比,综合评价指标提高了近1%,且收敛速度更快。  相似文献   

20.
为了提高语音情感识别的准确度,探讨了将Transformer应用于语音情感识别的可能性.将对数梅尔尺度谱图及其一阶差分特征相融合作为输入,使用Transformer来提取分层语音表示,分析注意头个数和Transformer编码器层数的变化对识别精度的影响.结果表明,在ABC、CASIA、DES、EMODB和IEMOCAP语音情感数据库上,相比以MFCC为特征的Transformer,所提模型的精度分别提高了13.98%、8.14%、24.34%、8.16%和20.9%.该模型表现优于递归神经网络(RNN)、卷积神经网络(CNN)、Transformer等其他模型.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号