首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
This paper proposes a new phase feature derived from the formant instantaneous characteristics for speech recognition (SR) and speaker identification (SI) systems. Using Hilbert transform (HT), the formant characteristics can be represented by instantaneous frequency (IF) and instantaneous bandwidth, namely formant instantaneous characteristics (FIC). In order to explore the importance of FIC both in SR and SI, this paper proposes different features from FIC used for SR and SI systems. When combing these new features with conventional parameters, higher identification rate can be achieved than that of using Mel-frequency cepstral coefficients (MFCC) parameters only. The experiment results show that the new features are effective characteristic parameters and can be treated as the compensation of conventional parameters for SR and SI.  相似文献   

2.
将基于多个嵌入图组合形式的半监督判别分析(SDA)以及核SDA(KSDA)应用于全监督的语音情感识别.在语音信号样本情感成分的预处理阶段,从样本语段中提取出多种特征及其统计参数,包括基音、过零率、能量、持续长度、共振峰和MFCC(Mel频率倒谱系数).在将样本特征送入分类器之前的维数约简阶段,使用经过参数优化的SDA或KSDA进行降维.Berlin语音情感数据库上的实验表明,在使用多类SVM分类器时的全监督语音情感识别中,SDA优于其他一些先进的基于谱图学习的维数约简算法,如LDA,LPP,MFA等,而KSDA通过核化的数据映射,能够取得比上述所有算法更好的识别效果.  相似文献   

3.
主要研究利用小波变换和径向基神经网络进行签名图像的分类识别.它包括不同签名图像和相似签名图像的分类识别.所提出的方法包括小波域的图像特征提取和利用径向基神经网络的模式分类.采用小波的多分辨分析方法对签名图像进行时频分析特别有效.熵和能量相关特征的概念用于小波域.径向基神经网络具有快速的收敛速度和分类能力.实验仿真证实了利用小波变换和径向基神经网络进行签名图像分类识别的有效性,且成功识别率100%.  相似文献   

4.
基于定子电流信号进行异步电机故障诊断时,转子断条和匝间短路故障特征频率分量常常被电流的基频分量淹没,利用小波变换的能量谱对其进行诊断十分必要.考虑到小波分析在时域、频域都具有表征信号局部特征的能力,能通过时频窗的灵活变换来突出信号的不同频率成分;同时还有用小波处理非平稳信号的优越性,计算出各频带所占能量,进而获取能量分布的故障特征.实践表明,通过上述分析并从能量分布的角度出发,可以快速、准确地诊断出电机故障,诊断效果好于傅里叶分析;同时也提供了一种思路,为电机故障在线实时诊断提供了理论依据.  相似文献   

5.
超材料具有天然材料所不具备的特殊电磁特性。基于分形曲线的超材料因其展现出深度亚波长与多带特性,引起广泛关注。主要研究了Hilbert分形曲线在微波频段传播的电磁特性,并对各阶曲线透射谱频率以及共振电流分布特点进行了研究,发现Hilbert分形曲线结构总长度与共振频率的波长满足近似条件下的半波理论。同时,研究了曲线结构尺寸相对于基模共振波长的亚波长特征。  相似文献   

6.
基于CHMM的高性能连续数字语音识别算法   总被引:3,自引:0,他引:3  
介绍了一种基于连续隐马尔可夫模型(CHMM)的汉语连续数字语音识别算法,该识别算法以MEL频率倒谱系数(MFCC)为主要语音特征参数,采用切割-识别方案。在此框架下,本文提出了变时窗的连续数字切割算法,并且结合了声调信息,因此最终连续数字语音识别率达到了90%以上。  相似文献   

7.
基于二维情感空间的语音情感识别   总被引:1,自引:0,他引:1  
为提高语音情感的正确识别率,在利用反映"激发维"维度信息的韵律特征基础上,提出了采用反映"评价维"维度信息的音质特征作为新的情感特征使用。再将韵律特征参数和音质特征参数结合并用于语音情感识别,并采用支持向量机分类器实现对汉语生气、高兴、悲伤、厌烦和中性五类情感的识别。试验结果表明,基于"激发维"和"评价维"二维情感空间取得的情感总体平均正确识别率为84%,比基于"激发维"一维情感空间取得的识别率高出了12%。可见同时考虑从"激发维"和"评价维"二维情感空间进行语音情感识别,识别结果得到了较大改善。  相似文献   

8.
Feature extraction of electrocardiogram(ECG) is oneof the mostimportanttasksin heart disease diagnosis .Gen-erally,these algorithms include length and energytransfor-mation[1],hidden Markov models[2],neural networks[3],and wavelet transform[4], etc . Howe…  相似文献   

9.
针对语音认证系统中高保真录音回放攻击问题,开展了录音回放攻击取证的研究,论述了基于信道模式噪声和回放语音MFCC特征参数提取的取证算法;通过labview软件编程进行仿真验证,提取了疑似回放攻击语音和原始语音信道噪声差值频谱图和疑似回放语音MFCC特征值,结果表明通过提取回放语音中信道模式噪声和MFCC特征参数并设计滤波器去噪能够识别原始语音和高保真录音的差异,为语音司法鉴定和语音认证系统的设计提供了理论依据。  相似文献   

10.
为了检测工作人员的烦躁情绪,实现情感状态的评价,通过在工作环境中诱发情感语音,获取了足够的测试样本,建立了2000条样本的工作环境情感语音数据库.在检测烦躁情绪过程中,首先提取语音的韵律特征和音质特征参数,然后利用基于蛙跳算法的改进的BP神经网络进行烦躁情绪识别.实验比较了BP,RBF和sFLA神经网络的性能,结果显示SFLA神经网络的识别率比BP神经网络高4.7%,比RBF神经网络高4.3%.实验结果表明,使用蛙跳算法训练随机初始数据可以优化神经网络的连接权重和阈值,加快收敛速度,提高识别率.  相似文献   

11.
随着语音识别技术的不断发展,特定人孤立词语音识别技术己基本成熟并逐渐开始应用于社会众多领域。而系统所追求的成本低、速度快和识别率高等目标,使主因素特征参数的选取成为其重点和难点。在实验的基础上对特征提取方法进行了深入的研究,提出了对传统Mel倒谱参数的改进方法,有效提高了系统的识别性能。  相似文献   

12.
提出一种基于交直交变频器的直流六脉波电压小电容结构和变频控制策略,实时采样母线脉动电压并依据磁链轨迹需求计算空间电压矢量调制脉宽,得到谐波含量较少的逆变输出。在仅考虑电动机感性能量回馈的情况下,根据逆变侧瞬时回馈电流大小及时间计算出直流母线最小电容参数,同时针对瞬时负载波动和转速突变产生的惯性能量回馈问题,用瞬时关断输出方法进行抑制,必要时通过能耗制动单元加以限制。通过Simulink仿真,验证小电容的计算结果和控制方法的可行性。  相似文献   

13.
情感识别是情感计算的基础,为了促进视觉情感识别技术与教育的深度融合,文章定义了教育视觉情感识别的概念,随后从技术视角分析了面部表情识别和肢体动作识别的三方面内容,即特征提取方法、分类器算法和常用数据库。此外,文章构建了双模态教育视觉情感识别模型,以解决单一模态的情感特征不能充分表达学习者学习情感信息的问题。期望这种更全面的模型,能为未来教育领域学习者情感识别研究提供参考。  相似文献   

14.
MOTIVATION Iris recognition, widely accepted as one of the best biometrics recognition methods in the world because of its stability, uniqueness and noninvasive-ness (Adler, 1965; Daugman, 1993; Ma et al., 2002; Wildes, 1997), has the potential of applications in very wide areas. As a kind of pattern recognition to classify the iris correctly by comparing the similarity between irises, two major works are: (1) to find the appropriate features to represent iris properly; and (2) to classi…  相似文献   

15.
基于韵律变换的情感说话人识别   总被引:1,自引:0,他引:1  
为了解决由情感变化引起的说话人识别性能下降问题,提出了一种新的情感说话人识别系统.首先,通过引入情感识别作为前端处理模块,对中性语音和情感语音进行分类.然后,对情感语音进行韵律修正,分别采用高斯归一化、高斯混合模型(GMM)和支持向量回归(SVR)等方法建立情感语音和中性语音的基频映射规则,并根据平均线性变化率对时长进行了修正.最后,对韵律修正后的情感语音进行识别.实验结果表明,提出的情感说话人识别系统可以有效地提高情感说话人识别的性能,识别率相比传统方法有了显著的提高.并且通过基频和时长修正的情感语音更接近于中性语音.  相似文献   

16.
针对唇语识别过程中唇部特征提取和时序关系存在的问题,提出一种卷积神经网络(CNN)和双向长短时记忆网络(Bi-LSTM)相结合的深度学习模型。利用CNN学习唇部特征,并将学习到的唇部特征送入Bi-LSTM进行时序编码,通过Softmax进行分类。建立NUMBER DATASET和PHRACE DATASET两个大型汉语数据集以解决汉语唇语数据缺失问题。将该模型与传统的唇语识别方法在两个数据集上进行实验对比,发现在NUMBER DATASET上识别准确率为81.3%,比传统方法提高了8.1%,在PHRACE DATASET上识别准确率为83.5%,比传统方法提高了9%。实验结果表明该模型能有效提高唇语识别的准确率。  相似文献   

17.
为了实现希尔伯特变换的快速计算,本文以FFT快速傅里叶变换为基础,对原算法进行了改进。将改进后的算法应用于合成地震记录计算瞬时振幅、瞬时相位和瞬时频率,获得了较好的效果。单道理论计算和实际应用表明,该方法运算效率高速度快,有助于地震资料的薄互层分析。  相似文献   

18.
为了能对金线莲品系进行方便准确地识别,提出基于PCA ̄KNN 的金线莲叶片识别方法。通过图像预处理,获得特征较为明显的叶片区域,再提取纹理和颜色特征,进行特征融合,然后采用PCA降低特征维度,提高识别精度,最后通过训练KNN 分类器完成分类。以3 个品系的金线莲为例进行鉴别试验,结果表明,提出的识别方法与其它方法相比,正确识别率更高,达到98.4%,能准确识别不同种类的金线莲。  相似文献   

19.
为了提高人体运动位姿误差检测能力,提出基于双目视觉的运动位姿误差检测方法。采用双目视觉跟踪融合识别方法对运动位姿的样本动态特征点进行采样,以全局人体姿态信息为候选样本,进行运动位姿双目视觉特征高分辨提取,采用模板匹配方法,构建人体部位姿态候选样本轮廓分布集,获取模板大小,根据模板大小计算运动位姿的误差概率分布,利用相邻图像帧之间的运动特征分布集,构建运动位姿图像的位置信息检测模型,在此基础上,采用自适应颜色覆盖方法对运动位姿的误差概率分布做极小化处理,完成对人体运动位姿误差检测。仿真结果表明,采用该方法进行运动位姿误差检测的特征分辨能力很好,降低了检测误差,提高了运动位姿双目视觉跟踪识别能力。  相似文献   

20.
为了改善传统脑电情绪识别方法需要对脑电信号进行深入了解,且需要人工提取相关特征的缺点,基于深度森林的表征学习能力对脑电样本的时域与频域数据进行自动特征提取,并融合32通道脑电信号的时域特征向量和频域特征向量,通过级联森林对特征作进一步学习。实验结果表明,该方法对效价二分类预测的准确率达到68.4%,查准率达到66.3%,查全率达到89.9%,F1分数达到76.3%;对唤醒度二分类预测的准确率达到68.2%,查准率达到65.8%,查全率达到91.2%,F1分数达到76.4%。通过与DEAP数据集使用EEG信号给出的二分类实验结果进行对比,基于深度森林的脑电情绪识别方法对未知样本的识别准确率高于DEAP的结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号