首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于韵律变换的情感说话人识别   总被引:1,自引:0,他引:1  
为了解决由情感变化引起的说话人识别性能下降问题,提出了一种新的情感说话人识别系统.首先,通过引入情感识别作为前端处理模块,对中性语音和情感语音进行分类.然后,对情感语音进行韵律修正,分别采用高斯归一化、高斯混合模型(GMM)和支持向量回归(SVR)等方法建立情感语音和中性语音的基频映射规则,并根据平均线性变化率对时长进行了修正.最后,对韵律修正后的情感语音进行识别.实验结果表明,提出的情感说话人识别系统可以有效地提高情感说话人识别的性能,识别率相比传统方法有了显著的提高.并且通过基频和时长修正的情感语音更接近于中性语音.  相似文献   

2.
在与人交互情况下,针对物体识别系统通过反馈信息自动优化识别能力问题,提出一种结合梯度直方图(HOG)特征提取和支持向量机(SVM)进行特定物体识别的方法。运用Tensorflow训练语音识别模型反馈人机交互信息,使系统实现自优化。以手表类别作为识别对象,通过HOG特征描述对手表进行特征提取,通过二维主成分分析(2DPCA)和线性判别分析(LDA)对整体和局部特征进行降维,运用改进的空间金字塔匹配模型通过SVM对其分类,并运用非极大值抑制(NMS)确定区域,运用训练的梅尔倒谱(MFCC)特征语音识别模型对反馈信息进行识别,最终整合信息优化识别系统。实验表明,该系统对手表有较高的识别率,并能通过人机交流在较短时间内使系统实现自优化。  相似文献   

3.
说话人识别系统是在语音信号中提取说话人信息来鉴别说话人身份.整个系统以DSP处理器为核心结构,进行训练和识别语音信号.采用LPC和DTW作为核心算法来进行说话人识别.  相似文献   

4.
以DSP实现基于概率DP匹配算法的说话人识别系统   总被引:1,自引:0,他引:1  
提出了利用概率DP匹配算法进行说话人识别的的设想。并给出了运用TMS320C5416实现说话人自动识别系统的方案。该系统利用一种新的语音信号r阶的倒谱线性回归系数等参数构成识别的特征矢量集,运用提出的概率DP匹配算法进行与文本无关的说话人识别。实验结果表明该系统具有识别精度高、识别速度快,占用系统资源少等特点,是一种有效的说话人自动识别的实现方法。  相似文献   

5.
根据说话人识别系统结构,为了使系统识别率得到有效提高,在特征提取方面,将美尔倒谱系数与其一阶差分结合在一起形成新的特征参数。在识别算法方面,对基本的VQ识别算法进行了改进,提出了一种新的矢量量化识别方法,即基于方差的加权失真测度的矢量量化,并通过大量实验进行了论证。  相似文献   

6.
说话人识别可以看作语音识别的一种,本文研究了MFCC参数的提取方法,并对矢量量化VQ的识别模型进行了讨论,设计出了一种可行的识别方法,通过验证,这种方法对于文本有关的说话人识别,可达到较高的识别率.  相似文献   

7.
在VC++环境下,提取PLAR特征参数,基于听觉特性和语谱特性的语音增强器作为预处理器,对语音信号首先进行降噪处理,建立了基于DTW的抗噪声说话人识别系统.实验结果表明,即使在信噪比比较低的情况下,该系统都会在一定程度上提高多种噪声环境下说话人识别系统的识别性能.  相似文献   

8.
针对各种连续数字语音信号,实现了一种基于TMS320C5x评价模块(EVM)和定点数字信号处理器ADSP2181的与特定人无关的连续数字语音识别系统。在分析了连续概率密度的隐马尔可夫模型(CDHMM)基础上,利用LPC倒谱系数、LPC差分倒谱系数、能量归一化系数及其差分系数作为语音特征矢量,训练和识别采用Viterbi算法和Baum-Welch重估算法,并利用ADSP2181实现语音识别的算法。有效地提高了系统的识别率。给出了实现各个阶段所需的时间,比较了不同语音特征参数对识别率的影响。在具体实现中,着重处理了抗噪、定点实时实现及连续数字串识别人的身份等问题。实验结果表明,本系统在普通环境下取得较满意的效果,正确识别率达到93.2%,为其实用化提供了较为重要的技术途径。  相似文献   

9.
声纹识别技术,形象的说法就是说话人识别技术。它是根据人在说话时产生的波形,以及波形中反映人类心理和生理的特征参数来判断说话人的身份的技术。本文所研究的是与文本有关的说话人确认系统。比较了基于声道的线性预测倒谱系数(LPCC)和基于听觉特性的MEL频率倒谱系数(MFCC)参数特征,得出MFCC对环境存在更高的鲁棒性。并运用了隐形马尔可夫模型(HMM)在MATLAB上实现了语音数字的识别仿真。本实验系统的识别率达到了90%,验证了HMM模型识别的准确性。  相似文献   

10.
语音识别技术及应用   总被引:5,自引:0,他引:5  
语音识别技术近年来得到了飞速的发展并且在越来越多的领域得到了广泛的应用。隐马尔可夫模型(HMM)语音识别技术是一种基于训练数据提供的概率自动构造识别系统的技术,主要用于大量词汇的语音识别,而且具有良好的识别性能和抗噪性能。因此,一般的语音识别系统都采用基于HMM的识别方法作为其基本算法。本文列举了语音识别在教学中的应用示例来分析其基本算法。  相似文献   

11.
语音识别系统的进展陈英,柯林新发展意味着语音识别系统可能很快成为一种普通工具。几十年来,对能够识别语音的计算机的期望激发了研究人员和科幻作家的想象力。但早期的语音识别系统需要使用者说话非常慢,每个字间都要停顿。现在,语音识别技术可能处于一个转折点。随...  相似文献   

12.
基于Matlab设计了以动态时间规整(dynamic time warping,DTW)算法和Mel频率倒谱系数(Mel frequency cepstrum coefficients,MFCC)参数提取算法为基础的孤立词自动语音识别系统;然后结合机器人语音识别的需求,基于凌阳SPCE061A设计了语音识别应用系统。结合上述两部分工作,设计、实现了机器人语音识别系统演示实验和机器人语音识别半开放实验,实现效果达到预期实验设计目标。  相似文献   

13.
黄浩  朱杰 《东南大学学报》2007,23(2):174-178
提出了2种解决汉语语音识别中声调问题的方法:利用区分性方法对基于隐马尔可夫模型(HMM)的声调模型进行训练;提出将区分性训练的声调模型加入大词汇量连续语音识别系统的最优方法,该方法根据最小音子错误的训练准则以及利用扩展Baum-Welch算法区分性训练与模型相关的概率权重,对声学模型以及声调模型概率进行加权.实验结果表明区分性训练的声调模型能够显著地提高连续语音声调识别率以及大词汇量语音识别系统的识别率,同时区分性的模型权重训练能够在区分性声调模型加入连续语音识别系统之后进一步提高系统的识别性能.  相似文献   

14.
利用函数逼近原理和主成份分析方法,提出了一种可用于解决语音信号时间规正和简化神经网络结构的语音信号主分量特征.该特征的提取过程模拟了人耳听觉系统的信息感知过程.实验结果表明基于该特征的语音识别系统可以取得比一般的CDHMM和GMDS方法更好的识别效果  相似文献   

15.
借助语音增强、基音频率分析和共振峰分析,设计了简单的说话人识别系统.在识别过程中以平均基音频率、共振峰峰值位置作为两种评价标准,交互印证,最终实现了说话人的身份辨认.  相似文献   

16.
言语过滤识别   总被引:1,自引:0,他引:1  
本文提出了一种新型的说话人识别方法——言语过滤识别。有别于传统的说话人识剐方法的是,言语过滤识别方法分为四步:(1)提问式问答;(2)语义校验;(3)语料过滤;(4)声纹比对。言语过滤识剐方法通过语音识别方法部分过滤了复杂背景的影响,提高了说话人识别的性能。此外,言语过滤识别在辩认“活体声纹”方面有先天性的优势.通过合理设计提问问题和时问题答案的校验,可有效防止冒用者:  相似文献   

17.
在语音信号处理领域,端点检测作为语音信号处理的初始化工作,有效合理的端点检测方法不仅可以减少数据的存储量和处理时间,而且可以排除无声段的噪声干扰,使语音的后续处理更加准确.本文为医疗语音信号处理提供一种医院噪声环境下医疗语音信号的端点检测方法.综合采用频域下的特征倒谱距离、能量谱、能量谱方差、统计学特征谱熵值4种特征作为控制条件判断语音的端点.通过设计软件验证了算法的有效性.  相似文献   

18.
随着语音识别技术的不断发展,特定人孤立词语音识别技术己基本成熟并逐渐开始应用于社会众多领域。而系统所追求的成本低、速度快和识别率高等目标,使主因素特征参数的选取成为其重点和难点。在实验的基础上对特征提取方法进行了深入的研究,提出了对传统Mel倒谱参数的改进方法,有效提高了系统的识别性能。  相似文献   

19.
在语音识别系统中,针对汉语普通话语音特点,增加采用分层级多参数加权综合的检测方法,以感知线索为依据,对连续语音流中的辅音性、阻塞性、擦音性、送气性、响音性、延续性、鼻音性、元音性、后位性等区别特征和语音特征的声学地标进行检测和分割。算法充分考虑了不同说话人、语音语境、语速和说话风格对声学地标的影响,这有助于提高检测和分割的准确率和鲁棒性。  相似文献   

20.
以VC++6.0为开发平台,实现一个基于隐马尔可夫模型(Hidden Markov Model,简称HMM)非特定人的安多藏语孤立词语音识别系统。对有声段语音进行MFCC参数的提取,对提取后的MFCC参数进行矢量量化后训练HMM模型,形成特征模板库,最后进行识别。根据安多藏语的特点,改进端点检测的方法,提高了孤立词语音信号检测的准确性,并进一步提高了识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号