首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
以VC++6.0为开发平台,实现一个基于隐马尔可夫模型(Hidden Markov Model,简称HMM)非特定人的安多藏语孤立词语音识别系统。对有声段语音进行MFCC参数的提取,对提取后的MFCC参数进行矢量量化后训练HMM模型,形成特征模板库,最后进行识别。根据安多藏语的特点,改进端点检测的方法,提高了孤立词语音信号检测的准确性,并进一步提高了识别率。  相似文献   

2.
黄浩  朱杰 《东南大学学报》2007,23(2):174-178
提出了2种解决汉语语音识别中声调问题的方法:利用区分性方法对基于隐马尔可夫模型(HMM)的声调模型进行训练;提出将区分性训练的声调模型加入大词汇量连续语音识别系统的最优方法,该方法根据最小音子错误的训练准则以及利用扩展Baum-Welch算法区分性训练与模型相关的概率权重,对声学模型以及声调模型概率进行加权.实验结果表明区分性训练的声调模型能够显著地提高连续语音声调识别率以及大词汇量语音识别系统的识别率,同时区分性的模型权重训练能够在区分性声调模型加入连续语音识别系统之后进一步提高系统的识别性能.  相似文献   

3.
隐马尔可夫模型(HMM)及其应用   总被引:3,自引:0,他引:3  
隐马尔可夫模型(HMM)是序列数据处理和统计学习的一种重要概率模型,具有建模简单、数据计算量小、运行速度快、识别率高等特点,近几年来已经被成功应用到许多工程任务中.文章介绍了隐马尔可夫模型,并对HMM及其改进的HMM在语音处理技术、人脸识别和人脸表情识别中的应用进行了叙述.  相似文献   

4.
本文分析了隐尔可夫模型(HMM)的参数迭代与语音识别问题,导出了一系列的参数寻优迭代公式,利用这组迭代公式,不易产生计算时的上溢与下溢,有效地提高了HMM语音识别系统的识别率与可靠。  相似文献   

5.
HTK(是一套专门用于建立和处理删的语音处理工具箱,主要应用于语音识别领域,也可用于语音合成、字符识别、模拟DNA排序等多个领域.本文结合隐马尔可夫模型(HMM)原理,利用HTK(HMM ToolKit)语音处理工具箱,实现了汉语数码语音识别系统.实验表明,该系统具有较好的语音识别率,且便于进行二次开发.  相似文献   

6.
语音识别技术及应用   总被引:5,自引:0,他引:5  
语音识别技术近年来得到了飞速的发展并且在越来越多的领域得到了广泛的应用。隐马尔可夫模型(HMM)语音识别技术是一种基于训练数据提供的概率自动构造识别系统的技术,主要用于大量词汇的语音识别,而且具有良好的识别性能和抗噪性能。因此,一般的语音识别系统都采用基于HMM的识别方法作为其基本算法。本文列举了语音识别在教学中的应用示例来分析其基本算法。  相似文献   

7.
提出了一种新的用于语音识别的HMM MLP混合网络 ,它利用MLP的鉴别训练能力 ,以克服基本HMM的ML训练方法中不合理的模型正确性假设前提 ,提高HMM的鉴别能力和识别性能 .实验结果证明HMM MLP混合网络的鉴别能力和识别性能明显高于普通HMM .  相似文献   

8.
为了更好地识别强干扰下的地震信号,介绍了一种改进的小波阈值去噪法对天然地震信号和人工爆破信号去噪.去噪后的信号经过经验模态分解之后,取第一个IMF分量.经过希尔伯特黄变换之后提取HHT谱幅比特征和自相关函数的均值特征,利用支持向量机建立天然地震和人工爆破的模型.在利用建立的模型识别已知的震源类型,判断改进的去噪法对震源类型识别的效果.实验结果表明:去噪法改进之后,对天然地震和人工爆破的识别率有显著的提高.  相似文献   

9.
针对各种连续数字语音信号,实现了一种基于TMS320C5x评价模块(EVM)和定点数字信号处理器ADSP2181的与特定人无关的连续数字语音识别系统。在分析了连续概率密度的隐马尔可夫模型(CDHMM)基础上,利用LPC倒谱系数、LPC差分倒谱系数、能量归一化系数及其差分系数作为语音特征矢量,训练和识别采用Viterbi算法和Baum-Welch重估算法,并利用ADSP2181实现语音识别的算法。有效地提高了系统的识别率。给出了实现各个阶段所需的时间,比较了不同语音特征参数对识别率的影响。在具体实现中,着重处理了抗噪、定点实时实现及连续数字串识别人的身份等问题。实验结果表明,本系统在普通环境下取得较满意的效果,正确识别率达到93.2%,为其实用化提供了较为重要的技术途径。  相似文献   

10.
介绍了一种基于多重隐马尔克夫模型(Multiple HMM——MHMM)的手写体汉字识别新方法。该方法首先提取基于区域投影变换形成的边界链码特征,对每个汉字建立4个HMM,通过等比重综合方法将4个分类器的计算结果进行综合,从而得到识别结果。实验结果证明该方法较传统的HMM具有更高的抗干扰能力和更高的识别率。  相似文献   

11.
在VC++环境下,提取PLAR特征参数,基于听觉特性和语谱特性的语音增强器作为预处理器,对语音信号首先进行降噪处理,建立了基于DTW的抗噪声说话人识别系统.实验结果表明,即使在信噪比比较低的情况下,该系统都会在一定程度上提高多种噪声环境下说话人识别系统的识别性能.  相似文献   

12.
针对非平稳噪声环境下的语音活动检测问题,提出了基于在线单类SVM的自适应语音活动检测算法。该算法采用单类SVM对多种特征信息进行在线学习与综合,为非平稳背景噪声建模,并采用双层决策机制,能有效提高语音活动检测的稳健性。在语音识别系统中的实验结果表明,算法在多种噪声环境和信噪比条件下有效,并明显提高了在非平稳噪声环境下的识别率。  相似文献   

13.
可靠的语音端点检测算法是稳健语音识别系统所必须的。针对现有算法在噪声环境下的稳健性问题,提出了基于单类SVM(Support Vecfor Machine)的端点检测算法。通过对多特征信息进行在线学习与综合,以及采用双层决策机制,有效提高了语音检测的稳健性。实验表明,算法在多种噪声环境和信噪比条件下有效,明显提高了语音识别系统在噪声环境下的识别率。  相似文献   

14.
语音信号是非平稳的短时瞬态信号,有用信号与所含噪声处于同一频率段,采用滤波器形式的传统去噪方法,不能将噪声有效分离。小波变换具有时频局部分析的特点,通过将含噪信号进行分解,分离噪声信号,将有用信号进行重构,可有效地去除噪声。白噪声为平稳随机信号,在不同尺度上的小波变换是不相关的。本文根据白噪声和语音信号在不同尺度下的相关性表现,结合小波去噪的基本思想,提出一种基于相关函数的小波变换进行语音去噪的方法。经MATLAB仿真,相关函数确定的去噪方法,能有效去除语音信号的白噪声。  相似文献   

15.
语音识别中的端点检测技术是语音识别的基础,低信噪比环境下的端点检测很大程度决定语音识别工作的有效进行.提出了一种利用一阶有限差分商结合折半查找来判定语音端点检测的方法,提高了端点检测的准确率.仿真实验表明,在噪声环境下该方法较好地实现了语音端点检测.  相似文献   

16.
黏着性语音的元辅音区别性特征对口语环境下的连续语音识别影响很大。通过维吾尔语和谐语音现象下的发音规律及其规则,采用语言学、实验语音学技术和数字语音信号处理等方法,研究和谐发音现象下的元音、辅音区别特征系统,建立扩展元辅音集,并以此为基础,开展基于扩展元辅音集的连续语音识别研究,进一步通过其声学模型比较研究,构建连续语音识别模型,为维吾尔语口语环境下的连续语音识别提供一种新方法。  相似文献   

17.
将基于多个嵌入图组合形式的半监督判别分析(SDA)以及核SDA(KSDA)应用于全监督的语音情感识别.在语音信号样本情感成分的预处理阶段,从样本语段中提取出多种特征及其统计参数,包括基音、过零率、能量、持续长度、共振峰和MFCC(Mel频率倒谱系数).在将样本特征送入分类器之前的维数约简阶段,使用经过参数优化的SDA或KSDA进行降维.Berlin语音情感数据库上的实验表明,在使用多类SVM分类器时的全监督语音情感识别中,SDA优于其他一些先进的基于谱图学习的维数约简算法,如LDA,LPP,MFA等,而KSDA通过核化的数据映射,能够取得比上述所有算法更好的识别效果.  相似文献   

18.
以DSP实现基于概率DP匹配算法的说话人识别系统   总被引:1,自引:0,他引:1  
提出了利用概率DP匹配算法进行说话人识别的的设想。并给出了运用TMS320C5416实现说话人自动识别系统的方案。该系统利用一种新的语音信号r阶的倒谱线性回归系数等参数构成识别的特征矢量集,运用提出的概率DP匹配算法进行与文本无关的说话人识别。实验结果表明该系统具有识别精度高、识别速度快,占用系统资源少等特点,是一种有效的说话人自动识别的实现方法。  相似文献   

19.
当今人工智能发展迅速,语音识别成为人机交互的重要方式。为提高语音识别准确度,在分析语音信号前去除语音信号噪声干扰并提高语音信号能量尤为重要。在实际应用中,不同语音信号包含不同的噪声。针对不同的语音噪声,在传统谱减法基础上,通过判断算法窗函数,根据不同的噪声能量改变多窗谱减法的过减因子参数,以增强算法自适应能力。仿真结果表明,在低信噪比情况下,通过改变过减因子值,可取得一个最优过减因子值以改进谱减法下的音乐噪声和失真度。自适应多窗谱减法改进后与基本谱减法相比,信噪比提高了 29%;与多窗谱减法相比,信噪比提高了 16%。该自适应多窗谱减法可适应不同噪声环境下的语音信号,增强语音信号中的关键信息并减少噪声干扰。  相似文献   

20.
基于韵律变换的情感说话人识别   总被引:1,自引:0,他引:1  
为了解决由情感变化引起的说话人识别性能下降问题,提出了一种新的情感说话人识别系统.首先,通过引入情感识别作为前端处理模块,对中性语音和情感语音进行分类.然后,对情感语音进行韵律修正,分别采用高斯归一化、高斯混合模型(GMM)和支持向量回归(SVR)等方法建立情感语音和中性语音的基频映射规则,并根据平均线性变化率对时长进行了修正.最后,对韵律修正后的情感语音进行识别.实验结果表明,提出的情感说话人识别系统可以有效地提高情感说话人识别的性能,识别率相比传统方法有了显著的提高.并且通过基频和时长修正的情感语音更接近于中性语音.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号