首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
提出了一种新的语音识别方法,该方法综合了VQ和离散HMM算法,在每个状态通过用矢量量化误差值取代传统的HMM输出概率值来建立VQ-HMM.介绍了VQ-HMM,并通过非特定人汉语数码语音识别实验对其识别性能与传统的HMM作了相应的比较.实验结果表明该方法识别效果优于传统的HMM.,In this paper, a new speech recognition method was proposed, which integrated a VQ-distortion measure and a discrete HMM. The VQ-HMM uses a VQ-distortion measure at each state instead of a discrete output probability used by a discrete HMM. The VQ-HMM is described, and its speech recognition performance is compared with the conventional HMMs through the experiments on speaker-independent Chinese spoken digit recognition. The comparisons confirm that the new method over-performed traditional HMMs.  相似文献   

2.
设计与实现了基于微软Kinect摄像机的在线空中手写汉字交互输入与识别实验平台。在研究现有联机手写汉字识别的方法基础上,提出了基于视觉汉字笔画顺序和统计特征的空中手写汉字特征向量提取方法,并利用流形学习方法训练大汉字集的低维流形表示和显式映射函数,结合邻域搜索策略和语义联想可实时高效的进行空中手写汉字识别。该实验平台为空中手写汉字识别方法提供了的客观分析、评价的方式和手段。  相似文献   

3.
提出了一种新的用于语音识别的HMM MLP混合网络 ,它利用MLP的鉴别训练能力 ,以克服基本HMM的ML训练方法中不合理的模型正确性假设前提 ,提高HMM的鉴别能力和识别性能 .实验结果证明HMM MLP混合网络的鉴别能力和识别性能明显高于普通HMM .  相似文献   

4.
采用软硬件协同设计的方法,搭建了一个高效地基于隐马尔可夫模型(Hidden Markov Model,HMM)语音识别的FPGA实验验证平台。结合FPGA结构特点,直接使用加法器、乘法器、比较器等建立一个Viterbi算法结构,采用改进的方法计算Viterbi得分和预计算逻辑实现了一种简单的基于HMM的语音模板匹配。实验表明该实现方案是切实可行的,FPGA实验验证平台有利于资源复用,减少工作量,并易于调试,为语音识别其他功能模块的嵌入炎设计打下良好基础.  相似文献   

5.
声纹识别技术,形象的说法就是说话人识别技术。它是根据人在说话时产生的波形,以及波形中反映人类心理和生理的特征参数来判断说话人的身份的技术。本文所研究的是与文本有关的说话人确认系统。比较了基于声道的线性预测倒谱系数(LPCC)和基于听觉特性的MEL频率倒谱系数(MFCC)参数特征,得出MFCC对环境存在更高的鲁棒性。并运用了隐形马尔可夫模型(HMM)在MATLAB上实现了语音数字的识别仿真。本实验系统的识别率达到了90%,验证了HMM模型识别的准确性。  相似文献   

6.
本文提出了一种新型的利用Kinect获取深度图像并进行手势轨迹识别的应用方法,该方法称为HMM(隐马尔可夫)手势轨迹识别方法,具体操作步骤为:首先利用Kinect传感器获取深度图像,然后通过OpenNI的手势生成器的手势分析模块获取完整的手势信息,对手部进行形态学处理,识别并跟踪手势,提取手势轨迹,最后运用HMM手势轨迹识别方法进行识别.实践证明,该方法可快速有效地实现手势轨迹的识别.  相似文献   

7.
从智能控制与特征建模方法入手提出一种手写体汉字识别系统结构模型,仿人思维模式将复杂任务系统分解为决策、执行两层.综合目前常用的手写体汉字识别方法特点,针对不同特征汉字采用合适的识别方法,并通过广义误差对识别结果进行反馈,达到校正的目的,实验证明该结构方法有效.  相似文献   

8.
脱机手写体汉字识别是一个多类分类问题,且某些类别之间存在一定的关系,在识别其中某一类汉字时,并不需要区分所有汉字类别,为此提出了一种基于动态剪枝二叉树SVM的多分类改进算法.每次识别时都去掉没有价值的支持向量,根据字型结构特征重新构造二叉树,可以减少支持向量机数量,提高识别速度.通过对脱机手写体汉字识别仿真,比较不同多类分类算法的性能,证明该方法能够在保证识别准确率的情况下提高了汉字分类识别的速度.  相似文献   

9.
语音识别技术及应用   总被引:5,自引:0,他引:5  
语音识别技术近年来得到了飞速的发展并且在越来越多的领域得到了广泛的应用。隐马尔可夫模型(HMM)语音识别技术是一种基于训练数据提供的概率自动构造识别系统的技术,主要用于大量词汇的语音识别,而且具有良好的识别性能和抗噪性能。因此,一般的语音识别系统都采用基于HMM的识别方法作为其基本算法。本文列举了语音识别在教学中的应用示例来分析其基本算法。  相似文献   

10.
本文提出一种新的基于特征融合的车牌汉字识别技术.该方法首先对字符图像进行奇异值分解,然后利用奇异值和奇异向量进行特征融合,得到既包含能量特性又包含几何特性的特征向量,并结合BP神经网络分类器,应用于车牌汉字识别。仿真模拟结果表明,该方法具有很好的识别率和较低的误识率。  相似文献   

11.
In psychological, social, behavioral, and medical studies, hidden Markov models (HMMs) have been extensively applied to the simultaneous modeling of heterogeneous observation and hidden transition in the analysis of longitudinal data. However, the majority of the existing HMMs are developed in a parametric framework without latent variables. This study considers a novel semiparametric HMM, which comprises a semiparametric latent variable model to investigate the complex interrelationships among latent variables and a nonparametric transition model to examine the linear and nonlinear effects of potential predictors on hidden transition. The Bayesian P-splines approach and Markov chain Monte Carlo methods are developed to estimate the unknown, a Bayesian model comparison statistic, is employed to conduct model comparison. The empirical performance of the proposed methodology is evaluated through simulation studies. An application to a data set derived from the National Longitudinal Survey of Youth is presented.  相似文献   

12.
We present a novel model for recognizing long-term complex activities involving multiple persons. The proposed model, named 'decomposed hidden Markov model' (DHMM), combines spatial decomposition and hierarchical abstraction to capture multi-modal, long-term dependent and multi-scale characteristics of activities. Decomposition in space and time offers conceptual advantages of compaction and clarity, and greatly reduces the size of state space as well as the number of parameters. DHMMs are efficient even when the number of persons is variable. We also introduce an efficient approximation algorithm for inference and parameter estimation. Experiments on multi-person activities and multi-modal individual activities demonstrate that DHMMs are more efficient and reliable than familiar models, such as coupled HMMs, hierarchical HMMs, and multi-observation HMMs.  相似文献   

13.
利用HMM模型状态间的混淆度, 提出了一种新的状态结构调整算法, 使不同的状态可以共享相同的高斯混合函数, 并在EM算法的框架下推导出对状态结构调整后的增加参数, 即状态间权值的重估公式. 并对非特定人进行大词汇量汉语连续语音识别实验, 实验结果表明状态结构调整后的系统不仅优于基线系统, 还获得了比传统的参数增加方法更高的识别率, 由此证明了状态结构调整方法的有效性.  相似文献   

14.
针对测试系统操作只需少量文字服务的实际情况,提出一种在线文字识别用于测试系统操作的方法.该方法借鉴笔段链码特征,建立以笔画-笔段数目作为检索参数的字典库;按领衔文字列显命令供用户点击选用,依据转换表形成实际操作命令.应用结果表明,该方法操作简单、可靠,保密性好,拓展了手写汉字在线识别的应用范围.  相似文献   

15.
Traditional methods of license character extraction cannot meet the requirements of recognition accuracy and speed rendered by the video vehicular detection system. Therefore, a license plate localization method based on multi-scale edge detection and a character segmentation algorithm based on Markov random field model is presented. Results of experiments demonstrate that the method yields more accurate license character extraction in contrast to traditional localization method based on edge detection by difference operator and character segmentation based on threshold. The accuracy increases from 90% to 94% under preferable illumination, while under poor condition, it increases more than 5%. When the two improved algorithms are used, the accuracy and speed of automatic license recognition meet the system's requirement even under the noisy circumstance or uneven illumination.  相似文献   

16.
黄浩  朱杰 《东南大学学报》2007,23(2):174-178
提出了2种解决汉语语音识别中声调问题的方法:利用区分性方法对基于隐马尔可夫模型(HMM)的声调模型进行训练;提出将区分性训练的声调模型加入大词汇量连续语音识别系统的最优方法,该方法根据最小音子错误的训练准则以及利用扩展Baum-Welch算法区分性训练与模型相关的概率权重,对声学模型以及声调模型概率进行加权.实验结果表明区分性训练的声调模型能够显著地提高连续语音声调识别率以及大词汇量语音识别系统的识别率,同时区分性的模型权重训练能够在区分性声调模型加入连续语音识别系统之后进一步提高系统的识别性能.  相似文献   

17.
目前一些相对成熟的手势识别算法,如基于模板匹配的方法、基于人工神经网络的方法以及基于隐马尔科夫模型的方法,都存在计算复杂的劣势,而基于深度学习的手势识别具有一定优势。通过深度学习提取多层网络简化的高价值易用特征,通过向量等表示,简化算法以实现良好的识别效果。通过摄像头采集室内复杂背景下的手势图像,在计算能力、存储能力强大的PC平台通过深度学习处理图像,提取特征,然后进行分类识别,能提高识别准确率。通过改进硬件或算法还可提高识别效率及安全性。  相似文献   

18.
参考汉字学、心理学等学科核心期刊或报纸的有关研究成果,讨论了近三十年的汉字认知方面的研究情况。这些成果大致分为汉字本体与汉字认知研究、汉字教学与汉字认知研究、汉字认知生理因素研究、汉字认知心理特点研究、汉字认知与信息处理研究等。其中研究汉字结构认知和研究认知心理因素的论文偏多,特别是汉字认知的大脑效应研究,这些大多是通过提出假说、设计实验进行研究的,得出的结论比较有说服力。  相似文献   

19.
乳制品纸包装上的生产批号在喷码过程中由于各种原因部分字符出现粘连或缺失,影响字符的自动化识别。针对这一问题,提出了一种基于改进的CNN喷码式不规则字符识别与提取方法。首先,利用yolov3算法对生产日期区域进行提取;其次,对图像进行预处理;再次,通过一种基于字宽的分割算法结合投影法,利用相邻字符间的像素差异实现对粘连字符的分割;最后,对分割后的单个字符利用改进的CNN进行多标签分类训练得到模型。实验结果表明,改进后的模型对粘连字符和半或残缺字符的识别准确率分别为97.89%和96.71%,相较于模板匹配法、传统的LeNet-5模型、fast R-CNN+NMS模型和yolov3+K-means算法都有所提高。基于该方法设计的字符识别系统,提高了生产日期的在线识别准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号