首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 276 毫秒
1.
针对非平稳噪声环境下的语音活动检测问题,提出了基于在线单类SVM的自适应语音活动检测算法。该算法采用单类SVM对多种特征信息进行在线学习与综合,为非平稳背景噪声建模,并采用双层决策机制,能有效提高语音活动检测的稳健性。在语音识别系统中的实验结果表明,算法在多种噪声环境和信噪比条件下有效,并明显提高了在非平稳噪声环境下的识别率。  相似文献   

2.
语音识别中的端点检测技术是语音识别的基础,低信噪比环境下的端点检测很大程度决定语音识别工作的有效进行.提出了一种利用一阶有限差分商结合折半查找来判定语音端点检测的方法,提高了端点检测的准确率.仿真实验表明,在噪声环境下该方法较好地实现了语音端点检测.  相似文献   

3.
介绍了一种对背景噪音进行动态估计的汉语语音端点检测算法,较一些常规的端点检测方法如基于能量的端点检测方法,具有更高的精度和鲁棒性.并用TI的TMS320VC5410 DSP来实现一个带端点检测的语音识别系统.通过进行汉语孤立词语音识别实验,表明这种算法是有效的,能得到较高的识别率.  相似文献   

4.
语音端点检测是语音处理中非常关键的一个环节,目前主要的语音端点检测算法都侧重于语音特征参数的提取而忽略了之前的语音增强.论文提出一种基于多窗谱估计谱减法和能熵比的语音端点检测复合算法,该算法利用多窗谱估计谱减法将有噪声环境下的语音信号减噪,提高性噪比,达到语音增强的效果,再结合能熵比法进行端点检测.仿真结果表明,算法在低信噪比情况下,可以提高语音端点检测的正确率.  相似文献   

5.
语音端点检测是语音信号处理过程中的一个重要步骤,其检测准确性直接影响语音信号处理的速度和效果。传统的基于双门限法语言检测技术,在语音处于纯语音情况下判断语音端点较准确,但在语音处于噪声情况下,尤其是低信噪比的情况下,端点识别率很低,出错率很高。基于提高此方法识别率的目的,采用调整阈值个数,平滑滤波,引入语音结束最小长度的方法对其进行改进,通过了Matlab仿真实验,得出了较好的语音端点检测准确率。  相似文献   

6.
在语音信号处理领域,端点检测作为语音信号处理的初始化工作,有效合理的端点检测方法不仅可以减少数据的存储量和处理时间,而且可以排除无声段的噪声干扰,使语音的后续处理更加准确.本文为医疗语音信号处理提供一种医院噪声环境下医疗语音信号的端点检测方法.综合采用频域下的特征倒谱距离、能量谱、能量谱方差、统计学特征谱熵值4种特征作为控制条件判断语音的端点.通过设计软件验证了算法的有效性.  相似文献   

7.
在研究时,首先进行加性噪声模型的建立,而后通过滤波对带噪语音信号进行预处理,采用维纳滤波进行滤波。在进行语音信号的预处理后,使用VAD算法进行端点检测。建立整个试验系统后,找出了最佳方案。  相似文献   

8.
以VC++6.0为开发平台,实现一个基于隐马尔可夫模型(Hidden Markov Model,简称HMM)非特定人的安多藏语孤立词语音识别系统。对有声段语音进行MFCC参数的提取,对提取后的MFCC参数进行矢量量化后训练HMM模型,形成特征模板库,最后进行识别。根据安多藏语的特点,改进端点检测的方法,提高了孤立词语音信号检测的准确性,并进一步提高了识别率。  相似文献   

9.
在语音识别中,噪声严重影响语音特征提取,使得正确率明显下降。针对这一情况,提出了子带加权平均语音识别算法(Sub—Band Weighted Average Speech Recogrution,SBWASR),在噪声环境下,该方法能有效地提高语音识别的准确性。最后通过实验验证特定条件下该方法是正确有效的。  相似文献   

10.
讨论并比较了语音信号端点检测的方法,分析了各种方法的原理及优缺点。对语音信号的端点检测的进一步研究具有深远的意义。  相似文献   

11.
利用小波变换对含噪语音信号进行特征提取,结合隐马尔可夫和人工神经网络混合模型进行识别的方法,进一步反映语音信号的动态特性、增强抗干扰能力、提高识别率.实验证明,该模型适合于对噪声背景下的语音进行识别,同传统的HMM模型相比,具有更好的抗噪鲁棒性,在信噪比较低情况下,识别率比传统的HMM模型有明显提高.  相似文献   

12.
为提高图像识别系统的鲁棒性,以高性价比的CMOS摄像头为硬件平台,对智能探测小车图像识别模块进行程序设计。通过验证测试表明,采用基于二进制图像处理算法优化策略的智能图像识别模块,效率高、实时性好、可移植性强,具有广泛的应用前景。  相似文献   

13.
提出了一种基于机器学习的耳语音可懂度增强方法.该方法利用已经训练好的2类支持向量机来估计一个二元时频掩蔽值,进而合成增强后的耳语音.输入支持向量机的特征向量GFCCs是基于听觉外周模型进行提取的,具有噪声鲁棒特性.在增强仿真实验中,将该算法同传统语音增强算法进行语音可懂度增强性能比较.客观评价和主观听力实验结果均表明,所提出的方法能有效提高含噪耳语音的听觉可懂度;相比谱减法和log-MMSE方法在低信噪比时无法提高语音可懂度,该方法在低信噪比时仍可有效提高含噪耳语音的听觉可懂度.此外,含噪耳语音通过所提出的方法进行增强后,其可懂度比未增强时明显提高.  相似文献   

14.
针对RBF的参数选取的局限性造成检测效率低下的情况,提出一种PSO-RBF的算法,使用粒子群优化算法对RBF中权值、中心和方差三组参数进行优化设置,使三组参数的选择更加符合实际情况,提高了检测效率。将PSO-RBF算法应用到网络入侵检测识别系统中,结果表明该算法具有很好的检测率以及误报率,同时实验也证实了算法的可行性。  相似文献   

15.
为了提高行人检测的准确性和鲁棒性,针对现有行人检测方法准确率低且实时性不佳等问题,参考目标检测算法中快速区域卷积神经网络Faster RCNN算法,首先采用K-means聚类算法得到合适的宽高比,然后优化区域建议网络(RPN)结构,降低计算量,并通过比较MobileNet、VGG16、ResNet50特征提取网络效果优劣,提出改进Faster RCNN的交通场景下行人检测方法,在Caltech-NEW数据集上进行训练与测试。实验结果表明,该方法大幅提高交通场景下行人检测的实时性和准确性,在测试集上检测准确度达到87.5%,单张图片检测耗时为0.187s,相比现有其它方法,其检测效果更好。  相似文献   

16.
为了对现有小型汽车号牌识别系统进行优化,改善车牌字符识别系统性能,借助 OpenCV 图像处理开源库,在车牌图像预处理阶段采用均值滤波方法提高图像质量,采用 Sobel 边缘检测算子对图像边缘进行提取,利用交替的膨胀、腐蚀操作结合车牌长宽比实现车牌轮廓定位,并根据列像素值对车牌字符进行切割,最后采用改进的 K 近邻算法对分割后的单个车牌字符进行识别。实验结果表明,基于改进 K 近邻算法的车牌识别系统处理时间为 2.08s,识别正确率达 91.3%。与传统的 K 近邻算法相比有着更高的识别率,与神经网络法相比,有着更快的识别速度。  相似文献   

17.
提出一种基于随机森林方法的异常样本(outliers)检测方法.仿真实验表明,与其他2种基于距离的异常样本检测技术相比,这种方法可以更好地提高模型的准确率,且具有较强的鲁棒性,在处理大规模数据集时还能显著地减少计算时间.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号