首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为了提高视频中人体行为识别的准确率,更好地利用视频中的原始信息,提取出更具有代表性的特征,提出一种基于3D卷积神经网络的人体行为识别方法。该方法构建了一个深层三维卷积神经网络模型,使用三维卷积核进行卷积操作,提取视频中人体行为的时域和空域特征,通过多层卷积操作对底层特征进行再组合,得到抽象的高维特征。在KTH数据集上的实验结果表明,该方法有较好的识别效果。  相似文献   

2.
为了提高语音情感识别的准确度,探讨了将Transformer应用于语音情感识别的可能性.将对数梅尔尺度谱图及其一阶差分特征相融合作为输入,使用Transformer来提取分层语音表示,分析注意头个数和Transformer编码器层数的变化对识别精度的影响.结果表明,在ABC、CASIA、DES、EMODB和IEMOCAP语音情感数据库上,相比以MFCC为特征的Transformer,所提模型的精度分别提高了13.98%、8.14%、24.34%、8.16%和20.9%.该模型表现优于递归神经网络(RNN)、卷积神经网络(CNN)、Transformer等其他模型.  相似文献   

3.
卷积神经网络(CNN)在脱机手写汉字识别领域取得了杰出的研究成果。采用更深层卷积神经网络可取得更高识别准确率,但是模型容量和计算复杂度也会增加,将模型部署到存储资源和计算力有限的移动设备上变得更加困难。为解决上述问题,提出一种基于深度可分离卷积的残差卷积神经网络。深度可分离卷积将标准卷积操作分离成特征提取和特征融合,逐深度卷积被用于特征提取,特征融合采用逐点卷积实现。使用深度可分离卷积改进残差网络,实现较深层的残差网络。模型使用联合的中心损失函数和softmax损失函数进行监督训练,可使模型学习具有判别性特征,提高了模型识别准确率。采用CASIA-HWDB数据集进行实验,结果表明该方法具有较低的模型容量和计算复杂度,能够达到96.50%的主流识别率。  相似文献   

4.
近年来,电子商务发展迅速,对电商商品评论进行情感分析可为消费者购物、商家调整销售策略与电商平台个性化推荐提供重要参考意见,因此提出双通道卷积记忆神经网络文本情感分析模型。首先,通过词向量与由特征词典构造的扩展特征矩阵两个不同的通道进行卷积运算,再利用卷积神经网络提取文本局部最优信息,最后利用长短期记忆神经网络学习长距离的上下文情感,完成文本情感分析任务。实验结果表明,与多种文本情感分析方法相比,双通道卷积记忆神经网络文本分析算法具有较高的精度,达到95%,且考虑了文本语义信息与文本情感信息,可获得更好的文本表示,同时兼顾文本局部特征与上下文信息的学习,可有效提高文本情感分析准确率。  相似文献   

5.
为了弥补经典LeNet-5卷积神经网络模型在交通标志识别中易发生过拟合的不足,克服其识别准确率与训练效率较低的缺点,采用GTSRB德国交通标志数据集,并对数据集进行扩充,使训练集数量达到6 312 649张,同时对经典LeNet-5卷积神经网络模型在激活函数、池化策略、随机丢弃及网络结构等方面进行改进,使用基于交叉熵的梯度下降算法对模型的误差反向传播过程进行优化。实验结果表明,改进后的模型较改进前在识别准确率与训练效率上都有所提高,识别准确率最高可达97.04%。因此,基于交叉熵的卷积神经网络不仅能够提高模型的交通标志识别准确率,有效防止过拟合,还能够提升网络训练效率。  相似文献   

6.
随着人工智能的发展,计算机对于输入的手写字符识别需求越来越大,采用改进的卷积神经网络对手写字符进行识别分类。用VGGNet16模型构造卷积神经网络模型,每一层都加上批标准化,通过平均值池化对卷积层进行下采样,利用PRELU激活函数代替ReLU激活函数,最后通过Softmax分类器对手写字符图像进行分类。在MNIST手写数字数据集和EMNIST-bymerge手写字母及数字数据集下进行实验,改进的卷积神经网络模型在MNIST数据集中识别准确率提升到99.65%,在EMNIST数据集中识别准确率为90.37%。因此,改进模型识别准确率较高,适用于手写字符识别。  相似文献   

7.
针对语音情感识别中不同表征空间的信息利用不足问题,提出了一种多头注意力的双层长短时记忆模型,用于充分挖掘有效的情感信息.该模型以具有时序情感信息的帧级别特征作为输入值,利用长短时记忆模块学习时域特征,设计了特征注意力模块和时间多头注意力模块,对长短时记忆模块的逐层输出值、特征注意力模块输出值、时间多头注意力模块输出值进行融合.结果表明,相比传统的长短时记忆模型,所提方法在eENTERFACE和GEMEP两个数据集上的识别准确率分别提升了14.6%和10.5%,从而证明了其在语音情感识别任务中的有效性.  相似文献   

8.
为提高光学元件缺陷检测的效率和准确率,提出了一种基于偏振成像与卷积神经网络算法相结合的光学元件缺陷检测方法。通过分焦平面偏振相机与暗场成像方法相结合,降低高光现象对成像质量的影响,实现了结构紧凑、实时测量、成像质量高的光学元件成像光路;同时引入LeNet-5卷积神经网络进行光学元件缺陷识别,通过采用线性修正单元、多尺度卷积和卷积通道拓展等优化方法,减小网络过拟合、提高网络缺陷识别能力。经试验对比,改进型LeNet-5识别算法不需要对偏振图像进行预处理,对光学元件缺陷的识别准确率可达96.7%,并且运行速度和内存占用相比SqueezeNet网络模型存在明显优势。  相似文献   

9.
本文提出了基于一种改进的卷积神经网络算法,并将该算法应用于交通视频的图像识别。首先,利用Canny算子改善交通视频中车辆的边缘识别检测效率;其次,利用局部结构图LTP算子去除光线影响,提取图像纹理特征;最后,通过改进传统卷积神经网络算法,识别交通视频图像。实验表明,本文构建的LTP-微卷积神经网络大大地提高了交通视频图像的正识率。  相似文献   

10.
视频人脸表情识别在无人驾驶、智慧医疗等多领域都有广泛应用.针对视频单帧特征提取存在信息损失的问题,提出单帧增强卷积网络,该网络采用浅层特征与深层特征融合实现特征增强,其中浅层特征为CNN中间层外延卷积模块实现浅层特征提取,深层特征为CNN网络最后一层融合空洞卷积和基于通道间注意力机制,实现特征通道重定位和强弱信息结合....  相似文献   

11.
针对唇语识别过程中唇部特征提取和时序关系存在的问题,提出一种卷积神经网络(CNN)和双向长短时记忆网络(Bi-LSTM)相结合的深度学习模型。利用CNN学习唇部特征,并将学习到的唇部特征送入Bi-LSTM进行时序编码,通过Softmax进行分类。建立NUMBER DATASET和PHRACE DATASET两个大型汉语数据集以解决汉语唇语数据缺失问题。将该模型与传统的唇语识别方法在两个数据集上进行实验对比,发现在NUMBER DATASET上识别准确率为81.3%,比传统方法提高了8.1%,在PHRACE DATASET上识别准确率为83.5%,比传统方法提高了9%。实验结果表明该模型能有效提高唇语识别的准确率。  相似文献   

12.
问答系统是自然语言处理领域一个非常热门的研究方向,问题分类是问答系统非常重要的环节。传统问题分类需要人工制定特征提取策略并不断优化特征规则,该方法准确率不高且费时费力。传统卷积神经网络模型先通过卷积核提取能表示问句特征的向量,再经过max-pooling后得到一个特征值,并未考虑句子的结构信息,在训练时容易发生过拟合。针对上述问题,采用分段池化操作,引入句子结构信息,在不同分段上提取句子的主要特征并加入Dropout算法,提高模型的泛化能力,防止模型过拟合。实验结果表明,该方法能提高模型准确率,在TREC 6分类问题数据集上准确率高达89.2%,在银行57分类数据集上准确率也达到了64.5%。  相似文献   

13.
为高准确度识别实时人物动作模式,对长效递归卷积网络(LRCN)进行改进,得到长效递归深度卷积网络(LRDCN).LRDCN使用多帧叠加的RGB图像与光流图像作为网络输入,将基于RGB图像的人体动作特征与基于光流图像的人体动作特征进行加权融合,结合卷积神经网络(CNN)对Two-stream算法进行扩展作为最终的人体动作...  相似文献   

14.
视觉特征提取与特征表达方法在图像分类及识别中十分重要,从特征学习和特征表达角度出发,提出一种基于改进堆叠独立子空间分析模型提取特征的行为识别算法。首先采用两层独立子空间神经网络构建堆叠网络,在特征学习过程中融入正则化约束项,并结合时空卷积算法,获取视频时空层次化不变性特征基元;然后以堆叠卷积网络两层特征基元的非线性映射获取一种规则网格划分下的视频块状局部特征描述符;最后结合时空金字塔匹配模型构建时空层次特征,采用一对多支持向量机分类方法对视频中的动作进行分类。在KTH视频数据库中进行实验。结果表明,该算法学习到的特征基元可对视频构建低维高效的特征描述符,与现有多种行为识别算法进行对比,改进行为识别算法有效性进一步提高。  相似文献   

15.
将基于自适应双阈值镜头检测算法与电视节目的音频特征相结合,本文提出了一个鲁棒的电视节目广告片段检测算法.首先采用将自适应双阈值镜头检测算法分割出电视节目和广告视频镜头.为了提高镜头边界检测的准确率,本文提出将音频切变信息融合到镜头边界检测算法中.最后利用非对称AdaBaost算法对镜头进行分类,得到无广告视频的完整电视节目.实验结果表明此广告视频检测技术具有实用性.  相似文献   

16.
在情感分析领域,仅依靠文本等单一模态进行情感分析,限制了从多模态数据中提取多样化特征的能力,限制了情感分析结果的准确度和鲁棒性。为此,提出了融合音频分析网络和文本分析网络的多模态情感分析方法。其中,利用预训练卷积神经网络(CNN)和迁移学习技术进行基于Mel频谱图的音频情感分类,通过改进的XLNet模型执行歌词文本的特征提取和情感分类任务。CNN和XLNet输出包含概率权重和不同情感值的情感预测矩阵,最后使用堆叠集成方法合并不同模态的输出结果,完成多模态情感分类。在自建民族音乐数据集的消融实验证明,多模态方法具有良好的互补性,在情感识别任务中的性能显著优于单模态方法。公开数据集结果表明,所提方法的分类准确度达到83.75%,优于其他先进方法。  相似文献   

17.
人体行为识别是人工智能领域的一个研究热点,相对于视频、运动流等数据,人体骨骼数据具有简洁性和矢量计算的高效性.从基于传统机器学习的手工特征提取方法和基于深度学习的深度特征提取方法两方面对基于骨骼数据的人体行为识别相关研究进行综述.将手工特征概括为物理属性特征和统计属性特征,将深度特征按卷积神经网络、循环神经网络、图卷积...  相似文献   

18.
为有效识别浮动验证码,提出一种基于特征匹配与卷积神经网络的识别方法。首先使用特征匹配的方法得到匹配特征点,结合交叉匹配算法与 K 近邻匹配算法滤除错误匹配;然后对特征点进行聚类及投票分析,得到待识别字符区域,将其分割得到单个字符;最后在 mnist 手写数字数据集的基础上加入英文字符,构建卷积神经网络模型,将数据集送入模型进行训练。对 10 000 张浮动验证码进行测试,结果表明,该方法对浮动验证码的识别准确率达 95%,且构建的训练集具有可扩展性,可进一步应用到其它类型的字符识别中。  相似文献   

19.
文本情感分析通过提取文本特征,根据文本中的情感倾向进行分类.研究表明,递归神经网络和卷积神经网络模型具有良好的性能.为提高文本情感分类性能,提出一种融合注意力和比较增强学习机制的混合网络情感分析模型,用比较增强学习机制进行分类来替代大量的复杂计算.该模型通过嵌入层向量化后,分别用CNN和双向门控循环单元提取不同特点的文...  相似文献   

20.
传统卷积神经网络对空间信息不敏感,无法学习到不同特征间相对位置的关系,且每一层神经元的感受野被设计为相同大小,导致提取的图像特征信息不够精确.针对这些问题,提出一种选择性卷积核胶囊网络用于图像分类任务.在经典胶囊网络的卷积层融入具有两个分支的选择性卷积核网络,以提取更为丰富、准确的图像特征信息,提高图像分类准确率.采用...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号