首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
卷积神经网络(CNN)在脱机手写汉字识别领域取得了杰出的研究成果。采用更深层卷积神经网络可取得更高识别准确率,但是模型容量和计算复杂度也会增加,将模型部署到存储资源和计算力有限的移动设备上变得更加困难。为解决上述问题,提出一种基于深度可分离卷积的残差卷积神经网络。深度可分离卷积将标准卷积操作分离成特征提取和特征融合,逐深度卷积被用于特征提取,特征融合采用逐点卷积实现。使用深度可分离卷积改进残差网络,实现较深层的残差网络。模型使用联合的中心损失函数和softmax损失函数进行监督训练,可使模型学习具有判别性特征,提高了模型识别准确率。采用CASIA-HWDB数据集进行实验,结果表明该方法具有较低的模型容量和计算复杂度,能够达到96.50%的主流识别率。  相似文献   

2.
为提升小目标图像分割性能,提出一种通道注意力联合增强卷积的改进U-Net网络。该网络以增强卷积模块丰富目标特征信息提取,结合通道注意力加强网络对目标特征的专注学习,从而更有效捕捉小目标对象的深层次特征。NIH数据集上的实验结果表明,提出网络在保证计算效率的同时,有效提升了Dice系数、召回率和精确率,能够更好地用于小目标图像分割。  相似文献   

3.
为提高卷积神经网络在图像分类中的泛化性,提出基于多分支深度神经网络结构。使用ResNet(残差网络)的跨层连接结构构造多分支网络,各分支网络共享中浅层特征提取,深层网络使用不同卷积核尺寸。分别使用独立损失函数产生多梯度对中浅层特征权值进行同步调整。与ResNet的单重网络进行对比实验,结果表明,在具有相同收敛性的前提下,各个分支网络的泛化性都得到一定提高,在多类别数据集中表现出更优性能。  相似文献   

4.
在手写数字识别数据集(MNIST)情景下,为了提高卷积神经网络的识别正确率,提出了一种改进的基于卷积神经网络(CNN)的多尺度特征识别算法.首先,利用卷积操作和池化操作提取图像中的全局特征及局部特征,通过二次卷积与特征融合获得数字图像的多尺度特征.然后,将多尺度特征送入全连接网络和Soft Max分类器,实现手写数字图像识别.最后,通过对不同网络结构的CNN算法进行评估表明,本文提出的算法可以有效提高网络精度,具有较好的泛化能力.  相似文献   

5.
深度神经网络模型通常使用注意力机制或融合卷积神经网络来提取特征,但由于注意力机制抓取的特征过于单一,存在提取特征不完善的问题。 将循环机制引入卷积神经网络中,构建了具有双循环结构的网络模型(DRCNN),从而改善模型的特征提取能力,将其与双向长短期记忆网络结合,提出一种带有注意力机制、特征提取能力更强的混合模型(BiLSTM-DRCNN)并应用于情感分类任务中。通过情感分类的实验分析表明,BiLSTM-DRCNN 神经网络模型具有比较好的性能,与融合卷积神经网络(CNN)和双循环长短期记忆神经网络(BiLSTM)模型相比,综合评价指标提高2%以上;与BiLSTM-CNN、Fusion Model 模型相比,综合评价指标提高了近1%,且收敛速度更快。  相似文献   

6.
本文提出了一种基于坐标注意力机制和梯度残差密集块的融合算法,利用普通卷积提取源图像的浅层特征,使用梯度残差密集块模块提取源图像深层特征和细粒度细节特征;使用坐标注意力模块捕获特征图中空间位置之间的远程依赖关系重,将融合后的特征利用解码器重建融合图像。实验结果说明本文提出的融合算法具有较好的融合性能。  相似文献   

7.
文本情感分析通过提取文本特征,根据文本中的情感倾向进行分类.研究表明,递归神经网络和卷积神经网络模型具有良好的性能.为提高文本情感分类性能,提出一种融合注意力和比较增强学习机制的混合网络情感分析模型,用比较增强学习机制进行分类来替代大量的复杂计算.该模型通过嵌入层向量化后,分别用CNN和双向门控循环单元提取不同特点的文...  相似文献   

8.
为了提高视频中人体行为识别的准确率,更好地利用视频中的原始信息,提取出更具有代表性的特征,提出一种基于3D卷积神经网络的人体行为识别方法。该方法构建了一个深层三维卷积神经网络模型,使用三维卷积核进行卷积操作,提取视频中人体行为的时域和空域特征,通过多层卷积操作对底层特征进行再组合,得到抽象的高维特征。在KTH数据集上的实验结果表明,该方法有较好的识别效果。  相似文献   

9.
为提高癫痫脑电图(electroencephalography, EEG)信号识别的准确率,提出了一种将一维卷积神经网络(convolutional neural network, CNN)与长短期记忆网络(long short-term memory network, LSTM)相结合的新模型(CNN-LSTM模型)。首先采用3个卷积块来搭建CNN,用于提取EEG序列的局部内在特征;然后利用LSTM学习长期序列依赖关系;最后利用具有Softmax激活函数的全连接神经网络实现癫痫EEG信号的自动识别。采用德国波恩大学癫痫研究室的癫痫数据库中的数据进行实验分析。结果表明,CNN-LSTM模型具有良好的分类性能,平均分类准确率达到99.1%。  相似文献   

10.
以金字塔残差模块为基础,设计了一个轻量化的网络模型。使用深度可分离卷积代替普通的卷积以减少训练的参数,同时加入通道分离模块和通道混合模块来改变特征图通道维数,以加强特征的融合。为保证网络仍然能更完整的提取特征,只对恒等映射部分进行了通道分离处理,在最后的特征融合加入了通道混合模块,在标准MPII数据集上进行测试。结果表明,轻量化的金字塔残差网络有效地减少了网络的参数,减少了约1/2的参数存储空间并保持相当的准确度,同时复杂度仅为2.83 GFLOs。  相似文献   

11.
针对图像特征局部信息描述不足问题,提出一种基于多区域中心加权深度卷积特征提取方法。首先通过卷积神经网络提取输入图像的卷积层激活特征图,然后通过计算不同通道特征图的差异,选择具有区分性的区域特征图,最后通过多区域权重进行加权聚合,生成用于检索图像特征向量。在不同的建筑物数据集进行实验,结果表明检索精度分别提升了1.2%、0.9%。  相似文献   

12.
针对唇语识别过程中唇部特征提取和时序关系存在的问题,提出一种卷积神经网络(CNN)和双向长短时记忆网络(Bi-LSTM)相结合的深度学习模型。利用CNN学习唇部特征,并将学习到的唇部特征送入Bi-LSTM进行时序编码,通过Softmax进行分类。建立NUMBER DATASET和PHRACE DATASET两个大型汉语数据集以解决汉语唇语数据缺失问题。将该模型与传统的唇语识别方法在两个数据集上进行实验对比,发现在NUMBER DATASET上识别准确率为81.3%,比传统方法提高了8.1%,在PHRACE DATASET上识别准确率为83.5%,比传统方法提高了9%。实验结果表明该模型能有效提高唇语识别的准确率。  相似文献   

13.
在实际应用场景中所采集的人脸图像通常分辨率都很低,导致许多经典的人脸识别算法无法对低分辨率人脸进行准确识别.针对该问题,本文提出了一种部分卷积耦合的双通道网络,该网络中将高分辨率(High Resolution, HR)通道和低分辨率(Low Resolution, LR)通道中的卷积核进行部分耦合,使得LR通道能够从耦合的卷积核中学习到HR通道中的高分辨率参数,从而达到提高LR通道对LR样本的特征提取能力.为进一步提高样本分类的准确率,在双通道网络末端引入一个空间金字塔池化层(Spatial Pyramid Pooling, SPP),使用SPP层能够将HR样本与LR样本投影到一个共同的特征空间中.最后使用LFW人脸库对算法的有效性进行测试,实验结果表明,本文所提算法能够对LR人脸图像进行准确识别.  相似文献   

14.
针对目前利用时空图卷积网络ST-GCN行为识别模型进行人体行为识别准确性有待提高和如何更好地学习骨骼数据中关节点和骨架边所表达的动作特征等问题,改进现有的时空图卷积网络(ST-GCN)行为识别模型。首先,使用有向图来表示关节点和骨骼边的信息以及它们之间的依赖关系,提取相邻帧的关节位置差异作为运动信息;其次,使用双流框架分别学习运动信息和空间信息,进行融合提高识别性能;最后,使用注意力权重矩阵让图的拓扑结构具有自适应性,增大节点的感受野,使网络能够学习到远端关节之间的语义信息,更好的捕捉动作特征。将所提出的方法在NTURGB+D数据集上进行实验。研究结果表明,采用基于时空图卷积网络改进的人体行为识别方法在数据集上达到了96%的准确率,与现有ST-GCN模型相比,准确率提高了。此方法可进一步促进人体行为识别技术在智能家居、智能监控安防、人机交互、基于内容的视频检索、智慧城市发展等领域的广泛应用。  相似文献   

15.
新冠肺炎的计算机辅助诊断是一种实现智能化影像诊断、临床诊断及临床分型的方法,在新冠肺炎的辅助诊断过程中,图像的病灶区域与组织边界对比不明显,导致模型不能较好地关注病灶区域,对有效特征的提取不够充分。针对上述问题,提出一个新冠肺炎辅助诊断模型seqAFF-ResNet(sequential attentional feature fusion-residual neural network)。设计串行注意力特征融合(sequential attentional feature fusion,seqAFF)模块,该模块串联条带注意力特征融合(strip attentional feature fusion,SAFF)模块和全局局部注意力特征融合(global local attentional feature fusion,GLAFF)模块,获取图像的纹理信息以及全局和局部信息,弥补卷积神经网络对于细节特征提取能力的不足,使得模型可以更好地关注于病灶区域;构造深浅层特征融合(deep and shallow feature fusion,DSFF)模块,使用深层特征的语义信息来影响浅层信息...  相似文献   

16.
视觉特征提取与特征表达方法在图像分类及识别中十分重要,从特征学习和特征表达角度出发,提出一种基于改进堆叠独立子空间分析模型提取特征的行为识别算法。首先采用两层独立子空间神经网络构建堆叠网络,在特征学习过程中融入正则化约束项,并结合时空卷积算法,获取视频时空层次化不变性特征基元;然后以堆叠卷积网络两层特征基元的非线性映射获取一种规则网格划分下的视频块状局部特征描述符;最后结合时空金字塔匹配模型构建时空层次特征,采用一对多支持向量机分类方法对视频中的动作进行分类。在KTH视频数据库中进行实验。结果表明,该算法学习到的特征基元可对视频构建低维高效的特征描述符,与现有多种行为识别算法进行对比,改进行为识别算法有效性进一步提高。  相似文献   

17.
视网膜血管分割算法是自动视网膜疾病筛查系统主要部分。视网膜血管检测在医学诊断上应用日益广泛,对糖尿病、青光眼等病状有较精确的诊断。提出一种新的全卷积神经网络视网膜血管分割的监督方法,该方法在视网膜图像和相应的血管标签图之间进行端对端预测,采用跳跃结构融合图像深层和浅层的特征信息,得到精确的分割结果。以准确性(Acc)为标准判断,在DRIVE数据集上表现出比现有其它技术更好的性能。  相似文献   

18.
为实现对超声图像病灶的分割并提高目标分割精度,提出一种残差结构的深层尺度融合的分割网络模型RDFA-Net。使用改进的网络模型并使用可变形卷积来增大采样范围,使用通道和空间注意力机制捕获特征,融入深层尺度特征进行融合以捕获深层次图像特征,成功将视网膜脱落病灶的超声图片进行分割,并有了更好的分割结果。使用合作医院提供的眼底超声图像作为数据自制分割数据集来评价RDFA-Net。通过实验结果对比显示,RDFA-Net是有效的,可以对视网膜脱落进行图像分割,并实现了较好的分割精度。  相似文献   

19.
传统卷积神经网络对空间信息不敏感,无法学习到不同特征间相对位置的关系,且每一层神经元的感受野被设计为相同大小,导致提取的图像特征信息不够精确.针对这些问题,提出一种选择性卷积核胶囊网络用于图像分类任务.在经典胶囊网络的卷积层融入具有两个分支的选择性卷积核网络,以提取更为丰富、准确的图像特征信息,提高图像分类准确率.采用...  相似文献   

20.
在情感分析领域,仅依靠文本等单一模态进行情感分析,限制了从多模态数据中提取多样化特征的能力,限制了情感分析结果的准确度和鲁棒性。为此,提出了融合音频分析网络和文本分析网络的多模态情感分析方法。其中,利用预训练卷积神经网络(CNN)和迁移学习技术进行基于Mel频谱图的音频情感分类,通过改进的XLNet模型执行歌词文本的特征提取和情感分类任务。CNN和XLNet输出包含概率权重和不同情感值的情感预测矩阵,最后使用堆叠集成方法合并不同模态的输出结果,完成多模态情感分类。在自建民族音乐数据集的消融实验证明,多模态方法具有良好的互补性,在情感识别任务中的性能显著优于单模态方法。公开数据集结果表明,所提方法的分类准确度达到83.75%,优于其他先进方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号