首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
[目的/意义]针对单纯使用统计自然语言处理技术对社交网络上产生的短文本数据进行意向分类时存在的特征稀疏、语义模糊和标记数据不足等问题,提出了一种融合心理语言学信息的Co-training意图分类方法。[方法/过程]首先,为丰富语义信息,在提取文本特征的同时融合带有情感倾向的心理语言学线索对特征维度进行扩展。其次,针对标记数据有限的问题,在模型训练阶段使用半监督集成法对两种机器学习分类方法(基于事件内容表达分类器与情感事件表达分类器)进行协同训练(Co-training)。最后,采用置信度乘积的投票制进行分类。[结论/结果]实验结果表明融入心理语言学信息的语料再经过协同训练的分类效果更优。  相似文献   

2.
张志武 《情报探索》2013,(10):99-103
针对网络邮票图像的特点,提出邮票领域本体构建方法。根据网络邮票图像的视觉特征和描述文本.利用本体描述其语义特征,通过自动图像标注技术构建邮票图像本体库,并构建网络邮票图像的语义检索系统。实验表明,该系统解决了网络图像基于关键字检索和基于内容检索中的语义缺失问题,具有较高的图像检索准确率。  相似文献   

3.
基于中文信息抽取的概念,提出一套基于语义模板的地震应急文本信息地图自动标绘的技术方案。针对地震应急文本信息和汉语的特点,对应急文本信息进行分词、词性标注和语义分析等处理,按照预定义语义模板提取震情、灾情信息并形成结构化信息、并与空间关联,标绘形成地震应急态势图。方案实现了传统手工标绘向自动标绘的转换,提高了地震应急态势图标绘效率。  相似文献   

4.
图像检索系统中关键技术   总被引:2,自引:0,他引:2  
刘俊熙 《情报杂志》2004,23(7):93-94
图像检索系统主要可分成基于文本和基于内容的两大系统。文本本身就可以说明所要讲的内容,检索技术相对容易。而图像包括视觉特征与语义特征,关键技术涉及存储技术、索引技术、检索技术、视频信息的处理技术等。  相似文献   

5.
张国标  李洁  胡潇戈 《情报科学》2021,39(10):126-132
【目的/意义】社交媒体在改变新闻传播以及人类获取信息方式的同时,也成为了虚假新闻传播的主要渠 道。因此,快速识别社交媒体中的虚假新闻,扼制虚假信息的传播,对净化网络空间、维护公共安全至关重要。【方 法/过程】为了有效识别社交媒体上发布的虚假新闻,本文基于对虚假新闻内容特征的深入剖析,分别设计了文本 词向量、文本情感、图像底层、图像语义特征的表示方法,用以提取社交网络中虚假新闻的图像特征信息和文本特 征信息,构建多模态特征融合的虚假新闻检测模型,并使用MediaEval2015数据集对模型性能进行效果验证。【结果/ 结论】通过对比分析不同特征组合方式和不同分类方法的实验结果,发现融合文本特征和图像特征的多模态模型 可以有效提升虚假新闻检测效果。【创新/局限】研究从多模态的角度设计了虚假新闻检测模型,融合了文本与图像 的多种特征。然而采用向量拼接来实现特征融合,不仅无法实现各种特征的充分互补,而且容易造成维度灾难。  相似文献   

6.
张志武 《情报科学》2015,(4):121-124,131
针对传统的基于关键字Web图像检索中的语义缺失问题,结合Web图像的视觉特征和描述文本,利用本体描述Web图像的语义特征,构建了基于本体的Web图像语义检索模型。该模型以领域本体描述Web图像的语义特征,通过自动图像标注技术构建Web图像本体库,用户可以通过输入关键词或者提交示例图像进行图像检索。实验表明,该模型具有较高的图像检索准确率。  相似文献   

7.
作为网络安全产品的基于隔离技术的隔离网闸越来越受人关注,隔离网闸自带的文本内容过滤大多基于关键字过滤和URL过滤.这种内容过滤在使用性能上不但过滤效果欠佳且效率差,已不能满足日益增长的网络信息的安全要求;研究了文本信息过滤的模型、文本预处理技术、文本特征选择技术、过滤算法,提出了基于统计的适合于隔离网闸的智能文本过滤的方案,并对新方案中的关键技术加以研究和实现。  相似文献   

8.
针对图书、期刊论文等数字文献文本特征较少而导致特征向量语义表达不够准确、分类效果差的问题,本文提出一种基于特征语义扩展的数字文献分类方法。该方法首先利用TF-IDF方法获取对数字文献文本表示能力较强、具有较高TF-IDF值的核心特征词;其次分别借助知网(Hownet)语义词典以及开放知识库维基百科(Wikipedia)对核心特征词集进行语义概念的扩展,以构建维度较低、语义丰富的概念向量空间;最后采用MaxEnt、SVM等多种算法构造分类器实现对数字文献的自动分类。实验结果表明:相比传统基于特征选择的短文本分类方法,该方法能有效地实现对短文本特征的语义扩展,提高数字文献分类的分类性能。  相似文献   

9.
高亚琪  王昊  刘渊晨 《情报科学》2021,39(10):107-117
【目的/意义】针对当前利用计算机管理图像资源存在图像语义特征表达不足等问题,探索和分析了特征及 特征融合对分类结果的影响,提出了一种提高图像语义分类准确率的方法。【方法/过程】本文定义了四种图像风 格,将图像描述特征划分为三个层次,探究特征融合的特点,寻求能有效表达图像语义的特征。分别采用SVM、 CNN、LSTM 及迁移学习方法实现图像风格分类,并将算法组合以提高分类效果。【结果/结论】基于迁移学习的 ResNet18模型提取的深层特征能够较好地表达图像的高级语义,将其与SVM结合能提高分类准确率。特征之间 并不总是互补,在特征选择时应避免特征冗余,造成分类效率下降。【创新/局限】本文定义的风格数目较少,且图像 展示出的风格并不绝对,往往可以被赋予多种标签,今后应进一步丰富图像数据集并尝试进行多标签分类。  相似文献   

10.
为了提高利用医学影像技术对肝包虫病进行诊断的效率和准确性,有必要对基于影像的病症自动分类方法进行研究。根据不同类型肝包虫病CT影像特征,提出一种结合纹理特征提取和稀疏编码的肝包虫CT图像分类方法。首先,利用图像分割算法从腹部CT图像中提取肝包虫病灶区;其次,结合尺度不变特征转换(SIFT)和多尺度局部二值模式(LBP)对病灶区进行纹理分析,并采用稀疏编码技术对局部纹理特征编码;然后,应用多尺度最大池化法整合局部编码特征得到描述整幅图像的特征向量;最后,根据病灶图像的特征表示,通过线性支持向量机(SVM)完成对肝包虫图像的自动分类。在对比实验中,与基于Gabor滤波分类方法和基于多特征融合分类方法相比,所提方法总的平均分类准确率分别提高了24.97%和20.53%。实验结果表明,该方法提取的特征具有高的类区分度,能有效实现肝包虫CT图像的自动分类。  相似文献   

11.
基于TM遥感影像的玉米地专题信息自动提取   总被引:1,自引:1,他引:1  
TM遥感影像中专题信息的自动提取是目前遥感界的研究热点,也已成为遥感信息生产流程中的瓶颈环节。本文分析了耕地专题信息自动提取的研究现状,选取了吉林中部和辽宁省东北部作为研究区,采用监督分类的方法对研究区TM遥感影像进行分类,提取了玉米地专题信息,玉米地信息的提取精度为85.5%。根据遥感影像目视解译的原理,提出了基于多特征空间的遥感影像专题信息自动提取的研究方法,通过对多特征空间的数学描述和计算机处理实现 遥感专题信息的自动提取。采用多特征空间的方法将玉米地信息分为光谱特征空间、形状特征空间、区域地学特征空间和干扰特征空间,应用ERDAS8.5遥感图像处理软件中的knowledge engineer模块的开发功能,设计了基于多特征空间的玉米地专题信息自动提取的专家库,使用专家库对玉米地信息进行了自动提取,提取精度为92.9%。从基于多特征空间的分类结果与监督分类结果的比较发现,基于多特征空间的自动提取方法可以提高专题信息的提取效率,对未来实现遥感影像的智能解译是一种研究方法的探索。  相似文献   

12.
复杂背景下的OCR技术涉及的图象处理与模式识别技术较通用的OCR技术更为复杂。由于图像中的文字通常叠加在复杂的图像背景之上,背景成分的干扰使得现有的OCR技术难以识别出文字。本文对垃圾邮件中的图片进行实验的基础上,对复杂背景下的文本提取技术进行了研究,提出了基于灰度分级的新文本提取方法,有效实现文本字符特征的提取和切分。本文提出的方法可直接对复杂背景图象进行文本提取,并在此基础上实现对目标文本的切分。  相似文献   

13.
中文本体的自动获取与评估算法分析   总被引:6,自引:0,他引:6  
在下一代互联网,即语义网中,信息模式建立在本体描述之上。由于手工构建本体是一项工作量巨大并且繁杂的任务,因而,能否自动构建本体正逐渐成为语义网使用的关键性要素。在这样的背景下,本文对比和借鉴了国内外本体自动获取的方法和思路,将中文领域本体的提取划分为文本预处理、本体抽取和本体关系获取三个阶段。接着,本文讨论了这三个步骤所涉及的算法,包括基于统计模式对文本抽词、基于奇异值分解从词—文档矩阵中提取本体、基于语义相似度对本体进行聚类等。对于本体自动获取的效果评估,本文提出了利用计算手工和自动两种方式得到的本体相似度来进行衡量的思路。  相似文献   

14.
信息环境的异构性、动态性与海量性使传统基于自然文本的信息检索方法与技术面临极大挑战,集成概念空间理论与潜在语义索引技术能为这种困境提供一些解决方案.在分析概念空间内涵与特征的基础上,利用潜在语义索引原理讨论了概念提取方法、同义词近义词处理方法及基准向量的生成方法,分析了网络条件下基于概念空间的文本分类、聚类检索基本机制,最后给出了完善概念空间的自学习机制.  相似文献   

15.
作为网络安全产品的基于隔离技术的隔离网闸越来越受人关注,隔离网闸自带的文本内容过滤大多基于关键字过滤和URL过滤,这种内容过滤在使用性能上不但过滤效果欠佳且效率差,已不能满足日益增长的网络信息的安全要求;研究了文本信息过滤的模型、文本预处理技术、文本特征选择技术、过滤算法,提出了基于统计的适合于隔离网闸的智能文本过滤的方案,并对新方案中的关键技术加以研究和实现。  相似文献   

16.
基于形状特征的图像检索技术   总被引:6,自引:0,他引:6  
柳群英 《情报杂志》2004,23(4):87-88
介绍了一种基于内容的图像检索技术——图像内物体形状的检索技术的理论和方法,讨论了形状特征描述,特征提取方法和基于形状的图像查询方法。实现了形状特征的自动提取与图像检索。  相似文献   

17.
[目的/意义]为了解决因微博文本多义性和复杂性导致的谣言检测中语义特征提取不全面的问题,提出了一种结合微博内外多粒度语义的BiLSTM-CNN-ECA模型。[方法/过程]首先,对微博文本从字词句三个粒度级别建模,运用双向长短期记忆网络提取微博内部语义特征,生成事件字向量矩阵和事件词向量矩阵;然后,拼接事件句向量矩阵形成三维文本特征矩阵,输入多尺度卷积神经网络,并行提取微博之间的依赖关系特征;最后,引入高效通道注意力模块赋予通道权重,进行微博谣言检测。[结果/结论]构建的三维文本特征矩阵有机结合了各粒度文本的语义特征贡献,包含更多、更全面的微博语义信息;ECA可有效捕获通道间重要信息,进一步提高了多尺度CNN模型对谣言检测的准确率。  相似文献   

18.
中文自动文摘在搜索引擎中的应用   总被引:2,自引:0,他引:2  
董建设  任丽  周燕玲 《情报科学》2006,24(2):267-269,309
将自动文摘应用与搜索引擎系统,可以使用户更方便、直观地了解被命中网页的内容。本系统在实现基于网页的自动文摘时,针对Web文本的特点,采用了以统计为基础,统计和规则相结合的自动文摘生成策略,实现了HTML标记加权处理、中文文本切分和同义词分析,在此基础上完成了基于统计的文摘句初步提取和基于语用规则的进一步处理。  相似文献   

19.
本文首先采用背景差法提取出区别于背景图像的目标图像;其次,提取待检测区域的特征信息,将提取出来的目标图像的特征与背景图像区域的特征进行匹配,区分像素点,比较匹配度;最后,通过计算面部肤色面积和身体轮廓大小区分学生是否听课,统计出视频序列帧中的听课学生数量。实验证明,本方法可以较准确地分析与统计出中学生的听课情况,抗干扰能力比较强。  相似文献   

20.
基于语义的图像检索相关反馈技术   总被引:4,自引:2,他引:4  
由于相关反馈技术能够有效地提高图像检索的查准率,近年来受到广泛的关注。在简要介绍基于语义的图像检索系统后,讨论了相关反馈的交互过程及重要环节,对现有的相关反馈算法进行了分析和总结。通过利用语义网络建立图像特征和语义特征之间的联系,提出了相关反馈技术在实际应用中需解决的问题,并展望了基于语义的图像检索中相关反馈的发展方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号