首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
目前,国内外许多学者借助语义词典Word Net进行标签间语义关系挖掘方面研究,并取得了一定的进展,但却很少有专门针对中文语义词典与标签结合的研究。文章通过选取豆瓣读书上的标签数据,充分分析并利用中文语义词典《同义词词林》的分类体系和编码特点,利用一种基于《同义词词林》的词汇语义相似度计算系统Word Similar计算标签数据的语义相似度,进而挖掘标签间的语义关系,该方法得到的结果与我们思维中的词汇语义关系基本一致,有比较高的准确性。  相似文献   

2.
本文主要研究了查询语义树的生成策略、用户查询语义的提取机制,以及查询语义树中语义边界的确定方法。通过查询语义树产生候选扩展词,再计算候选扩展词与所有查询项在初检局部文档集合中的共现度,用以评估扩展词质量,使得扩展词与用户查询所蕴涵的主题具有较强的语义相关性。实验结果表明,与传统向量空间模型检索算法比较,查询性能有明显的改善。  相似文献   

3.
一种基于本体的叙词语义描述方法   总被引:2,自引:0,他引:2  
盛秋艳  刘群 《情报科学》2007,25(9):1415-1418
本体技术作为一种能在语义和知识层次上描述概念体系的有效工具,在数字图书馆得到了广泛的关注;利用叙词表构建本体也已成为数字图书馆领域研究的热点之一。本文根据《中国分类主题词表》的分类与编排方法,讨论了叙词表的语义关系,针对叙词表的缺陷,给出了基于叙词的本体描述方法,并且提供了基于本体的多义词、同义词、惯用词等的处理。  相似文献   

4.
框架元素语义类型的确定对于增加本体的语义信息及其建立本体之间的映射具有重要作用.探讨了利用WordNet中词汇的丰富语义等级结构,自动确定框架元素语义类型的方法,提出了同义词扩展、上位词扩展的确定思路,并引入Wu-Palmer语义相似度算法,同时考虑WordNet及FrameNet不同的语义深度,以帮助有效地选择框架元素语义类型.  相似文献   

5.
黎慧  唐友刚 《科技广场》2012,(11):10-13
本文分析了如何利用领域本体来改善实例与文档的相关度,提出了语法相关度、语义相关度计算方法,还提出了将基于关键字与语义的排序算法相结合的观点.  相似文献   

6.
针对图书、期刊论文等数字文献文本特征较少而导致特征向量语义表达不够准确、分类效果差的问题,本文提出一种基于特征语义扩展的数字文献分类方法。该方法首先利用TF-IDF方法获取对数字文献文本表示能力较强、具有较高TF-IDF值的核心特征词;其次分别借助知网(Hownet)语义词典以及开放知识库维基百科(Wikipedia)对核心特征词集进行语义概念的扩展,以构建维度较低、语义丰富的概念向量空间;最后采用MaxEnt、SVM等多种算法构造分类器实现对数字文献的自动分类。实验结果表明:相比传统基于特征选择的短文本分类方法,该方法能有效地实现对短文本特征的语义扩展,提高数字文献分类的分类性能。  相似文献   

7.
赵文娟  刘忠宝  郭慧 《情报科学》2019,37(5):108-114
【目的/意义】传统的信息检索技术主要是基于关键词匹配的信息推送,该方法容易出现漏检和误检的情 况。语义检索通过语义分析获得用户真正的检索意图,实现精准检索。【方法/过程】本文在对语义检索的原理和模 型进行描述的基础上,提出了基于本体概念树模型的词元扩展算法,通过对词元的语义相似性、语义相关性进行计 算,得出词元的语义关联度,关联度超过一定阈值的词元的集合即为扩展后的词元集。【结果/结论】该方法既考虑 了具有继承关系的词元间的语义相似性,也考虑了具有相同属性词元间的语义关联度,结论更具参考价值。  相似文献   

8.
基于情报检索的汉语同义词识别初探   总被引:3,自引:0,他引:3  
随着计算机的飞速发展,自然语言越来越广泛地应用于情报检索,同义词控制问题也成为情报学的研究热点。本文提出一种识别同义词的方法,这种方法基于检索网络搜索得到的统计数据,使用Dice测度方法测量两个词的相关度,相关度在给定的阈值内就可以认为是同义词。通过分析测试结果,验证这种方法的可行性,并提出了这种方法的优缺点及其应用。  相似文献   

9.
语义检索是通过自然语言统计模型,对技术方案中的词进行抽取形成索引词,并通过将各个索引词之间的相关度与专利库中的文献进行对比排序,获得结果。本文结合三个实际案例,拓展了语义检索在检索方式上的思路,提高了文件的检索效率以及准确率。  相似文献   

10.
杨韦洁  高珑  苏静 《现代情报》2014,34(7):78-82,87
针对传统数字图书馆中基于关键字的P2P查询扩展存在对用户检索词语义信息解释不足的缺陷,本文提出一种P2P环境下基于语义的节点查询扩展方法,通过把关键字关联表和本体相结合,实现了一种个性化查询扩展方法,同时利用这种扩展方法实现P2P中基于兴趣网络的搜索,能够较大幅度提升检索效率。  相似文献   

11.
Automatic text classification is the task of organizing documents into pre-determined classes, generally using machine learning algorithms. Generally speaking, it is one of the most important methods to organize and make use of the gigantic amounts of information that exist in unstructured textual format. Text classification is a widely studied research area of language processing and text mining. In traditional text classification, a document is represented as a bag of words where the words in other words terms are cut from their finer context i.e. their location in a sentence or in a document. Only the broader context of document is used with some type of term frequency information in the vector space. Consequently, semantics of words that can be inferred from the finer context of its location in a sentence and its relations with neighboring words are usually ignored. However, meaning of words, semantic connections between words, documents and even classes are obviously important since methods that capture semantics generally reach better classification performances. Several surveys have been published to analyze diverse approaches for the traditional text classification methods. Most of these surveys cover application of different semantic term relatedness methods in text classification up to a certain degree. However, they do not specifically target semantic text classification algorithms and their advantages over the traditional text classification. In order to fill this gap, we undertake a comprehensive discussion of semantic text classification vs. traditional text classification. This survey explores the past and recent advancements in semantic text classification and attempts to organize existing approaches under five fundamental categories; domain knowledge-based approaches, corpus-based approaches, deep learning based approaches, word/character sequence enhanced approaches and linguistic enriched approaches. Furthermore, this survey highlights the advantages of semantic text classification algorithms over the traditional text classification algorithms.  相似文献   

12.
徐桂臣  叶枫 《情报杂志》2012,31(2):119-123
在信息检索领域,概念的语义相似度计算起着重要的作用。针对现有研究文献中语义相似度计算中的若干问题,本文在语义加权距离算法的基础上讨论了多继承问题和概念属性问题。对于多继承问题,探讨了概念之间通过父概念和子概念进行连接所得到的路径长度相等的情况;对于概念属性问题,本文将对象类型属性和数据类型属性区别对待,提出了数据类型属性的相似度算法。最后,通过计算一个实例中概念节点的相似度,证明了本文算法的有效性。  相似文献   

13.
基于Ontology的多数据源语义集成研究   总被引:3,自引:0,他引:3  
针对某航空研究所存在的多数据源集成问题,本文提出了基于Ontology的多数据源语义集成方法,该方法采用Ontology描述数据源语义,通过多Ontology之间的映射实现多数据源之间的语义集成。该方法已成功用于某航空研究所。  相似文献   

14.
Web information retrieval and knowledge discovery are undergoing changes. The size of the Web and the heterogeneity of web pages generate new challenges in meeting user needs. This paper investigates the different methods deployed that add semantics to web content: semantic tagging and semantic APIs. The research carried out investigates existing systems in each category, outlining their primary features and functionality. It then proposes a framework for the evaluation of semantic tagging based on the main requirements for information discovery and recommends a number of comparative assessments, ranging from basic product information and requirements’ analysis to the evaluation of the APIs information modelling functionality.  相似文献   

15.
李江华  时鹏 《情报杂志》2012,31(4):112-116
Internet已成为全球最丰富的数据源,数据类型繁杂且动态变化,如何从中快速准确地检索出用户所需要的信息是一个亟待解决的问题.传统的搜索引擎基于语法的方式进行搜索,缺乏语义信息,难以准确地表达用户的查询需求和被检索对象的文档语义,致使查准率和查全率较低且搜索范围有限.本文对现有的语义检索方法进行了研究,分析了其中存在的问题,在此基础上提出了一种基于领域的语义搜索引擎模型,结合语义Web技术,使用领域本体元数据模型对用户的查询进行语义化规范,依据领域本体模式抽取文档中的知识并RDF化,准确地表达了用户的查询语义和作为被查询对象的文档语义,可以大大提高检索的准确性和检索效率,详细地给出了模型的体系结构、基本功能和工作原理.  相似文献   

16.
In this paper, a semantic categorization method in generic home photos is proposed. In recent years, the semantic categorization of image has been a challenge due to the proliferation of digital home photos. Our approach is to detect semantically meaningful concepts contained in a photo. The proposed method incorporates an intermediate level of concepts, called local concept, so that it catches well semantic meaning of local regions of image as bridging the semantic gap of the low-level features and high-level category concepts. To detect the local concepts from the home photo, region segmentation by photographic region template and concept merging is also proposed. The efficacy of the proposed semantic categorization method was demonstrated with 3828 general home photos. The experiment results showed the proposed categorization method would be useful to detect multiple semantic meaning of the home photos.  相似文献   

17.
语义检索能克服传统的基于关键词匹配检索的缺点,是信息检索的发展趋势。本文主要探讨两种实现语义检索的索引:潜语义索引和其修正形式。首先介绍了潜语义索引的基本思想和检索过程,并在分析潜语义索引的不足的基础上,介绍了其修正形式———残差迭代变换。  相似文献   

18.
蔡皎洁 《现代情报》2014,34(11):39-43
本文从对多结构化客户数据集成和预处理的成效不足、挖掘过程缺乏语义情景和上下文的支撑,从而所获取的客户知识模式质量不高等问题出发,提出了一种基于语义集成的客户知识挖掘模型.该模型充分利用了本体、语义集成等方法和技术,提高对数据语义分析和处理的能力,实现智能化客户知识挖掘过程,从而获取高质量的客户知识模式.  相似文献   

19.
语义Web技术的广泛研究为社会网络分析方法提供了新的思路,已经成为社会网络分析领域研究的重点问题之一。本文以语义Web技术在社会网络分析中的应用为研究对象,首先回顾了国内外学者在语义Web技术与社会网络分析交叉研究中的成果,然后对社会语义网络进行了分析,并提出了基于语义Web的社会网络分析应用模型,最后指出了该模型实现的技术难点和下一步的研究重点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号