首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 343 毫秒
1.
信息爆炸是当今信息社会的一大特点,如何在海量的信息中有效地找到所需信息因而成为了一个关键问题,语义检索技术是解决这一问题非常有潜力的方法.本文对信息检索中的若干关键问题进行了研究,提出了基于语义处理技术的信息检索模型--SPTIR,该模型主要包括以下关键技术:基于词义消歧的语义查询扩展、基于词汇语义相关性度量的查询优化和基于文档语义相关性的检索结果重排序.最后使用大型测试数据集和多项性能指标对SPTIR模型的检索性能进行了试验评估,实验结果充分验证了SPTIR模型的竞争优势以及该模型采用的各项语义处理技术对提高检索性能所起的积极作用.  相似文献   

2.
一个构造良好的查询是信息检索质量的基本保证,语义查询扩展技术解决了传统信息检索系统不能很好理解用户查询意图的问题,在提高检索查全率的同时保证了检索准确率。本文以查询关键字之间的语义关联为切入点,辅以隐式反馈技术获取消歧上下文,以WordNet本体库和WordNet Domains扩展库作为消歧数据源,使用基于局部上下文和基于图论的两类无导词义消歧方法进行查询关键字到本体概念的映射,最后基于概念词汇关联完成基于语义的查询扩展。综合WordNet本体库和WordNet Domains扩展库中的各项知识源对查询词义进行判定,保证了词义消歧的精度;采用无导词义消歧实现查询词义的快速判定,保证了信息检索的实时性;根据查询关键词的多寡分别提出两类消歧方法,满足了各种查询需求。  相似文献   

3.
VISION:集成分类法、主题词表和语义元数据的概念网络   总被引:19,自引:2,他引:17  
王军 《情报学报》2003,22(4):412-418
本文提出了一种在分类法和主题词表的基础上集成语义元数据、构建概念网络、实现概念检索的方法.和其他的概念检索系统相比,它的最大特色是在检索之前先将信息资源根据其内容和主题组织到概念网络中.这样的概念网络,既是一个资源组织的框架,又是一个知识浏览和概念检索的信息空间.同时,还能支持用户学习.文章介绍了国内外概念检索的研究现状,讨论了集成分类法、主题词表和语义元数据构建概念网络的方法和好处.介绍了一个原型系统VISION,它是在<中国分类主题词表>的基础上,利用北京大学图书馆计算机类的书目数据实现的.文章最后进行深入讨论并介绍下一步的研究工作.  相似文献   

4.
一种面向语义的信息检索方法   总被引:1,自引:0,他引:1  
传统的信息检索技术忽视了语义对检索过程的影响,这是造成查准率不高的一个重要原因.论文提出了一种面向语义的信息检索方法,该方法强调使用基于知网的语义处理技术实现对用户查询需求和目标文档的语义标注,使用基于知网的词汇链技术实现对文档特征词汇的过滤.一方面可以实现语义级别的检索匹配,另一方面可以降低大量无关词对检索结果的干扰.论文描述了一个实现该方法的信息检索系统SOIRS,并且利用该系统与传统检索系统做了对比实验.实验结果表明面向语义的信息检索方法在查准率方面要明显优于传统信息检索方法.  相似文献   

5.
概念语义网络作为一种揭示知识单元间内在联系的知识组织体系,有利于提高信息检索系统与用户的交互性,实现概念检索、智能导航与知识推理.本文结合知识表示语言与本体构建理论,以情报学概念语义网络为例,详细介绍了面向领域的概念语义网络的开放数据库设计.文中介绍的概念语义网络数据关系模型具有较强的通用性与扩展性,适用于不同类型,不同规模的概念语义网络的设计与实现,对于构建领域概念语义网络有一定的参考借鉴意义.  相似文献   

6.
基于语义网络的概念检索研究与实现   总被引:50,自引:8,他引:42  
本文介绍一种基于语义网络的中文搜索引擎概念检索模型,并应用此模型,针对计算机及其应用领域,创建了一个含有500多个概念节点,包括一个分类体系和近300种概念相关关系的语义网络,初步实现了特定领域的概念检索。实验结果表明,该模型对于建设知识化、智能化的中文搜索引擎是非常有用的。  相似文献   

7.
针对潜在语义索引(Latent Semantic Indexing,LSI)计算成本很大,不利于扩展信息检索领域的特点,提出引进图论中的层次搜索方法(Level Search Scheme,LS),设计出一种针对多主题数据集、融合信息检索和信息过滤的新型算法。该方法能够在信息过滤阶段保持高的查全率,在信息检索阶段保证高的查准率,从而最后达到很好的检索效果。 〔关键词〕 潜在语义索引 层次搜索 奇异值分解(SVD)  相似文献   

8.
数字视频内容管理的一个关键问题是视频内容的智能检索和推荐。文章提出利用关键词和概念之间语义上的关联,建立视频数据、关键词和概念之间的语义关联网络,以及利用关联网络对关键词进行规范和扩展,采用扩展结果对视频元素据进行检索的方法,并用检索结果和关键词的关联程度对结果进行筛选和排序。  相似文献   

9.
基于潜语义标引的自然语言检索   总被引:3,自引:0,他引:3  
在信息检索中, 向量空间模型是最有效的数学工具之一。由于自然语言检索的特殊性, 以及传统信息检索模型受到同义词、多义词的影响, 检索的查准率不高。为了提高自然语言检索的查准率, 我们对基于概念的信息检索模型——
潜语义标引(LS I) 模型进行了探讨, 并分析了基于LS I 的两个实例。  相似文献   

10.
结合语义相似度与相关度的概念扩展   总被引:6,自引:0,他引:6  
聂卉  龙朝晖 《情报学报》2007,26(5):728-732
本文研究在本体构建的语义网环境下,量化领域概念的关联程度扩展概念,实现概念检索的问题.利用语义的层次结构和蕴涵关联计算语义相似度和相关度,并结合二者,提出语义扩展度的概念及计算方法,由此控制调整扩展概念集的范围和大小.经过实例计算与分析,验证并阐明了该方法的合理性、有效性及其特点.  相似文献   

11.
Latent Semantic Indexing (LSI) is a popular information retrieval model for concept-based searching. As with many vector space IR models, LSI requires an existing term-document association structure such as a term-by-document matrix. The term-by-document matrix, constructed during document parsing, can only capture weighted vocabulary occurrence patterns in the documents. However, for many knowledge domains there are pre-existing semantic structures that could be used to organize and categorize information. The goals of this study are (i) to demonstrate how such semantic structures can be automatically incorporated into the LSI vector space model, and (ii) to measure the effect of these structures on query matching performance. The new approach, referred to as Knowledge-Enhanced LSI, is applied to documents in the OHSUMED medical abstracts collection using the semantic structures provided by the UMLS Semantic Network and MeSH. Results based on precision-recall data (11-point average precision values) indicate that a MeSH-enhanced search index is capable of delivering noticeable incremental performance gain (as much as 35%) over the original LSI for modest constraints on precision. This performance gain is achieved by replacing the original query with the MeSH heading extracted from the query text via regular expression matches.  相似文献   

12.
在领域本体的基础上,对面向专利文献的语义检索与分析方法进行探讨,并构建一套专利语义检索与分析系统,包括语义检索、趋势分析、相似专利检测、重要专利检测等模块,初步实现基于领域本体的专利语义检索与挖掘。同时,以国际专利分类号为C21的中文专利数据为例进行实验,证明本体扩展后的语义检索的召回率得到大幅提高,继而使得后续的专利分析和挖掘效果更加明显,从而有助于进一步深入开展专利挖掘工作。  相似文献   

13.
问答式信息检索是新一代搜索引擎,它接收自然语言描述的问题,在文档集合中搜索并返回问题的精确答案.问答式信息检索中,检索模块性能的提高将直接影响问题回答系统的整体性能.本文研究系统中的查询优化技术,包括两种策略:基于模式知识库的查询优化;挖掘Web语义蕴含信息,构建查询扩展资源.本文利用TREC提供的问题集与答案集(TREC8-TREC13)做实验来测试查询优化方法的性能,实验结果表明,相对于传统的查询生成,本文采用的查询优化技术在检索精度上取得了提高,t-test结果证明,系统性能提高统计显著.  相似文献   

14.
针对现有元数据索引方法因其固有的缺陷而难以应用于复杂的语义网络,提出一种新的基于语义的元数 据索引查询方法。该方法以RDF图为数据模型,在路径索引的基础上,为元数据建立索引,并通过路径表达式实现元数据的查询。它能有效的促进领域知识的共享和语义表达,提高元数据的检索效率和查准率,为用户和应用提供语义查询和信息汇集能力。  相似文献   

15.
Wiki知识元语义图研究   总被引:6,自引:2,他引:4  
从检索模型的视角看,知识检索系统的焦点在于语义和知识组织.数据检索和信息检索是通过标引组织数据和文献,而知识检索则是通过链接知识元和知识结构组织知识.与此同时,Wiki越来越成为内容管理和知识管理的一种流行工具.本文提出了一种基于Wiki平台的知识元语义图系统.分析了Wiki平台的知识组织与管理模式,给出了知识元库系统模型,知识元的抽取算法和知识元语义图模型.讨论了Wiki平台的搭建和语义Wiki页面的创建步骤.实现了Wiki网站上的知识元语义图系统.试验表明,基于Wiki平台的知识元语义图对知识交流和思想创新有促进作用.  相似文献   

16.
Efficient information searching and retrieval methods are needed to navigate the ever increasing volumes of digital information. Traditional lexical information retrieval methods can be inefficient and often return inaccurate results. To overcome problems such as polysemy and synonymy, concept-based retrieval methods have been developed. One such method is Latent Semantic Indexing (LSI), a vector-space model, which uses the singular value decomposition (SVD) of a term-by-document matrix to represent terms and documents in k-dimensional space. As with other vector-space models, LSI is an attempt to exploit the underlying semantic structure of word usage in documents. During the query matching phase of LSI, a user's query is first projected into the term-document space, and then compared to all terms and documents represented in the vector space. Using some similarity measure, the nearest (most relevant) terms and documents are identified and returned to the user. The current LSI query matching method requires that the similarity measure be computed between the query and every term and document in the vector space. In this paper, the kd-tree searching algorithm is used within a recent LSI implementation to reduce the time and computational complexity of query matching. The kd-tree data structure stores the term and document vectors in such a way that only those terms and documents that are most likely to qualify as nearest neighbors to the query will be examined and retrieved.  相似文献   

17.
一种面向用户兴趣的个性化语义查询扩展方法   总被引:1,自引:0,他引:1  
在基于本体的语义查询扩展研究的基础上,结合用户模型的研究,提出要将用户的兴趣模型与查询扩展相结合,实现个性化的语义查询扩展,并把个性化的语义查询扩展过程分为两个阶段——检索关键词向用户模型中的个性化领域本体概念的映射以及在本体层次对映射概念的语义扩展,给出每一阶段的实现算法。实验表明该方法能够提高信息检索的查准率和查全率,在一定程度上满足个性化的查询需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号