首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
在非结构化对等网络上,提出一种基于查询请求扩展和相似节点聚合的P2P搜索方法.该方法利用用户的搜索行为自动发现关键字之间和节点之间的关系,记录在每个节点上的知识库内并不断更新.在以后的搜索中,利用关键字的关联关系,增加命中目标;利用相似节点的聚合,缩小搜索范围.模拟实验结果证实该方法具有较高的查询命中率和查询准确率.  相似文献   

2.
文本分类是网络主题舆情分析中的关键技术,传统Web文本分类将文本关键词的相似度作为分类依据,丢失许多重要的语义信息,导致分类结果不够准确且计算量大.本文提出一种基于语义相似度的Web文本分类方法,利用特定的领域本体将用关键词表示的文本特征向量表示为与之匹配的语义概念特征向量,给出Web文本相似度的计算公式并实现基于语义相似度的KNN算法.结果表明,该方法从语义概念层次上表示和处理Web文本,降低了文本特征空间维度,减少计算量并提高了分类精确度.  相似文献   

3.
黄猛 《兰台世界》2011,(2):26-27
计算机对等网络(Peer to Peer)是目前在国际网络技术研究中于活跃的领域。本文将P2P技术引入到数字档案馆领域,尝试对档案信息资源的建设、个性化服务、档案利用以及深化档案信息资源网络服务等方面进行优化。  相似文献   

4.
为提高多关键词查询的效率并减少多关键词查询的开销,提出一种基于语义聚类的多关键词查询算法——MKQBSC。该算法使得语义相似的节点聚为一类,节点加入、退出或节点的语义改变时,聚类将相应改变。查询请求在相邻的语义聚类之间转发,直至到达语义相似的聚类。仿真实验结果表明:与传统的基于对倒排表求交集的多关键词查询算法相比,MKQBSC算法所需的路由跳数和所产生的消息数更少。  相似文献   

5.
计算机对等网络(Peer to Peer)是目前在国际网络技术研究中于活跃的领域。本文将P2P技术引入到数字档案馆领域,尝试对档案信息资源的建设、个性化服务、档案利用以及深化档案信息资源网络服务等方面进行优化。  相似文献   

6.
针对传统信息检索模型不能很好满足用户需求的问题,在分析现有相关研究的基础上,提出基于领域Ontology的知识检索模型。通过构建领域Ontology,对文档进行语义标注,对查询请求进行概念提取和语义扩展,从而得到语义索引项作为文档和用户请求的知识表达,进一步研究领域Ontology中词语间语义关系的计算模型。考虑到语义相似度与语义相关的内在关系,给出相关系数来衡量检索目标与候选者间符合程度。最后对提出的模型进行验证,结果表明检索性能有显著提高。  相似文献   

7.
基于本体的语义相似度计算方法研究综述*   总被引:5,自引:0,他引:5  
在对基于本体的词语语义相似度进行界定的基础上,对基于本体的语义相似度研究进行综述,分别阐述基于距离的语义相似度计算、基于内容的语义相似度计算、基于属性的语义相似度计算和混合式语义相似度计算等算法模型,最后从宏观层面指出今后本领域的研究方向。  相似文献   

8.
P2P语议web技术能提供一个环境来支持创建、维护以及控制本体.InfoQuilt系统的实现就是基于P2P语义web技术.详细分析了InfoQuilt系统如何实现P2P语义网络、知识空间构建和维护、基于相关本体的语义检索以及不同本体间的关联操作,并在此基础上对InfoQuilt系统的改进提出了几点看法.  相似文献   

9.
传统的Web文本分类方法将文本中关键词的相似度作为分类的依据,丢失了很多重要的语义信息,导致分类结果不够准确且计算量大。基于此,文章提出了一种基于语义相似度的Web文本分类方法,利用领域本体将用关键词表示的文本特征向量表示为与之匹配的语义概念特征向量集,定义Web文本相似度的计算公式,设计并实现基于语义相似度的KNN算法。实验结果表明,该方法从语义概念层次上表示和处理Web文本,降低了文本特征空间维度,减少了计算量,提高了分类精确度。  相似文献   

10.
近年来XML凭借其自身的简单性、半结构化、可扩展性、自描述性等特点,逐渐成为了互联网数据表示和数据交换的标准.XML文档聚类是数据挖掘研究中热点一个,为网络信息资源的搜集、组织及检索利用提供良好的技术支持.本文首先介绍了目前主要的XML文档聚类算法,然后在利用WordNet对XML文档中的标记进行语义消歧的基础上,提出了一种新的基于语义标记树的XML文档相似度计算方法,并通过最近邻算法进行聚类,最后在用于XML检索研究的数据集上进行实验,证实其确实是一种比较有效的XML文档聚类方法.  相似文献   

11.
基于概念和语义层次的领域本体评价研究   总被引:1,自引:0,他引:1  
领域本体评价是本体论和语义网研究中的重要内容.本文提出了一种基于编辑距离对领域本体中概念之间的相似度进行计算的方法.此外,通过比较给定的领域本体和"黄金标准"之间在概念的实例的安排以及概念本身的等级安排上具有的相似性,可以在语义角度对二者做出相似性判断.本文利用一个已有的军用飞机领域的本体和<中国分类主题词表>进行比较计算.实验结果表明,该方法能较为准确地计算出两个本体的概念集的相似性,也能较好地衡量本体之间的语义关系,从而实现对领域本体的有效评价.  相似文献   

12.
针对对等网知识资源共享模式缺乏语义支持的不足,借鉴利用本体进行信息语义处理的方法,提出一种面向用户的对等网知识资源语义共享模型框架。该共享模型要求对等网中的对等节点具有相同的节点共享架构,该节点共享架构包含5个功能模块:本体管理模块、节点共享信息资源管理模块、用户模型管理模块、查询处理模块和邻接节点管理模块,并分析该框架模型的作用。  相似文献   

13.
信息检索扩展技术研究   总被引:1,自引:0,他引:1  
本文针对信息检索在查询扩展方面的不足,提出了一种结合本体理论和用户相关反馈技术的查询扩展方法。以FirteX作为检索平台, 选取WordNet作为本体扩展资源来验证本文所提出的查询扩展算法,实现结果表明该方法比基于余弦相似性的查询扩展方法在平均查全率、平均查准率方面有更大的优点。  相似文献   

14.
提出了一种基于本体论的智能化查询算法,该算法充分利用本体论的推理功能,把出现在用户查询中的概念、关系以及属性等信息进行综合分析,挖掘出用户的真正需求,从而实现智能化的网络信息查询。  相似文献   

15.
基于领域本体和概念向量的中文文本相似性测度研究   总被引:2,自引:0,他引:2  
文本相似性测度被广泛用于计算用户提问与文档资源相关程度以及基于内容相似资源推荐。OCVSM是一种基于领域本体和概念向量相似性测度的方法。该方法将军用飞机领域知识本体OntoAvion的概念集作为词汇抽取特征项,根据本体中概念间的关系确定特征项的相似度,最后利用余弦算法计算文本向量相似度。实验证明,该方法与基于语言学词典的相似性测度方法相比,更接近用户对文本相似性的判断。表10。图5。参考文献10。  相似文献   

16.
传统的专家识别系统大多采用一组带权重的关键词来表征专家的专长,然而这种基于关键词的专长描述不足以概括专家的研究主题。提出基于领域本体概念的专长表示方法,通过构建相应的领域本体来描述领域核心概念和概念间关系,利用谷歌距离来计算关键词到本体概念的语义相似度,完成关键词到概念的映射,从而得到基于本体概念的专长表示。  相似文献   

17.
同行评议专家遴选的科学计量方法与实证研究   总被引:1,自引:0,他引:1  
将科学评价中的同行评议专家认定问题转化为科学共同体的认定与辨识问题,通过科学计量学领域本体和共词分析等方法,找寻具有相同科学语境和科学概念体系的科学共同体,保证同行评议专家遴选的科学性。
  相似文献   

18.
基于领域本体的语义知识检索研究   总被引:1,自引:0,他引:1  
针对传统知识检索效率低、精度不高等问题,引入本体技术,构建基于领域本体的语义知识检索系统架构,提出综合语义相似度的知识检索算法。算法综合考虑概念间的关系类型、概念所处的层次深度、概念密度、概念间连接的强度以及概念的属性等因素计算语义相似度,避免传统检索中存在的检索精度不高等问题。该模型为构建语义知识检索系统以及解决系统构建中的关键问题提供了理论指导。  相似文献   

19.
面向语义Web的智能数字图书馆的实现很大程度上依赖于本体的建立,本体与数字图书馆中的数字资源采集、数字馆藏和用户访问网关都密切相关。在本体构建方面,目前存在的绝大多数本体都是手工生成的,该方法效率低、出错率高,更难以维护和更新。这对语义级数字图书馆的实现造成了巨大的障碍。为此提出了一种面向数字图书馆的本体学习方法GOLF,通过对各专业领域中大量的Web文档集和语料库进行挖掘来实现本体学习,并分别讨论了本体学习中本体概念的抽取、概念之间语义关系的抽取和分类体系的自动构建等关键技术。  相似文献   

20.
Efficient information searching and retrieval methods are needed to navigate the ever increasing volumes of digital information. Traditional lexical information retrieval methods can be inefficient and often return inaccurate results. To overcome problems such as polysemy and synonymy, concept-based retrieval methods have been developed. One such method is Latent Semantic Indexing (LSI), a vector-space model, which uses the singular value decomposition (SVD) of a term-by-document matrix to represent terms and documents in k-dimensional space. As with other vector-space models, LSI is an attempt to exploit the underlying semantic structure of word usage in documents. During the query matching phase of LSI, a user's query is first projected into the term-document space, and then compared to all terms and documents represented in the vector space. Using some similarity measure, the nearest (most relevant) terms and documents are identified and returned to the user. The current LSI query matching method requires that the similarity measure be computed between the query and every term and document in the vector space. In this paper, the kd-tree searching algorithm is used within a recent LSI implementation to reduce the time and computational complexity of query matching. The kd-tree data structure stores the term and document vectors in such a way that only those terms and documents that are most likely to qualify as nearest neighbors to the query will be examined and retrieved.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号