首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 921 毫秒
1.
江腾蛟  万常选 《情报杂志》2006,25(10):48-50
研究了XML文档检索的特性,归纳了XML文档模糊检索的结构放松和内容放松的影响因素。在此基础上,设计了模糊结构和内容检索的结果相关性排序模型;并设计了满足这种排序模型的top-K排序算法和搜索引擎的体系结构。  相似文献   

2.
余宏  万常选 《情报杂志》2007,26(10):51-54
针对XML文档检索的特点,提出了一种基于XSEarch引擎的语义近似检索模型。设计了利用WordNet对查询项进行语义扩展的计算方法,且对XSEarch引擎的答案排序模型进行了改进,并提出了满足近似检索模型的系统体系结构。  相似文献   

3.
【目的/意义】旨在将社会化问答社区中碎片化的答案关联起来,并为用户提供不同主题的高质量答案和更 好的知识服务。【方法/过程】首先,本研究利用Doc2vec算法计算答案之间的语义相似度,并构建答案语义网络。其 次,利用Louvain算法对答案语义网络进行社区划分,并用TextRank算法抽取各个主题下文档的关键词,使用词云 对每个主题进行可视化展示。最后,利用PageRank算法对聚类后的答案语义网络进行排序,从而实现答案文档的 主题聚合和排序。【结果/结论】本研究使用“知乎”上的问答数据进行了实证研究。结果表明,所提出的答案聚合和 排序方法不仅能够向用户直观地展示答案之间的关联强度和各个主题答案的主要内容,还能够为用户提供分主题 的答案排序结果,自动为用户筛选高质量的答案。【创新/局限】创新性地提出了答案语义网络,并基于答案语义网 络,提出了一种集聚合、主题可视化和排序于一体的答案知识组织方法。  相似文献   

4.
随着TBT预测预警系统对信息量需求的急剧增大,而目前通用检索系统检索出的文档信息与专业领域用户需要的准确信息存在着很大的差距,因此我们在目前研究成果的基础上,提出基于本体的TBT文档检索系统模型,并针对语义模型中本体库的构建、文档的语义向量的标引和抽取、相应语义相似度的计算等关键技术提出了新的改进方法,通过实例试验分析证明这种检索方法是有效的。  相似文献   

5.
耿贞伟  马文  张雪坚 《科技通报》2019,35(7):165-168,173
针对当前现有的密文技术存在的不足进行改进,本文提出一种新的安全密文模糊检索算法,该算法的原理是依据关键词在文档的出现的频率进行关键词语义词库的构建。在进行检索的时候,云服务商可以对用户提交的检索关键词利用算法进行扩展,由扩展得到的关键词进行检索,然后对所检索文档进行相关度的排序,返回结果(用户可以指定结果的数量限制,若是设限,则只返回指定数量的方档)。仿真实验结果表明,本文提出的安全密文模糊检索算法具有良好的关键字检索的效率以及安全性能。  相似文献   

6.
基于概念空间的信息检索方法   总被引:7,自引:2,他引:7  
朱连花 《情报科学》2004,22(4):470-474
概念空间方法就是自动构造概念语义网络,并以此为基础进行概念检索的一种方法。它的目标是建立一个知识丰富的、可理解的概念空问,可以代表所在信息空间中的概念及两两之间的关联。具体包括:确定研究领域,训练文档收集;数据预处理,信息过滤和自动标引;共现分析;联想检索四个阶段。概念空间技术通过词语相似度计算,辅助用户选择检索词,促使用户快速、准确地定位所需要查找的信息。笔者对其中部分算法进行模拟和实验,实验表明这种技术具有可行性。  相似文献   

7.
李江华  时鹏 《情报杂志》2012,31(4):112-116
Internet已成为全球最丰富的数据源,数据类型繁杂且动态变化,如何从中快速准确地检索出用户所需要的信息是一个亟待解决的问题.传统的搜索引擎基于语法的方式进行搜索,缺乏语义信息,难以准确地表达用户的查询需求和被检索对象的文档语义,致使查准率和查全率较低且搜索范围有限.本文对现有的语义检索方法进行了研究,分析了其中存在的问题,在此基础上提出了一种基于领域的语义搜索引擎模型,结合语义Web技术,使用领域本体元数据模型对用户的查询进行语义化规范,依据领域本体模式抽取文档中的知识并RDF化,准确地表达了用户的查询语义和作为被查询对象的文档语义,可以大大提高检索的准确性和检索效率,详细地给出了模型的体系结构、基本功能和工作原理.  相似文献   

8.
基金项目评审管理中智能交互式文档检索   总被引:4,自引:0,他引:4  
讨论了非结构化文档信息的检索模型,分析了传统交互式信息检索方法,提出了面向基金项目文档查询的智能交互式信息检索过程和处理流程。基于用户评价项目文档的反馈信息,采用ID3算法、CLCC算法和SVM分类函数分别学习用户查询的潜在意图和目标,并应用所学习的规则知识或分类函数支持项目文档查询。以某基金评审管理中项目文档的查询为例进行了实验计算与分析。  相似文献   

9.
罗卫  邹凯 《情报杂志》2007,26(4):113-115
语义关联检索模型作为一个嵌入式组件存在,它通过对用户提交的检索表达式进行语义分析,形成扩展的检索条件子句,实现基于语义关联的检索范围的合理扩大;同时,它根据扩展的检索条件子句中的元素在语义上的关联程度确定各元素的权值,从而实现相应检索结果根据权值大小的排序输出。  相似文献   

10.
基于专利审查和检索系统智能化升级项目的应用和推广,在优化智能高效的专利审查工作平台和国家知识产权战略的背景下,本文利用三个实际案例,探索了智能化升级检索系统中语义检索策略机理,通过语义结合布尔检索、修改语义分词、调整排序基准进行语义检索三方面,拓展了语义检索在检索方式上的思路,提高检索效率,助力提质增效.  相似文献   

11.
With ever increasing information being available to the end users, search engines have become the most powerful tools for obtaining useful information scattered on the Web. However, it is very common that even most renowned search engines return result sets with not so useful pages to the user. Research on semantic search aims to improve traditional information search and retrieval methods where the basic relevance criteria rely primarily on the presence of query keywords within the returned pages. This work is an attempt to explore different relevancy ranking approaches based on semantics which are considered appropriate for the retrieval of relevant information. In this paper, various pilot projects and their corresponding outcomes have been investigated based on methodologies adopted and their most distinctive characteristics towards ranking. An overview of selected approaches and their comparison by means of the classification criteria has been presented. With the help of this comparison, some common concepts and outstanding features have been identified.  相似文献   

12.
This paper presents a novel IR-style keyword search model for semantic web data retrieval, distinguished from current retrieval methods. In this model, an answer to a keyword query is a connected subgraph that contains all the query keywords. In addition, the answer is minimal because any proper subgraph can not be an answer to the query. We provide an approximation algorithm to retrieve these answers efficiently. A special ranking strategy is also proposed so that answers can be appropriately ordered. The experimental results over real datasets show that our model outperforms existing possible solutions with respect to effectiveness and efficiency.  相似文献   

13.
RSS: A framework enabling ranked search on the semantic web   总被引:1,自引:0,他引:1  
The semantic web not only contains resources but also includes the heterogeneous relationships among them, which is sharply distinguished from the current web. As the growth of the semantic web, specialized search techniques are of significance. In this paper, we present RSS—a framework for enabling ranked semantic search on the semantic web. In this framework, the heterogeneity of relationships is fully exploited to determine the global importance of resources. In addition, the search results can be greatly expanded with entities most semantically related to the query, thus able to provide users with properly ordered semantic search results by combining global ranking values and the relevance between the resources and the query. The proposed semantic search model which supports inference is very different from traditional keyword-based search methods. Moreover, RSS also distinguishes from many current methods of accessing the semantic web data in that it applies novel ranking strategies to prevent returning search results in disorder. The experimental results show that the framework is feasible and can produce better ordering of semantic search results than directly applying the standard PageRank algorithm on the semantic web.  相似文献   

14.
网络信息检索的发展方向   总被引:6,自引:1,他引:6  
介绍了网络信息检索的发展方向,包括新一代的搜索引擎、可视化检索、语义检索、多媒体检索、P2P检索以及基于网格的信息检索。  相似文献   

15.
赵金海  赵西安 《现代情报》2008,28(1):218-220,223
从优秀搜索引擎、搜索引擎网站、搜索引擎论坛、搜索引擎新闻和搜索引擎会议等方面入手,对国外现有论述搜索引擎的主要资源、种类、性能和特色进行了述评.在此基础上,推荐有关搜索引擎的最佳资源,为人们学习掌握搜索引擎的资源、搜索技巧、方法和优化检索策略提供参考资料和学习途径.  相似文献   

16.
Document similarity search (i.e. query by example) aims to retrieve a ranked list of documents similar to a query document in a text corpus or on the Web. Most existing approaches to similarity search first compute the pairwise similarity score between each document and the query using a retrieval function or similarity measure (e.g. Cosine), and then rank the documents by the similarity scores. In this paper, we propose a novel retrieval approach based on manifold-ranking of document blocks (i.e. a block of coherent text about a subtopic) to re-rank a small set of documents initially retrieved by some existing retrieval function. The proposed approach can make full use of the intrinsic global manifold structure of the document blocks by propagating the ranking scores between the blocks on a weighted graph. First, the TextTiling algorithm and the VIPS algorithm are respectively employed to segment text documents and web pages into blocks. Then, each block is assigned with a ranking score by the manifold-ranking algorithm. Lastly, a document gets its final ranking score by fusing the scores of its blocks. Experimental results on the TDT data and the ODP data demonstrate that the proposed approach can significantly improve the retrieval performances over baseline approaches. Document block is validated to be a better unit than the whole document in the manifold-ranking process.  相似文献   

17.
席彩丽  李莹 《现代情报》2010,30(12):15-17,21
数字图书馆现有的检索引擎和检索技术由于无法提供上下文的语义信息,已经无法满足用户的检索需求。语义网技术可以很好的表达数字图书馆的内容,因此将语义网相关技术引入数字图书馆检索可以提高检索的精度。虽然数字图书馆的信息资源利用元数据表达并可以通过OAI-PMH进行访问,但是仍有很大部分需要语义网组件进行完善。在此基础上,提出了一个面向数字图书馆的通用模型的语义框架,这个框架可以满足用户高度个性化的信息需求。  相似文献   

18.
基于机器学习的图像检索机制的研究   总被引:1,自引:1,他引:1  
主要针对当前基于低水平特征的图像检索机制不能捕获图像语义的状况 ,讨论了使用长期学习的方法来学习用户的相关反馈 ,以此推断语义 ,构造语义空间 ,并结合短期学习方法 ,通过运用学习监督机制来推断用户信息需求 ,优化查询 ,逐步提高搜索引擎的性能  相似文献   

19.
赵金海 《现代情报》2007,27(3):62-64
从桌面搜索工具、搜索引擎指南、目录和论著资源等方面入手,对国外现有论述搜索引擎的主要资源的种类、性能和特色进行了述评。在此基础上,推荐有关搜索引擎的最佳资源,为人们学习掌握搜索引擎的资源、搜索技巧、方法和优化检索策略提供参考资料和学习途径。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号