首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 123 毫秒
1.
查询结果合并是分布式信息检索的重要步骤。本文依据选中信息集中文档重叠的程度以及信息集的同构、异构性,将查询结果的合并策略分3种情况进行分析:选中的信息集所含文档没有或有少量的重叠,选中的信息集同构,选中的信息集异构且所含文档有部分重叠。指出查询结果合并策略的深入研究,对于促进分布式检索技术的发展具有积极意义。  相似文献   

2.
信息资源库的选择是分布式信息检索的重要组成部分。本文分析研究了资源库选择的信息库检索推理网络方法、基于文献排行榜的信息库选择方法、决策理论框架方法以及其他一些方法。指出资源选择方法的深入研究,对于促进分布式信息检索技术的发展具有积极作用。  相似文献   

3.
对等管理信息系统平台研究   总被引:1,自引:0,他引:1       下载免费PDF全文
摘要:为了解决大规模分布式管理信息系统中的高速信息共享等问题,提出了基于对等结构的管理信息系统平台。给出了该系统平台的节点模型、管理策略及信息共享流程;提出了一种结合分布式哈希表和聚类的高速检索方法,保证了用户能够在分布式管理系统中快速的精确检索和分类检索;实现了系统的用户透明;为了保证分布式管理信息系统中的分布式多副本同步,提出了“对等锁”作为数据一致性维护方法。同时,给出了平台的具体实现方法,并给出了实例;实验结果表明,该平台具有良好的信息共享性能、高效的搜索能力和相当的容错能力。  相似文献   

4.
网格技术环境下的数字图书馆信息资源组织模式研究   总被引:1,自引:0,他引:1  
宋苏荣 《现代情报》2008,28(6):114-117
网格环境下的数字图书馆是一个分布式的大型数据库系统,通过对异构信息同构化集成的跨库检索方法进行探讨,构建基于网格技术下数字图书馆信息资源组织管理的模式,论述数字图书馆网格信息资源组织的有效工具,利用网格技术,实现互联网上资源的全面连通,让图书馆信息资源共享成为可能.  相似文献   

5.
赵英 《现代情报》2008,28(5):14-16
在网络环境下,数据的异构和分布是不可避免的.本文提出以中间件加数据集成缓存器集的方法来集成分布式数据,重点研讨在此基础上两种情形的异构数据无缝整合的三种方法,为解决"信息孤岛"问題和实现分布式异构数据的全方位共事提供理论和技术支撑.  相似文献   

6.
为了把分布在不同系统中的数字信息资源整合起来,实现信息资源的统一检索、用户身份统一认证或计费功能,需要针对信息资源系统的不同环境,综合应用多种整合技术。将信息资源整合技术归纳为单点登录技术、WEB服务技术、跨库检索技术、元数据整合技术等,分别对这些技术的适用范围和面临的问题进行了详细的分析与比较,从而有助于信息服务机构在实施分布式数字信息资源共建共享服务平台时选择相应的整合技术。  相似文献   

7.
网络信息资源的知识检索研究   总被引:11,自引:0,他引:11  
陈芳 《情报科学》2005,23(3):420-425
本文介绍信息检索到知识检索的发展,比较知识检索与信息检索的区别和联系,提出基于Internet分布式信息资源的两级检索策略,分析知识检索的发展所需要解决的问题。  相似文献   

8.
王宇 《情报探索》2013,(8):105-107
阐述分布式表征的意义,认为分布式表征可以按语义提取出相似的词并抓住语境。介绍分布式表征的语义关系、随机索引和评价方法等机制。讨论分布式表征的使用,即随机检索如何有效检索相关文本文件。  相似文献   

9.
知识地图在信息检索中的应用研究   总被引:5,自引:0,他引:5  
针对传统信息检索出现的:"忠实表达"问题、无法准确揭示Web信息的内容、检索算法的非语义匹配问题和"词汇孤岛"问题等,提出应用知识地图来改善信息检索的方法.在信息检索过程中通过一个有效的知识地图系统,可以改善用户表达式以及检索结果集的呈现,使得信息检索由语法层面向语义层迈进,提高检索的效率.  相似文献   

10.
廖薇 《内江科技》2010,31(12):154-154
分析了几种基于分布式事件处理模型,在分布式事件处理中设计了一个包括一个标准的程序通信的原子事件集,包括信息发送、接收、重现的事件集,提出了一种基于面向对象的事件消息处理模型。  相似文献   

11.
科技信息的网络动态监测和信息自动获取技术研究   总被引:1,自引:0,他引:1  
赵燕平  朱东华 《科学学研究》2003,21(Z1):230-237
文章综述了国内外基于Robot的Web信息检索(IR)、定题检索、智能信息检索及其代理以及相关的信息自动获取技术的有关理论、方法和技术,探讨了适合技术预测与评估的需要、用于科学领域专题信息采集的、网络科技信息智能获取的方法和策略。构建了网络科技信息动态监测和信息自动获取系统的总体框架,实现了一个基于Web的系统原型(简称BIT),并分析了该系统的特点。  相似文献   

12.
13.
In this paper, a new source selection algorithm for uncooperative distributed information retrieval environments is presented. The algorithm functions by modeling each information source as an integral, using the relevance score and the intra-collection position of its sampled documents in reference to a centralized sample index and selects the collections that cover the largest area in the rank-relevance space. Based on the above novel metric, the algorithm explicitly focuses on addressing the two goals of source selection; high-recall, which is important for source recommendation applications and high-precision which is important for distributed information retrieval, aiming to produce a high-precision final merged list.  相似文献   

14.
信息检索本质上是对信息需求与信息进行匹配与选择的过程,即运用数学方法,对信息检索系统中的信息及其检索过程加以抽象。信息检索语言是信息检索的独立单元,该单元以组合逻辑为纽带,实现信息检索的科学性与现实性的有机结合。  相似文献   

15.
LexisNexis网上信息检索系统   总被引:3,自引:0,他引:3  
刘秋宏 《情报科学》2006,24(9):1379-1382
作为目前世界上最著名、最权威的网上信息检索系统,特别是法律信息检索系统,LexisNexis无论是在信息收集的广度和深度上,还是在数据加工的规范程度和检索功能的灵活多样上,无论是在数据更新的周期上,还是在使用的方便程度上都深受世界各地用户喜爱与信赖。深入学习和掌握该系统的使用方法将对社会各界人士特别是法律界人士从事信息检索与分析,进行学术研究提供有益帮助。本文对LexisNexis系统比较有特色的功能和检索特点进行了介绍,希望能对读者了解和学习使用该系统提供帮助。  相似文献   

16.
Engineering a multi-purpose test collection for Web retrieval experiments   总被引:1,自引:0,他引:1  
Past research into text retrieval methods for the Web has been restricted by the lack of a test collection capable of supporting experiments which are both realistic and reproducible. The 1.69 million document WT10g collection is proposed as a multi-purpose testbed for experiments with these attributes, in distributed IR, hyperlink algorithms and conventional ad hoc retrieval.WT10g was constructed by selecting from a superset of documents in such a way that desirable corpus properties were preserved or optimised. These properties include: a high degree of inter-server connectivity, integrity of server holdings, inclusion of documents related to a very wide spread of likely queries, and a realistic distribution of server holding sizes. We confirm that WT10g contains exploitable link information using a site (homepage) finding experiment. Our results show that, on this task, Okapi BM25 works better on propagated link anchor text than on full text.WT10g was used in TREC-9 and TREC-2000 and both topic relevance and homepage finding queries and judgments are available.  相似文献   

17.
The increasing number of documents to be indexed in many environments (Web, intranets, digital libraries) and the limitations of a single centralised index (lack of scalability, server overloading and failures), lead to the use of distributed information retrieval systems to efficiently search and locate the desired information. This work is a case study of different architectures for a distributed information retrieval system, in order to provide a guide to approximate the optimal architecture with a specific set of resources. We analyse the effectiveness of a distributed, replicated and clustered architecture simulating a variable number of workstations (from 1 up to 4096). A collection of approximately 94 million documents and 1 terabyte (TB) of text is used to test the performance of the different architectures. In a purely distributed information retrieval system, the brokers become the bottleneck due to the high number of local answer sets to be sorted. In a replicated system, the network is the bottleneck due to the high number of query servers and the continuous data interchange with the brokers. Finally, we demonstrate that a clustered system will outperform a replicated system if a high number of query servers is used, essentially due to the reduction of the network load. However a change in the distribution of the users’ queries could reduce the performance of a clustered system.  相似文献   

18.
数字信息具有复杂的生命过程。典型的信息生命周期包括发现、采集、试用、选择、订购、提供检索、管理与维护、更新或终止八个阶段,数字资源管理系统在信息生命周期的每个阶段发挥着应有的作用。在现有基础上,数字资源管理系统应向标准化、规范化、XML规则、馆间链接、集成化、特色化、智能化的方向发展。  相似文献   

19.
How to merge and organise query results retrieved from different resources is one of the key issues in distributed information retrieval. Some previous research and experiments suggest that cluster-based document browsing is more effective than a single merged list. Cluster-based retrieval results presentation is based on the cluster hypothesis, which states that documents that cluster together have a similar relevance to a given query. However, while this hypothesis has been demonstrated to hold in classical information retrieval environments, it has never been fully tested in heterogeneous distributed information retrieval environments. Heterogeneous document representations, the presence of document duplicates, and disparate qualities of retrieval results, are major features of an heterogeneous distributed information retrieval environment that might disrupt the effectiveness of the cluster hypothesis. In this paper we report on an experimental investigation into the validity and effectiveness of the cluster hypothesis in highly heterogeneous distributed information retrieval environments. The results show that although clustering is affected by different retrieval results representations and quality, the cluster hypothesis still holds and that generating hierarchical clusters in highly heterogeneous distributed information retrieval environments is still a very effective way of presenting retrieval results to users.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号