共查询到20条相似文献,搜索用时 406 毫秒
1.
2.
王永成 《现代图书情报技术》1991,7(2):2-7
本文讨论了信息检索的本质,研究了信息检索的发展历史,探讨了理想的检索系统的框架,用户的需求分类及理想的评价指标,并针对不同的文献的检索系统推荐了相关的优秀算法,最后,还根据信息检索进化发展的趋势,指出了信息检索发展的四个主攻方向。 相似文献
3.
XML检索系统及其比较研究* 总被引:2,自引:0,他引:2
探讨XML检索与传统信息检索的区别、XML检索的目标与任务以及XML检索系统研究的核心问题,并对现有的几个XML检索系统进行介绍和比较研究。 相似文献
4.
分布式检索系统及其体系结构 总被引:5,自引:0,他引:5
分布式检索是目前网络环境下信息检索的重要技术和方式。分布式检索具有有效性、高性能、高可靠性和低成本等方面的优势 ,因而是数字图书馆、网络检索系统的核心技术。本文介绍了分布式检索中使用的几种查询协议 ,并提出一些分布式信息检索系统的模块结构及实现技术框架。图 1。参考文献 8。 相似文献
5.
超文本检索技术的发展 总被引:7,自引:0,他引:7
谭晓冬 《现代图书情报技术》1994,10(3):29-35
本文讨论了将超文本技术用于信息检索的优越性, 介绍并分析了基于导引浏览和基于提问的两种超文本检索系统中一些有代表性的模型及其检索方法, 认为超文本检索系统必须将超文本技术和传统的检索方法结合起来, 并向智能化方向发展。 相似文献
6.
7.
论文分析了联机检索系统中的知识产权信息检索方式,并对比研究了互联网信息检索与联机检索的联系与区别,免费检索和收费检索的相互关系,提出了联机检索与互联网检索、免费检索与收费检索的相互融合、相互促进的发展趋势。 相似文献
8.
通过对若干个综合性检索系统、书刊检索系统、专利检索系统、标准检索系统等重要的网络科技信息资源数据库的介绍和综合分析,探讨如何熟练地运用一些信息检索工具提高科技信息检索的准确度,以实现网络科技信息资源的充分利用。 相似文献
9.
基于本体的多Agent智能检索系统模型研究* 总被引:1,自引:0,他引:1
针对搜索引擎在信息检索过程中存在的局限性,提出基于本体的多Agent智能检索系统模型,给出模型的体系结构、工作流程和功能描述。系统中智能Agent借助本体知识对检索请求信息进行规范化描述,以提高检索的准确率和覆盖率;各个Agent分工协作完成信息检索与自动更新服务,体现系统的智能化与个性化等特点,为实现高效智能检索系统的研究奠定基础。 相似文献
10.
11.
中文全文检索技术的研究及实现 总被引:9,自引:0,他引:9
本文设计了一个中文全文检索系统 ,在单汉字全文数据库的基础之上进行了全文检索的算法研究 ,提出了针对特定检索策略的计算公式。同时还对检索结果集的排序问题进行了讨论 ,并采用用户反馈信息量 ,使最后检出的结果在应用中不断得到优化 相似文献
12.
Xiangji Huang Fuchun Peng Dale Schuurmans Nick Cercone Stephen E. Robertson 《Information Retrieval》2003,6(3-4):333-362
We propose a self-supervised word segmentation technique for text segmentation in Chinese information retrieval. This method combines the advantages of traditional dictionary based, character based and mutual information based approaches, while overcoming many of their shortcomings. Experiments on TREC data show this method is promising. Our method is completely language independent and unsupervised, which provides a promising avenue for constructing accurate multi-lingual or cross-lingual information retrieval systems that are flexible and adaptive. We find that although the segmentation accuracy of self-supervised segmentation is not as high as some other segmentation methods, it is enough to give good retrieval performance. It is commonly believed that word segmentation accuracy is monotonically related to retrieval performance in Chinese information retrieval. However, for Chinese, we find that the relationship between segmentation and retrieval performance is in fact nonmonotonic; that is, at around 70% word segmentation accuracy an over-segmentation phenomenon begins to occur which leads to a reduction in information retrieval performance. We demonstrate this effect by presenting an empirical investigation of information retrieval on Chinese TREC data, using a wide variety of word segmentation algorithms with word segmentation accuracies ranging from 44% to 95%, including 70% word segmentation accuracy from our self-supervised word-segmentation approach. It appears that the main reason for the drop in retrieval performance is that correct compounds and collocations are preserved by accurate segmenters, while they are broken up by less accurate (but reasonable) segmenters, to a surprising advantage. This suggests that words themselves might be too broad a notion to conveniently capture the general semantic meaning of Chinese text. Our research suggests machine learning techniques can play an important role in building adaptable information retrieval systems and different evaluation standards for word segmentation should be given to different applications. 相似文献
13.
14.
汉字全文检索系统的关键技术与实现 总被引:14,自引:1,他引:13
全文检索作为一种发展迅速的情报检索技术, 在近年来已得到广泛的关注并走向市场。本文在对中西文全文检索系统进行分析比较的基础上, 做出了新的尝试, 提出了一种新的索引建立方式, 并在此基础上实现了支持模糊提问的全文检索。同时独立设计了自己的数据结构和算法, 以及利用V isual C+ + 在W indows 环境下加以实现。最后, 对目前汉字全文检索中仍存在的一些问题进行了探讨。 相似文献
15.
Due to the great variation of biological names in biomedical text, appropriate tokenization is an important preprocessing step for biomedical information retrieval. Despite its importance, there has been little study on the evaluation of various tokenization strategies for biomedical text. In this work, we conducted a careful, systematic evaluation of a set of tokenization heuristics on all the available TREC biomedical text collections for ad hoc document retrieval, using two representative retrieval methods and a pseudo-relevance feedback method. We also studied the effect of stemming and stop word removal on the retrieval performance. As expected, our experiment results show that tokenization can significantly affect the retrieval accuracy; appropriate tokenization can improve the performance by up to 96%, measured by mean average precision (MAP). In particular, it is shown that different query types require different tokenization heuristics, stemming is effective only for certain queries, and stop word removal in general does not improve the retrieval performance on biomedical text. 相似文献
16.
17.
超文本全文检索系统的研究 总被引:4,自引:3,他引:1
全文检索和超文本技术的结合是情报检索领域的一个发展方向, 但目前已有的全文检索系统都缺乏超文本能力, 而超文本系统也缺乏全文检索功能。本文提出了一个超文本全文检索系统的模型, 并介绍了一个基于该模型的试验系统HFTRS (Hypertext Full Text Retrieval System) , 试图就超文本技术和全文检索技术的结合作一探讨。 相似文献
18.
19.
方小容 《现代图书情报技术》1999,15(5):34-37
首先介绍了BDSIRS全文信息检索系统所使用的两种联机检索方式外,又尝试了一种新的联机检索方式。即通过因特网的链路,结合BDSIRS专用检索软件联机检索的方式。结果证明是切实可行的,而且是一条降低费用的有效途径。接着对其全文检索方法、技术进行了探讨,从中得到的检索技巧亦有一定的实用价值。 相似文献
20.
全文检索系统由三大功能模块组成:索引模块、检索模块和存储模块。本文着重分析系统组成和XML数据库的设计、建立倒排索引文件、中文分词等技术难点。同时在此基础之上建立基于Lucene/XML的期刊文献全文检索系统。 相似文献