首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于XML的全文检索原型系统的设计与实现*   总被引:1,自引:0,他引:1  
针对当前单位网站搜索引擎存在的索引速度慢、更新不及时、检索效率低等问题,在深入分析和研究Lucene和XML等技术在建立搜索引擎方面优越性能的基础上,构建一个基于XML的全文检索原型系统。该系统以XML作为通用数据接口,以Lucene作为实现平台,能够实现快速及时索引和提高检索效率的目的。  相似文献   

2.
开放获取资源统一访问平台全文检索工具的设计与实现   总被引:2,自引:0,他引:2  
就如何实现OA资源的全文检索进行探讨,分别阐述目前OA资源检索平台的现状及实现全文检索的难点,提出并实现以搜索引擎为代理自动完成对OA资源全文进行检索的技术方法,且对该方法从系统设计和技术细节两方面进行解析。测试表明,以搜索引擎为代理的OA资源统一访问平台的全文检索工具的检索效率及质量基本令人满意。  相似文献   

3.
本文指出全文检索的实质是"关键词检索 计算机辅助文本浏览".详细分析了全文检索适应的和不适应的检索范围,说明它有较大局限性.对索引的一般原理和两大类型索引的功能作了说明,并与全文检索的功能作了比较,指出全文检索不可能取代各种索引的功能.最后指出全文数据库的两种理想模式.  相似文献   

4.
基于混合索引的中文全文检索系统研究   总被引:1,自引:0,他引:1  
在中文全文检索系统中引入了混合索引,建立了混合索引之Hash索引,给出了Hash索引在内存中的存储结构,并给出了这种索引下的检索算法。这种索引既能保证索引的全面性,又能提高系统检索效率。通过实际构建系统,探讨了基于混合索引的中文全文检索系统的实现。  相似文献   

5.
基于Lucene的Web站点站内全文检索系统的设计与实现   总被引:1,自引:0,他引:1  
曹强 《图书情报工作》2007,51(9):124-126,144
设计一个基于开源检索工具包Lucene的Web站点站内全文检索系统,详述系统的设计思路与体系架构,并对中英文分词和添加文档索引等关键技术给出具体代码和实现步骤;最后对该系统进行简单的性能测试并与通用搜索引擎的检索结果进行查全率和查准率方面的比较。  相似文献   

6.
搜索引擎中完善关键词检索功能的探索   总被引:7,自引:0,他引:7  
关键词检索是搜索引擎的两大基本检索功能之一。文章在简述和分析搜索引擎增强关键词检索功能措施的基础上,着重探讨了运用分类主题一体化的原理、方法组织索引。完善中文搜索引擎关键词检索功能的问题。  相似文献   

7.
面对搜索引擎基于关键词全文检索导致检索准确度低和学科信息门户加工描述只到站点级别的问题,作者提出了将搜索引擎和学科信息门户结合构建智能学科门户搜索引擎的建议--在经过学科专家筛选的、学科信息门户目录中的高质量网站中自动收集网页,形成网页索引,利用自动标引与自动分类方法对收集到的网页进行标引和分类,最后通过分类浏览目录与主题词检索的方式,向用户提供学术资源网页的查找.文章重点介绍了智能学科门户搜索引擎的网页采集、网页自动标引与自动分类及用户接口的设计与实现,并对该搜索引擎存在的问题进行了分析和讨论.  相似文献   

8.
基于词索引的中文全文检索关键技术及其发展方向   总被引:2,自引:0,他引:2       下载免费PDF全文
基于词索引的中文全文检索的研究是一个涉及到多个领域的综合性课题。汉语自动分词的精度和速度、词索引数据库的结构、词汇控制技术、检索匹配机制等是影响中文全文检索效果的关键因素。目前基于词索引的中文全文检索技术还在分词技术、网络信息标引的准确率、查全率、查准率以及查询方式上存在局限。未来的中文全文检索将最终在语义、语用、语境层次上实现智能化的信息检索。  相似文献   

9.
论搜索引擎的原理和检索特性   总被引:19,自引:0,他引:19  
本文主要阐述了Internet信息检索的发展历程,探讨了 Web搜索引擎的服务类型及其运行原理, 指出决定搜索引擎特性的三个主要因素:搜索软件、索引软件和检索软件,论述了Web搜索引擎的基本特性、检索特性及其特殊检索功能,并就搜索引擎与“传统”联机检索系统之间的关系提出了自己的见解。  相似文献   

10.
基于Solr的中文农业期刊文摘检索系统的构建研究   总被引:2,自引:0,他引:2  
简要介绍企业级开源全文检索系统Solr的发展历史、系统架构和特色功能,设计基于Solr的中文农业期刊文摘检索系统的体系架构,通过对Solr的本地化部署、索引文件创建、用户交互界面的设计与实现构建原型系统。该系统初步具备多入口高效检索、分面导航检索、相似文献查找等功能。  相似文献   

11.
杨文刚 《北京档案》2012,(10):29-30,33
随着计算机技术的发展,档案信息的检索技术有待提高,垂直搜索引擎作为面向特定主题的搜索引擎,非常适合用来开发专业领域的搜索引擎。介绍了垂直搜索引擎的特点和系统结构,引入了Lucene.net的开源项目,提出了实现基于Lucene.net的档案垂直搜索引擎的设计方案,给出了搜索引擎系统中采集模块、索引模块和检索模块的实现方法。  相似文献   

12.
全文检索是一种很重要的检索途径,弥补了目录检索的不足,也解决了目录著录不全、不规范等问题,大幅度提高了查全率。全文检索是通过对双层PDF文件的Text层进行索引.因此大大提升检索速度  相似文献   

13.
一种基于Lucene检索引擎的全文数据库的研究与实现   总被引:15,自引:0,他引:15  
在对数据库有关技术分析的基础上,分析对比了全文数据库的特点和关键所在。介绍了实现全文检索的工具包Lucene搜索引擎,并将其引入具体应用,对全文数据库索引和查找技术进行研究,提出并实现了无需后台数据库的全文数据库组织方式,事实表明,索引和查找的时空效率都很高。  相似文献   

14.
分析了基于 Microsoft Search Service为图书馆自建数据库创建 Web全文检索系统的理由、Microsoft SearchService的索引机制和检索机制 ,并运用 ASP.NET技术给出了一个具体的实现方案  相似文献   

15.
面向大规模语料库的全文检索系统研究   总被引:1,自引:0,他引:1  
随着语料库规模的不断扩大和基于语料库的应用研究逐步拓展,对语料库的全文检索成为语料库系统中不可缺少的重要的组成部分。文章对面向大规模语料库的全文检索系统的索引模式、检索算法、检索表达式的构建、自动分词、系统组成等进行了研究,并基于大规模语料库的语言文字信息处理和应用研究的需要,开发了中文信息处理系统——“CIPP”。目前该系统具有全文检索、自动分词、语言统计等功能,在千万字数量级的语料库中,其全文平均检索时间小于1秒。  相似文献   

16.
针对目前全文搜索引擎的检索效率低,引擎提供的检索帮助不够完善的实际情况,结合并借鉴诸多检索网站的优点,提出了将检索帮助置于显见位置、普及和改进高级检索、在全文检索中引入分类体系、对搜索引擎的信息来源网站进行主题分类、增加同义词的检索帮助以及引导用户参与设计检索帮助等方面的改进建议。  相似文献   

17.
彭哲 《图书情报工作》2008,52(6):110-110
全文检索系统由三大功能模块组成:索引模块、检索模块和存储模块。本文着重分析系统组成和XML数据库的设计、建立倒排索引文件、中文分词等技术难点。同时在此基础之上建立基于Lucene/XML的期刊文献全文检索系统。  相似文献   

18.
Google和百度两种搜索引擎比较研究   总被引:2,自引:0,他引:2  
从索引数据库、信息检索功能和检索结果等方面对两种著名的搜索引擎Google 和百度进行了详细比较,为用户更好地利用搜索引擎提供参考。并提出两者有待进一步完善的技术建议。  相似文献   

19.
提出了汉字全文检索系统的新的数据结构、建库和检索的算法,完成了程序设计、用于对中国化学文献数据库标题和文摘的检索,测定了索引建立时间、空间消耗和检索的响应时间,计算了每篇文献的长度在不同范围时的高频字数和索引空间消耗,讨论了索引膨胀比与文献长度的关系  相似文献   

20.
1医学信息搜索引擎1.1国内常用的医学搜索引擎 1.1.1健康网搜索引擎(http://search.39.net)健康网搜索引擎是面向广大网友的健康资讯检索系统,提供“全文检索”,“标题检索”,“简介检索”三种检索方式,通过主题词(关键词)匹配查询所需信息。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号