首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 937 毫秒
1.
基于XML的全文检索原型系统的设计与实现*   总被引:1,自引:0,他引:1  
针对当前单位网站搜索引擎存在的索引速度慢、更新不及时、检索效率低等问题,在深入分析和研究Lucene和XML等技术在建立搜索引擎方面优越性能的基础上,构建一个基于XML的全文检索原型系统。该系统以XML作为通用数据接口,以Lucene作为实现平台,能够实现快速及时索引和提高检索效率的目的。  相似文献   

2.
书目搜索引擎是一种类似于网络搜索引擎的目录检索系统,它使用开放源代码软件工具包Lucene2.0来实现.文章首先讨论了当前主流目录检索系统的检索界面使用上的不便之处,然后提出了书目搜索引擎的设计思路,接着详细地分析了书目搜索引擎的关键技术与实现方法,最后给出应用的具体案例.  相似文献   

3.
基于Lucene的中文字典分词模块的设计与实现   总被引:8,自引:1,他引:8  
在分析Lucene语言分析器结构的基础上,采用基于中文字典的正向最大匹配分词算法,设计实现能够在基于Lucene的搜索引擎中处理中文信息的中文分词模块。  相似文献   

4.
基于Lucene的Ftp搜索引擎的设计   总被引:2,自引:0,他引:2  
针对当前网络中所使用的基于数据库的Ftp搜索引擎没有标准资源文档且不支持中文分词和动态数据更新的缺陷,提出基于Lucene这个功能强大的全文索引引擎工具包的Ftp搜索引擎的设计方案。此Ftp搜索引擎不仅能够自动生成标准格式的XML资源文档,而且采用基于字典的前向最大匹配中文分词法在Lucene中动态更新全文索引。该设计还能够对检索关键字进行中英文混合分析和检索。  相似文献   

5.
针对通用搜索引擎存在搜索不够快速、不够深入、不够准确的缺点,本文设计并实现了旅游信息搜索网络蜘蛛,给出了该网络蜘蛛对旅游网页的主题相关度进行预测和判断的算法.该算法保证了网络蜘蛛只采集旅游主题相关的网页,使得垂直搜索引擎在查询的准确率和效率上都有显著地提高.最后通过实现一个旅游信息垂直搜索系统,给出了其信息搜集模块、信息处理模块和信息搜索模块的设计与实现.  相似文献   

6.
许琦  顾新建  胡恒杰 《情报学报》2007,26(4):588-593
通用搜索引擎虽然功能强大,但存在一些缺陷,如索引库更新不及时、响应速度慢等,而且没有对检索结果根据用户的个人需求做过滤处理.针对这些问题,本文主要从用户个性化需求出发对个性化搜索系统进行了研究,阐述了基于全文索引工具包Lucene所研究开发的一种个性化智能搜索引擎系统.首先介绍了系统的结构模型和工作流程,然后对系统各模块的设计做了详细的研究.实验结果表明,在面向用户定制的站点的信息检索服务中,系统的综合性能比通用搜索引擎有所提高.  相似文献   

7.
针对当前网络环境下专业化学科信息服务需求的不断提高,简要介绍开源全文检索软件Lucene的特点,基于该软件设计实现学科信息服务平台的索引模块和检索模块,并就全文检索的性能与通用关系型数据库进行对比分析。对比结果表明,Lucene开源软件可有效提高学科信息服务平台的检索能力。  相似文献   

8.
基于Lucene的Web站点站内全文检索系统的设计与实现   总被引:1,自引:0,他引:1  
曹强 《图书情报工作》2007,51(9):124-126,144
设计一个基于开源检索工具包Lucene的Web站点站内全文检索系统,详述系统的设计思路与体系架构,并对中英文分词和添加文档索引等关键技术给出具体代码和实现步骤;最后对该系统进行简单的性能测试并与通用搜索引擎的检索结果进行查全率和查准率方面的比较。  相似文献   

9.
.NET环境下跨库检索系统的设计与检索代理的实现   总被引:3,自引:0,他引:3  
讨论了跨库检索的产生原因和实现方式,并借鉴元搜索引擎原理,设计了一个跨库检索系统模型,并就其检索代理模块在.NET环境下的实现进行了详细阐述  相似文献   

10.
基于AIMLBot智能机器人软件,利用"海量智能分词"和Lucene.net对机器人的中文知识库进行分词和索引检索,运用《知网》对用户输入问句与知识库问句进行相似度计算,获取相似度最高的知识问句进行推理,从而实现机器人在图书馆实时虚拟参考咨询中的服务。  相似文献   

11.
搜索引擎从1990年诞生到1993年大批涌现,发展至今,主要类型有:目录式搜索引擎、机器人搜索引擎、垂直搜索引擎和元搜索引擎.未来的搜索引擎将朝着程序智能化、检索知识化和提供多媒体化方向发展.  相似文献   

12.
美国NARA在线档案信息资源检索现状分析及启示   总被引:3,自引:0,他引:3  
从分类浏览、在线数据库与检索工具检索和网站检索三方面,阐述和分析了美国国家档案与文件署(NARA)在线档案信息资源检索的现状,指出了NARA对发展我国在线档案信息资源检索的启示:强化在线档案信息资源整合建设,实现一站式检索;倡导以用户需求至上为核心的检索设计理念,提供多元化的检索服务方式;积极推进与著名搜索引擎的合作,让更多互联网用户轻松获取在线档案信息资源。  相似文献   

13.
Lucene全文检索的应用及检索效率测试研究   总被引:1,自引:0,他引:1  
使用Lucene设计一个全文检索系统,系统由三大功能模块组成:索引模块、检索模块和存储模块.第二部分着重分析PDF数据转换,XML文档设计,索引的分词、建立及效率等技术难点,并对中文分词分析器、索引文件膨胀率、索引影响因子及检索系统并对检索响应时间进行测试.应关注XML数据库的安全性.  相似文献   

14.
杨子伍 《图书馆学刊》2006,28(5):126-127
通过对MPEG7的介绍,讨论了基于内容的多媒体检索技术,叙述了搜索引擎的系统结构和各模块的具体实现,展望了基于内容的多媒体检索技术在数字图书馆中的应用价值。  相似文献   

15.
本文阐述了面向主题信息服务的发展方向,分析了垂直搜索引擎的特点,提出了面向主题信息服务的垂直搜索引擎的模块设计。  相似文献   

16.
1医学信息搜索引擎1.1国内常用的医学搜索引擎 1.1.1健康网搜索引擎(http://search.39.net)健康网搜索引擎是面向广大网友的健康资讯检索系统,提供“全文检索”,“标题检索”,“简介检索”三种检索方式,通过主题词(关键词)匹配查询所需信息。  相似文献   

17.
搜索引擎从1990年诞生到1993年大批涌现,发展至今,主要类型有:目录式搜索引擎、机器人搜索引擎、垂直搜索引擎和元搜索引擎。未来的搜索引擎将朝着程序智能化、检索知识化和提供多媒体化方向发展。  相似文献   

18.
Nutch是一个开放源代码的web搜索引擎,是以Lucene为基础实现的搜索引擎应用程序,由于不夹杂商业利益,它对搜索结果的排序算法较为透明公平。文章重点讨论Nutch的工作原理及其中文分词技术,并尝试构建基于nutch的中文搜索引擎。  相似文献   

19.
Ftp服务器是因特网最主要的服务器之一,其搜索引擎为人们使用Ftp服务提供了很大的方便.基于Lucene而设计的Ftp搜索引擎将会为用户提供更多更好的服务。本文主要论述了设计基于Lucene的Ftp搜索引擎的详细流程。  相似文献   

20.
高校校园网信息资源数量巨大.各信息发布系统的相互独立及多种异构数据源的使用对在校园网范围内进行统一的信息检索设置了障碍.系统着重解决由非结构化文本数据和结构化数据库数据形成的多数据源的集成与整合问题.在Nutch搜索引擎基础上利用Lucene接口对多种源数据建立索引.构建多数据源全文信息检索平台,从而有效地实现全网信息检索并提高检索速度和精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号