共查询到20条相似文献,搜索用时 937 毫秒
1.
基于XML的全文检索原型系统的设计与实现* 总被引:1,自引:0,他引:1
针对当前单位网站搜索引擎存在的索引速度慢、更新不及时、检索效率低等问题,在深入分析和研究Lucene和XML等技术在建立搜索引擎方面优越性能的基础上,构建一个基于XML的全文检索原型系统。该系统以XML作为通用数据接口,以Lucene作为实现平台,能够实现快速及时索引和提高检索效率的目的。 相似文献
2.
书目搜索引擎是一种类似于网络搜索引擎的目录检索系统,它使用开放源代码软件工具包Lucene2.0来实现.文章首先讨论了当前主流目录检索系统的检索界面使用上的不便之处,然后提出了书目搜索引擎的设计思路,接着详细地分析了书目搜索引擎的关键技术与实现方法,最后给出应用的具体案例. 相似文献
3.
基于Lucene的中文字典分词模块的设计与实现 总被引:8,自引:1,他引:8
在分析Lucene语言分析器结构的基础上,采用基于中文字典的正向最大匹配分词算法,设计实现能够在基于Lucene的搜索引擎中处理中文信息的中文分词模块。 相似文献
4.
5.
6.
7.
8.
基于Lucene的Web站点站内全文检索系统的设计与实现 总被引:1,自引:0,他引:1
设计一个基于开源检索工具包Lucene的Web站点站内全文检索系统,详述系统的设计思路与体系架构,并对中英文分词和添加文档索引等关键技术给出具体代码和实现步骤;最后对该系统进行简单的性能测试并与通用搜索引擎的检索结果进行查全率和查准率方面的比较。 相似文献
9.
.NET环境下跨库检索系统的设计与检索代理的实现 总被引:3,自引:0,他引:3
陈欣 《现代图书情报技术》2004,20(11):27-31
讨论了跨库检索的产生原因和实现方式,并借鉴元搜索引擎原理,设计了一个跨库检索系统模型,并就其检索代理模块在.NET环境下的实现进行了详细阐述 相似文献
10.
基于AIMLBot智能机器人软件,利用"海量智能分词"和Lucene.net对机器人的中文知识库进行分词和索引检索,运用《知网》对用户输入问句与知识库问句进行相似度计算,获取相似度最高的知识问句进行推理,从而实现机器人在图书馆实时虚拟参考咨询中的服务。 相似文献
11.
搜索引擎从1990年诞生到1993年大批涌现,发展至今,主要类型有:目录式搜索引擎、机器人搜索引擎、垂直搜索引擎和元搜索引擎.未来的搜索引擎将朝着程序智能化、检索知识化和提供多媒体化方向发展. 相似文献
12.
美国NARA在线档案信息资源检索现状分析及启示 总被引:3,自引:0,他引:3
从分类浏览、在线数据库与检索工具检索和网站检索三方面,阐述和分析了美国国家档案与文件署(NARA)在线档案信息资源检索的现状,指出了NARA对发展我国在线档案信息资源检索的启示:强化在线档案信息资源整合建设,实现一站式检索;倡导以用户需求至上为核心的检索设计理念,提供多元化的检索服务方式;积极推进与著名搜索引擎的合作,让更多互联网用户轻松获取在线档案信息资源。 相似文献
13.
Lucene全文检索的应用及检索效率测试研究 总被引:1,自引:0,他引:1
使用Lucene设计一个全文检索系统,系统由三大功能模块组成:索引模块、检索模块和存储模块.第二部分着重分析PDF数据转换,XML文档设计,索引的分词、建立及效率等技术难点,并对中文分词分析器、索引文件膨胀率、索引影响因子及检索系统并对检索响应时间进行测试.应关注XML数据库的安全性. 相似文献
14.
通过对MPEG7的介绍,讨论了基于内容的多媒体检索技术,叙述了搜索引擎的系统结构和各模块的具体实现,展望了基于内容的多媒体检索技术在数字图书馆中的应用价值。 相似文献
15.
16.
娄长春 《中国图书情报科学》2004,(11):64-70
1医学信息搜索引擎1.1国内常用的医学搜索引擎 1.1.1健康网搜索引擎(http://search.39.net)健康网搜索引擎是面向广大网友的健康资讯检索系统,提供“全文检索”,“标题检索”,“简介检索”三种检索方式,通过主题词(关键词)匹配查询所需信息。 相似文献
17.
搜索引擎从1990年诞生到1993年大批涌现,发展至今,主要类型有:目录式搜索引擎、机器人搜索引擎、垂直搜索引擎和元搜索引擎。未来的搜索引擎将朝着程序智能化、检索知识化和提供多媒体化方向发展。 相似文献
18.
张锦炘 《图书馆研究与工作》2009,(1)
Nutch是一个开放源代码的web搜索引擎,是以Lucene为基础实现的搜索引擎应用程序,由于不夹杂商业利益,它对搜索结果的排序算法较为透明公平。文章重点讨论Nutch的工作原理及其中文分词技术,并尝试构建基于nutch的中文搜索引擎。 相似文献
19.
Ftp服务器是因特网最主要的服务器之一,其搜索引擎为人们使用Ftp服务提供了很大的方便.基于Lucene而设计的Ftp搜索引擎将会为用户提供更多更好的服务。本文主要论述了设计基于Lucene的Ftp搜索引擎的详细流程。 相似文献
20.
高校校园网信息资源数量巨大.各信息发布系统的相互独立及多种异构数据源的使用对在校园网范围内进行统一的信息检索设置了障碍.系统着重解决由非结构化文本数据和结构化数据库数据形成的多数据源的集成与整合问题.在Nutch搜索引擎基础上利用Lucene接口对多种源数据建立索引.构建多数据源全文信息检索平台,从而有效地实现全网信息检索并提高检索速度和精度。 相似文献