首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 250 毫秒
1.
彭哲 《图书情报工作》2008,52(6):110-110
全文检索系统由三大功能模块组成:索引模块、检索模块和存储模块。本文着重分析系统组成和XML数据库的设计、建立倒排索引文件、中文分词等技术难点。同时在此基础之上建立基于Lucene/XML的期刊文献全文检索系统。  相似文献   

2.
杨文刚 《北京档案》2012,(10):29-30,33
随着计算机技术的发展,档案信息的检索技术有待提高,垂直搜索引擎作为面向特定主题的搜索引擎,非常适合用来开发专业领域的搜索引擎。介绍了垂直搜索引擎的特点和系统结构,引入了Lucene.net的开源项目,提出了实现基于Lucene.net的档案垂直搜索引擎的设计方案,给出了搜索引擎系统中采集模块、索引模块和检索模块的实现方法。  相似文献   

3.
对开源全文检索引擎Lucene的系统架构、索引与检索过程、语言分析器进行分析的基础上,针对其对中文只能进行单字切分、双字切分的不足,二次开发基于Lucene中英文语言分析器ZH_CNAnalyzer,并给出一个调用此分析器建立索引与检索的实例。  相似文献   

4.
针对当前自建特色数据库检索系统存在的检索效率低、检索途径单一等问题,提出基于开源全文检索引擎Sphinx对特色数据库进行全文检索的方法,详细介绍系统实现的关键技术。通过对比测试,该系统能够提高检索速度和检索质量,满足用户的检索需求。  相似文献   

5.
基于Lucene的Web站点站内全文检索系统的设计与实现   总被引:1,自引:0,他引:1  
曹强 《图书情报工作》2007,51(9):124-126,144
设计一个基于开源检索工具包Lucene的Web站点站内全文检索系统,详述系统的设计思路与体系架构,并对中英文分词和添加文档索引等关键技术给出具体代码和实现步骤;最后对该系统进行简单的性能测试并与通用搜索引擎的检索结果进行查全率和查准率方面的比较。  相似文献   

6.
针对DSpace开源系统基于Lucene的全文索引和关键词检索技术存在的问题,在特色库建设中引入了Solr搜索服务,替换了原有的Lucene分析器,强化了分面搜索、分面浏览、访问统计的发现功能,探索了词汇控制规范检索、分类法强化学科属性、自由词检索方式。  相似文献   

7.
周强 《图书馆学刊》2005,27(2):22-24
首先分析目前书目记录的索引检索方式的缺陷,然后给出利用开源软件Apache Lucene为MARC记录建立全文索引。  相似文献   

8.
Lucene全文检索的应用及检索效率测试研究   总被引:1,自引:0,他引:1  
使用Lucene设计一个全文检索系统,系统由三大功能模块组成:索引模块、检索模块和存储模块.第二部分着重分析PDF数据转换,XML文档设计,索引的分词、建立及效率等技术难点,并对中文分词分析器、索引文件膨胀率、索引影响因子及检索系统并对检索响应时间进行测试.应关注XML数据库的安全性.  相似文献   

9.
基于XML的全文检索原型系统的设计与实现*   总被引:1,自引:0,他引:1  
针对当前单位网站搜索引擎存在的索引速度慢、更新不及时、检索效率低等问题,在深入分析和研究Lucene和XML等技术在建立搜索引擎方面优越性能的基础上,构建一个基于XML的全文检索原型系统。该系统以XML作为通用数据接口,以Lucene作为实现平台,能够实现快速及时索引和提高检索效率的目的。  相似文献   

10.
本文阐述电子文件全文检索的背景及意义,接着分析应用Lucene建立全文检索系统具备的优势,最后应用Lucene建立电子文件全文检索系统。  相似文献   

11.
鑫磐全息数据库和现代图书馆文献信息服务   总被引:1,自引:0,他引:1  
为了在 Internet和 Intranet上提供数据库网络查询服务,图书馆需要将现有的数据库进行加工(如转换成全文数据库)。鑫磐公司的鑫磐全息数据库GSADB,为文献情报机构提供网络数据库查询服务提供全面解决方案。本文论述了GSADB的数据库定义、索引、因特网互连等关键技术和应用。  相似文献   

12.
[目的/意义] 构建一个基于多语言本体的跨语言信息检索模型,有助于用户通过该模型使用自己熟悉的语言来获取不同语种的信息资源。[方法/过程] 通过本体设计及检索模型功能模块设计建立一个基于数字出版领域本体的中英跨语言信息检索模型,并利用Java语言及Lucene搜索引擎架构对该模型进行编程实现。[结果/结论] 多语言领域本体具有明确、形式化、共享、概念化、结构清晰等特征,可以作为语义层应用于跨语言信息检索系统之中,实现信息资源的语义表达。经测试,本文构建的模型能够较好地实现分词、查询扩展和语义关联等功能,促进跨语言信息检索向语义层次发展。  相似文献   

13.
改版后的维普与同方全文期刊数据库的比较分析   总被引:3,自引:0,他引:3  
论文通过对国内两大期刊全文数据库在收录范围、检索功能、检索效果、个性化服务等方面的对比分析,为读者了解和使用数据库提供参考,为图书情报部门购置数据库提供决策依据。  相似文献   

14.
基于Lucene的中文字典分词模块的设计与实现   总被引:8,自引:1,他引:8  
在分析Lucene语言分析器结构的基础上,采用基于中文字典的正向最大匹配分词算法,设计实现能够在基于Lucene的搜索引擎中处理中文信息的中文分词模块。  相似文献   

15.
综述全文检索系统   总被引:6,自引:1,他引:5  
本文根据近年国内所发表的有关文章和部分国外文献,对全文检索系统涵义、全文数据库的研制、全文本的前处理技术以及文本检索技术作了综述。以期进一步推进我国计算机情报检索事业的发展。  相似文献   

16.
高校图书馆围绕各信息服务系统的整合逐渐深入。文章对国内外高校图书馆基于OPAC系统对电子全文资源实施整合的实践进行了调研,并在此基础上对各馆实现整合的7种模式及各自的优、劣势进行了分析。  相似文献   

17.
基于主题聚类的主题数字图书馆是针对某一个特定的主题,获取与该主题相关的数字资源集合(本文以文本资源为研究对象),然后再依据主题聚类算法,对该主题的信息资源集合进行聚类,生成可供用户浏览的多层次结构导航,结合全文检索实现基于主题聚类的主题数字图书馆系统.主题数字图书馆系统主要包括主题采集模块、主题聚类模块和数据集成模块,构建过程中主要涉及主题提取、主题聚类以及聚类结果描述等三类关键技术.表2.图1.参考文献20.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号