首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
基于Lucene的全文搜索引擎的设计与实现   总被引:5,自引:0,他引:5  
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lucene分析器、索引包、文档等结构,实现了一个基于Lucene的中文诗词全文搜索应用实例。  相似文献   

2.
基于Lucene的索引系统的设计与实现   总被引:2,自引:0,他引:2  
索引系统是搜索引擎的数据大本营,在搜索引擎发展早期,能够索引的网页数量代表了整个行业的技术发展水平。Lucene全文检索技术是信息检索领域广泛使用的基本技术,它是一个优秀的开源全文本搜索技术框架,本文详细分析了索引系统相关技术和Lucene的索引系统结构。  相似文献   

3.
针对ArcGIS在进行地图多图层搜索时速度慢的问题,利用Lucene全文检索的高效性,提出了一种结合Lucene和数据库技术的地图搜索方式,同时为提高空间最临近点查找效率,设计了基于网格模型的查找算法,在此基础上形成智能地图搜索引擎,并在交通地图服务项目的智能搜索功能中得到实现,证明了该搜索引擎的可行性和优越性.  相似文献   

4.
本文首先简要介绍了 lucene 桌面搜索引擎技术现状,根据桌面搜索的的不足,提出了一种基于 Lucene 的中文搜索引擎设计方案.使用了中文的分词技术的正向最大般配算法解决 lucene 对中文分词存在不足  相似文献   

5.
王泽贤 《现代情报》2014,34(4):132-136
针对基于Lucene实现中文书目搜索系统的项目中,如何选择最合适的Lucene中文分析器进行了研究。通过大量实验,对Lucene自带的3个分析器及开发活跃度较高的两个第三方中文分析器,从分词效果,建立索引的时间和空间,检索的时间、检全率和平均检准率等方面进行了分析比较。综合实验分析结果,指出ik分析器总体性能最优,为最佳选择。  相似文献   

6.
在网络教学平台加入定制的Lucene全文搜索引擎,实现了针对各种类型教育资源的全文索引/检索功能。通过在网络教学平台上的应用测试,证明了在网络教学平台上构建一个全文检索引擎是成功的,可以对网络教学平台站内网页中各种教学资源进行全文检索。  相似文献   

7.
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lucene分析器、索引包、文档等结构,并给出实现代码示例。  相似文献   

8.
讨论了应用Lucene建立站点内信息全文检索系统需要注意的若干关键技术,概要介绍了Lucene全文索引工具包的索引结构与功能特点,进而从实际开发的角度,给出了简单实例,旨在为电子商务系统开发人员提供参考。  相似文献   

9.
为检索医院的药物信息,本文设计了一种基于Lucene的搜索引擎来收集信息的方法,通过在广州、珠海、武汉三家医院对所需信息进行查询,实现了对药物使用信息的索引、全文检索、高级查询、分词、相关性评分、排序等.引擎搜索结果与手工检索一致.本研究证明:医院内部的医药情报是可以用Lucene搜索引擎来获取的;关于医院药物供应是否充足等问题可依据搜索出的数据情报来回答.  相似文献   

10.
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lutene分析器、索引包、文档等结构,并给出实现代码示例。  相似文献   

11.
基于Lucene的电子政务全文检索系统的设计与实现   总被引:1,自引:0,他引:1  
文章分析了目前基于Doulino平台开发的电子政务系统的全文检索系统存在着检索内容丢失、系统响应慢以及不能针对文档中嵌入的各种格式的附件作索引和内客查找等不足之处,提出基于Java Lucene开源框架, 并与其它优秀开源组件进行整合,在Domino6.5平台下实现了一个功能齐全、性能优异的全文检索系统, 取得了良好的效果, 并在实践中获得了应用.  相似文献   

12.
自然语言处理技术在中文全文检索中的应用   总被引:1,自引:0,他引:1  
自然语言处理技术是中文全文检索的基础.首先介绍了全文检索技术及自然语言处理技术,接着详细地阐述了自然语言处理技术在中文全文检索中的应用,并对目前基于自然语言处理技术的中文全文检索技术的局限性进行了分析,探讨了中文全文检索技术的未来发展方向.  相似文献   

13.
全文检索搜索引擎中文信息处理技术研究   总被引:2,自引:0,他引:2  
唐培丽  胡明  解飞  刘钢 《情报科学》2006,24(6):895-899,909
本文深入分析了全文检索中文搜索引擎的关键技术,提出了一种适用于全文检索搜索引擎的中文分词方案,既提高了分词的准确性,又能识别文中的未登录词。针对向量空间信息检索模型,本文设计了一个综合考虑中文词在Web文本中的位置、长度以及频率等重要因素的词条权重计算函数,并且用量化的方法表示出其重要性,能够较准确地反映出词条在Web文档中的重要程度。最后对分词算法进行了测试,测试表明该方法能够提高分词准确度满足实用的要求。  相似文献   

14.
姚天泓 《现代情报》2013,33(12):56-61
全文检索系统为用户提供了一个便捷、高效地通向文献信息内容的接口。本文通过开源搜索引擎Xunsearch技术的应用,以张学良文献库为例,实现了特色文献库全文检索系统的构建。其中重点介绍系统构建思路、系统设计目标以及关键技术的实现过程,最后以检索示例阐述系统实现的功能和效果。  相似文献   

15.
针对当今的学位论文重复率高的现状,文章提出了基于Lucene全文检索在学位论文查重中的重要应用。文章采用的技术主要包括Lucene框架技术,分词技术和搜索查询,并结合多种数据挖掘算法实现论文查重的检测系统,文章主要介绍论文查重的原理、方法和在系统实现过程中用到的核心技术,在技术整合的过程中呈现出该系统的优质性。  相似文献   

16.
如何在海量的非结构文档内容中准确、快捷找到自己所需要的信息,是信息检索技术的研究重点。全文检索是现代信息检索技术一个非常重要的分支,是解决非结构化数据检索需求的重要技术手段。以已发布的各类通信业务管理规范的全文检索需求为切入点,设计并实现了适用于国家级气象信息化业务管理的非结构化文档全文检索系统。该系统基于Java技术,并采用Lucene技术框架,对业务规范信息进行了分析和重新数据组织,确保良好的检索时效与准确率。系统应用后能快速应对业务变化,在已有的大量的规定、规范、标准和公文函件中迅速、准确、全面地查找有关资料信息,帮助用户准确把握气象信息化发展脉络。  相似文献   

17.
首先介绍了基于Internet的搜索引擎的系统结构以及主流搜索引擎的工作原理,在对高性能的爬虫工具包Heritrix和可扩展的Java全文索引工具包Lucene进行系统分析的基础上,设计了整个搜索引擎的构架,并使用Java语言初步实现了"SoEdu"搜索引擎。  相似文献   

18.
向禹  吴世明 《现代情报》2014,34(6):75-78
通过建设双层PDF全文数据库、创建索引和全文检索等实现过程来阐述相关技术的研究和运用。以建设全文数据库为基础,研究结构化信息与非结构化数据的合并管理,对目录数据和全文数据的同步索引,基于Lucene技术,实现档案管理系统的一站式智能化档案全文检索,提升档案查全率。  相似文献   

19.
王畅 《金秋科苑》2011,(6):109-110
随着互联网信息技术的快速发展,搜索引擎在全文检索技术上开始逐步发展起来。全文检索技术是搜索引擎的技术基础。全文检索通常指文本全文检索,它包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索,自20世纪60年代,国外对全文检索技术就开始着手研究。下文主要针对全文检索搜索引擎的基本组成和数据结构进行分析。  相似文献   

20.
本文对目前搜索引擎用到的非常流行的Lucene开发包进行了阐述,介绍了Lucene的特点、采用的技术与开发包结构,重点进行了技术分析,研究了Lucene的系统结构,并对Lucene的数据流以及并发控制进行了说明。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号