共查询到20条相似文献,搜索用时 234 毫秒
1.
2.
3.
4.
5.
针对基于Lucene实现中文书目搜索系统的项目中,如何选择最合适的Lucene中文分析器进行了研究。通过大量实验,对Lucene自带的3个分析器及开发活跃度较高的两个第三方中文分析器,从分词效果,建立索引的时间和空间,检索的时间、检全率和平均检准率等方面进行了分析比较。综合实验分析结果,指出ik分析器总体性能最优,为最佳选择。 相似文献
6.
在网络教学平台加入定制的Lucene全文搜索引擎,实现了针对各种类型教育资源的全文索引/检索功能。通过在网络教学平台上的应用测试,证明了在网络教学平台上构建一个全文检索引擎是成功的,可以对网络教学平台站内网页中各种教学资源进行全文检索。 相似文献
7.
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lucene分析器、索引包、文档等结构,并给出实现代码示例。 相似文献
8.
讨论了应用Lucene建立站点内信息全文检索系统需要注意的若干关键技术,概要介绍了Lucene全文索引工具包的索引结构与功能特点,进而从实际开发的角度,给出了简单实例,旨在为电子商务系统开发人员提供参考。 相似文献
9.
10.
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lutene分析器、索引包、文档等结构,并给出实现代码示例。 相似文献
11.
12.
自然语言处理技术在中文全文检索中的应用 总被引:1,自引:0,他引:1
自然语言处理技术是中文全文检索的基础.首先介绍了全文检索技术及自然语言处理技术,接着详细地阐述了自然语言处理技术在中文全文检索中的应用,并对目前基于自然语言处理技术的中文全文检索技术的局限性进行了分析,探讨了中文全文检索技术的未来发展方向. 相似文献
13.
14.
全文检索系统为用户提供了一个便捷、高效地通向文献信息内容的接口。本文通过开源搜索引擎Xunsearch技术的应用,以张学良文献库为例,实现了特色文献库全文检索系统的构建。其中重点介绍系统构建思路、系统设计目标以及关键技术的实现过程,最后以检索示例阐述系统实现的功能和效果。 相似文献
15.
16.
如何在海量的非结构文档内容中准确、快捷找到自己所需要的信息,是信息检索技术的研究重点。全文检索是现代信息检索技术一个非常重要的分支,是解决非结构化数据检索需求的重要技术手段。以已发布的各类通信业务管理规范的全文检索需求为切入点,设计并实现了适用于国家级气象信息化业务管理的非结构化文档全文检索系统。该系统基于Java技术,并采用Lucene技术框架,对业务规范信息进行了分析和重新数据组织,确保良好的检索时效与准确率。系统应用后能快速应对业务变化,在已有的大量的规定、规范、标准和公文函件中迅速、准确、全面地查找有关资料信息,帮助用户准确把握气象信息化发展脉络。 相似文献
17.
首先介绍了基于Internet的搜索引擎的系统结构以及主流搜索引擎的工作原理,在对高性能的爬虫工具包Heritrix和可扩展的Java全文索引工具包Lucene进行系统分析的基础上,设计了整个搜索引擎的构架,并使用Java语言初步实现了"SoEdu"搜索引擎。 相似文献
18.
通过建设双层PDF全文数据库、创建索引和全文检索等实现过程来阐述相关技术的研究和运用。以建设全文数据库为基础,研究结构化信息与非结构化数据的合并管理,对目录数据和全文数据的同步索引,基于Lucene技术,实现档案管理系统的一站式智能化档案全文检索,提升档案查全率。 相似文献
19.
随着互联网信息技术的快速发展,搜索引擎在全文检索技术上开始逐步发展起来。全文检索技术是搜索引擎的技术基础。全文检索通常指文本全文检索,它包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索,自20世纪60年代,国外对全文检索技术就开始着手研究。下文主要针对全文检索搜索引擎的基本组成和数据结构进行分析。 相似文献
20.
本文对目前搜索引擎用到的非常流行的Lucene开发包进行了阐述,介绍了Lucene的特点、采用的技术与开发包结构,重点进行了技术分析,研究了Lucene的系统结构,并对Lucene的数据流以及并发控制进行了说明。 相似文献