共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
设计了全文检索系统,系统由三大功能模块组成:索引模块、检索模块和存储模块.分析PDF数据转换、XML文档设计、索引的分词等技术难点,并对中文分词分析器、索引文件膨胀率、索引影响因子进行测试,在此基础上设计全文检索系统并对检索响应时间进行测试.在结论中指出应关注XML数据库的安全性. 相似文献
3.
中文五大综合搜索引擎主要性能测评 总被引:1,自引:0,他引:1
通过评价实验,从百度瞬时风向标选择实验检索课题集合,从索引数据库性能、检索功能、检索效果、结果显示及用户负担五个方面,采用平均站点索引量、前X命中记录查准率等测评方法,对五大中文综合搜索引擎百度、爱问、搜狗、搜搜和中搜进行评价研究,其中对定量指标进行了重点试验和分析。总结分析了五大中文搜索引擎各自的优势、特色和不足。最后总结出搜索引擎的改进方向和用户选择搜索引擎与实施检索的策略。 相似文献
4.
目前,常用的全文搜索引擎都是基于关键词检索的,其查准率和查全率都较低,并且返回记录太多,重复信息过多,使得搜索引擎的查询效率很低。基于此,提出了一种基于本体的搜索引擎模型,通过提取的文档中概念,确定其所属的领域本体,以此归类,并用文档—概念匹配系数建立索引。搜索时,采用基于概念匹配的方式进行检索,对属于不同领域本体的文档,分类输出。提高搜索引擎的查准率和查全率,减少冗余信息,从而提高搜索引擎的查询效率。 相似文献
5.
本文简单介绍了一种基于Native-XML数据库的全文检索技术,它是以XML文档内容作为索引对象,定义文档和文档属性等,采用BACI倒排算法对信息构建索引,实现基于Web的混合检索。为全文数据库的底层实现提供了技术参考。 相似文献
6.
7.
通过评价实验.从百度瞬时风向标选择实验检索课题集合,从索引数据库性能、检索功能、检索效果、结果显示及用户负担五个方面.采用平均站点索引量、前X命中记录查准率等测评方法.对五大中文综合搜索引擎百度、爱问、搜狗、搜搜和中搜进行评价研究,其中对定量指标进行了重点试验和分析.总结分析了五大中文搜索引擎各自的优势、特色和不足.最后总结出搜索引擎的改进方向和用户选择搜索引擎与实施检索的策略. 相似文献
8.
传统信息检索方法忽视了文档结构对信息检索过程的影响.本文提出了一种改进的基于文档结构的信息检索方法,该方法首先使用第一类特征域对检索文档集进行过滤,然后使用第二类特征域进行匹配排序;引入AHP方法动态确定各特征域的重要性权重因子;最后使用向量内积计算的方法合成总相似度值.实验结果表明该方法可以提高信息检索的查准率和检索结果的排序合理性. 相似文献
9.
Internet已成为全球最丰富的数据源,数据类型繁杂且动态变化,如何从中快速准确地检索出用户所需要的信息是一个亟待解决的问题.传统的搜索引擎基于语法的方式进行搜索,缺乏语义信息,难以准确地表达用户的查询需求和被检索对象的文档语义,致使查准率和查全率较低且搜索范围有限.本文对现有的语义检索方法进行了研究,分析了其中存在的问题,在此基础上提出了一种基于领域的语义搜索引擎模型,结合语义Web技术,使用领域本体元数据模型对用户的查询进行语义化规范,依据领域本体模式抽取文档中的知识并RDF化,准确地表达了用户的查询语义和作为被查询对象的文档语义,可以大大提高检索的准确性和检索效率,详细地给出了模型的体系结构、基本功能和工作原理. 相似文献
10.
基于概念的Web信息检索 总被引:2,自引:3,他引:2
分析了传统检索方法的不足,提出了一种新的检索模型,即一种基于概念的Web信息检索系统。该模型利用自然语言处理技术,在语义层次上进行查询和检索,克服了传统检索方法的不足,提高了查全率与查准率。 相似文献
11.
本文探讨了在基于关键词索引的中文全文检索系统中实现各种截词检索的方法,建立了关键词索引的Hash索引,这种方法即能节省内存又提高检索效率。 相似文献
12.
通过分析搜索引擎的标引方法、索引数据库建立和检索的基本原理,指出了导致其检索效果差、查准率低的根本原因在于标引的质量和引得一致性差,建立一定的检索语言规范、实现规范化标引是提高查准率的有效措施。 相似文献
13.
提出了一种基于机器学习的Web文本自动分类的架构,提出了中文Web文档自动分类的主要技术问题。介绍了中文Web文档自动分类工具的总体设计,它主要包括网络蜘蛛、中文分词、特征选取和贝叶斯分类器等功能模块。最后对中文Web文档自动分类器进行了实验。 相似文献
14.
针对如何从丰富的网络信息资源中进行准确、快速检索有用信息的问题。介绍了基于词条空间矢量搜索的基本理论,设计了基于词条空间矢量搜索的Web信息检索系统模型,并采用Java语言完成了基于词条空间矢量的Web信息混合搜索引擎的设计,应用实验证明,该方法比单一搜索引擎具有更深入、更细致的站内全文搜索能力,比关键词标引具有更准确的文档内容表达能力,在基于内容的查询和信息过滤等方面有很好的应用前景,为实现网上信息检索的个性化服务、主动信息服务,为进一步提高Web信息查询的查全率和查准率提供了一种新的思路和方法。 相似文献
15.
Web搜索引擎是主要基于关键词匹配的检索技术,面对WWW新的应用模式,已不能很好地满足用户的需求。而Web数据挖掘系统是对Web文档集合和用户需求集合的匹配与选择,它通过Web内容挖掘、Web结构挖掘、Web用户使用记录挖掘等数据挖掘方法,从与WWW相关的资源和检索行为中抽取用户感兴趣的、有用的模式和隐含的信息,以满足情报检索的相关性和准确性的要求。因此,可运用相关搜索引擎和相关网站的设计方法,建立军事情报Web挖掘应用系统。 相似文献
16.
检索刊物的质量好坏将直接影响读者对文献的查全率和查准率,如:存贮文献是否齐全,索引系统是否完善以及文献标引的深度等都对查全率有直接影响;索引词的专指性以及是否精确反映文献主题,组配规则是否严密,词间关系是否正确等都会影响查准率。 相似文献
17.
18.
19.
基于Web的ISI三大引文索引数据库引文检索方法 总被引:2,自引:0,他引:2
本文在简述引文索引及其功能的基础上 ,介绍了基于 Web的 ISI三大引文索引数据库 SCI- E、SSCI及 A& HCI引文检索方法 ,并举例说明了此检索方法使用中的若干技巧 ,对专业检索人员和科研人员检索科技文献具有指导意义。 相似文献
20.
搜索引擎的工作机制与Web信息检索技术 总被引:6,自引:0,他引:6
论述了搜索引擎的工作机制,包括索引系统、关键词检索与概念检索的区别、复合检索、检索结果的相关性排名情况以及搜索引擎如何利用网页文档中的META标记来做索引;还涉及了如何让用户的网站在检索结果中排名靠前的诀窍;同时对如何更简单、有效地检索信息提出了自己的观点。 相似文献