首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
lucene全文检索技术是信息领域广泛使用的基本技术,它是一个基于java的全文信息检索工具包.文章在详细分析lucene技术的基础上,介绍了它在垂直搜索引擎中的应用,并对它的排序算法做了一些改进,使之提高搜索引擎的性能.  相似文献   

2.
随着企事业单位信息资源的膨胀,如何优化企事业信息资源检索越发重要。从分析开源搜索引擎lucene出发,设计了一种基于SSlweb框架和lucene全文搜索工具包的全文搜索引擎系统,实现了以B/S模式远程搜索服务器文件,满足局域网内对文档搜索的需求,实验结果表明该搜索引擎有效地提高信息检索的准确度。  相似文献   

3.
站内搜索是网站为用户提供信息查询的工具,文章在分析站内查询模块的组成要素基础上,通过数据库技术和计算机技术构建了一个典型的站内查询模块,实现用户个性化信息需求和查询.  相似文献   

4.
搜索引擎作为互联网中用户使用最多的信息服务项目,已深入到每一个网络用户中,而针对性和准确性更高的站内搜索也随处可见,但是对于其搜索原理及其实现方式却知之甚少,文中以通俗的语言介绍了站内搜索引擎的原理,以最简单的方式实现了专门站点内的信息搜索功能.  相似文献   

5.
站内搜索引擎是充分利用网站资源、迅速提供有效信息的最佳工具,是查寻网站内部信息的密钥。而针对不同用户的操作记录,利用关联规则进行数据挖掘,分析出用户信息需求的关系,并在站内搜索中向用户提供其推荐信息,从而使网站资源得到充分的发挥,方便了用户查找信息,增加网站对上网者的吸引力。  相似文献   

6.
现在,人们已经意识站内搜索的重要性。运用传统的实现方法,出错率较高,运行效率非常低,兼容性也较差。利用Index Server对象实现站内搜索可弥补传统方法的不足。  相似文献   

7.
随着互联网和社交网络的发展,个人信息越来越多地暴露在网络空间中,有效收集和挖掘这些信息可发现所需要的人才信息。设计了一个人才发现与推荐系统,该系统基于Hadoop平台,利用网络爬虫程序寻找网页,通过信息抽取技术获取页面内容,利用lucene的分词器提取文本中的关键词,根据关联规则算法挖掘出关联关键词,采用基于相似项的策略推荐人才。系统为企业提供了一种基于网页数据的技术人才发现和推荐工具,节约了大量时间和成本。  相似文献   

8.
使用Lucene和Heritrix技术实现局域网站内搜索,该搜索引擎系统的后台完成了信息资源的抓取、建立镜像文件、建立索引、搜索等关键操作。本系统大量采用了第三方的工具,使得在文档格式的转换,分词的建立有了更好的准确度,更加符合人们日常习惯的说话方式,提高了用户查找所需要内容的命中率。  相似文献   

9.
基于Lucene架构全文搜索引擎具有高效、简易等特点,但经分析研究基于lucene架构的搜索得分排序算法存在不足,提出了结合词项位置、文档浏览量、更新时间等因素的AHP二次检索公式.设计一种基于B/S的全文搜索系统,实现了对文本的索引、存储与搜索排序.实验证明,改进后的搜索系统为用户提供了个性化搜索服务,更有效地提高信息检索的准确度.  相似文献   

10.
对web文本聚类中的数据预处理、聚类算法及结果评估等进行了分析研究.在由lucene和nutch构建的搜索引擎的基础上,提出基于k—means聚类算法web页聚类系统设计方案,并论述了各模块的设计与实现方法.  相似文献   

11.
针对大规模网页相关性排序工作中使用的多来源网页信息形式多样、利用困难的问题,提出了一种新的自动网页特征获取方法.该方法利用一组事先定义好的规则自动地从网页中获取相关性特征,这些特征可以有效地表达网页的实际内容并改善搜索引擎的排序性能.该方法所获取的网页相关性特征具有格式统一、噪声数据少的特点,能够非常方便地应用于网页的相关性排序.为了评价网页特征和用户查询之间的相关性,还提出了一个特征级别的相关性判定标准.最后,实验结果证明了所提出的特征获取方法和特征相关性等级判定标准对于提升搜索引擎的排序性能具有显著的作用.  相似文献   

12.
在网络信息时代,将有限的时间投入到查找无限的信息资源中是不可取的,如何使用户在信息大潮中搜索到有用的信息,已成为研究的重要课题。主动式网页搜索技术成为当今信息系统中重要的研究方向。基于本体的自动网页检索系统会主动提供关键词判断比对,进而提升网页搜集的精确度。  相似文献   

13.
The world wide web is emerging as an all-in-one information source. Tools for searching web-based information includes search engines, subject directories and meta search tools. We take a look at the key features of these tools and suggest practical hints for effective web searching.  相似文献   

14.
搜索引擎是随着Web信息的迅速增加,从1995年开始逐渐发展起来的技术.不断改进搜索引擎的性能,提高搜索结果的查准率和查全率是搜索引擎发展的目标.其中对于搜索结果的排序是一个重要的研究领域.在对一些排序算法的研究和对校园网特点分析的基础上,提出了一种基于校园网搜索引擎的改进算法,结果证明能更好的计算网页相关度,提高查询效率.  相似文献   

15.
作为垂直搜索的关键技术之一,网页结构化信息抽取近年来得到越来越多的关注.网页结构化信息抽取通过打碎网页,从中提取"精细化"、"条目化"的信息,存储在数据库中,通过对数据库的查询达到垂直搜索"精准"的目的.已有的方法大多是基于规则的模型和基于隐马尔可夫的模型,这些方法要么依赖特定网页结构,适用性差;要么依赖大量的训练样本,训练效率低.结合垂直搜索特定领域特征词数量有限的特点和统计方法,提出基于特征词统计的结构化信息抽取技术,解决了只能抽取特定HTML标记节点和单个信息块的问题,关键信息块的抽取平均准确率为97%.  相似文献   

16.
酒店网络营销战略探析   总被引:1,自引:0,他引:1  
伴随着互联网的产生,网络营销逐步进入酒店经营者的视野,同时对酒店营销的原有模式带来巨大的冲击。网络营销不只是在互联网上推出酒店网站,它是一项系统工程,涵盖了网站建设、搜索引擎优化等一系列内容。酒店不仅要通过网络平台实现信息查询、预订等传统业务,更要借助其互动性、丰富性等特点优化酒店品牌传播战略,使酒店和顾客间的关系更加和谐。  相似文献   

17.
基于语义Web的关键词相关度的搜索模型,是通过计算搜索关键词在各类教学资源网页主要内容文档块中出现的条件概率,来描述该网页与搜索关键词的相关度,同时利用教学资源网页与资源库课程的归属关系,修正计算的相关度结果。该智能搜索系统能够有效地解决用户搜索资源库时返回过多不相关页面的现状,同时根据媒体、课程与关键词的相关度进行排序,使用户能够从系统返回的近似媒体簇中迅速得到有用信息,从而提高检索准确率。  相似文献   

18.
李振龙 《台州学院学报》2005,27(3):34-36,47
随着Web的不断发展,对高速而有效的信息检索系统需求日渐追切。本文对信息检索的核心技术-搜索引擎进行了分析,找出其表现不佳的原因并提出了基于Web社区和基于语义的改进策略。  相似文献   

19.
Deep web站点查询界面的潜在语义分析   总被引:1,自引:0,他引:1  
为了进一步提高搜索引擎的效率,实现对deep web中所蕴含的大量有用信息的检索、索引和定位,引入潜在语义分析理论是一种简单而有效的方法.通过对作为deep web站点入口的查询界面里的表单属性进行潜在语义分析,从表单属性中挖掘出潜在语义结构,并实现一定程度上的降维.利用这种潜在语义结构,推断对应站点的数据内容并改善不同站点的相似度计算.实验结果显示,潜在语义分析修正和改善了deep web站点的表单属性的语义理解,弥补了单纯的关键字匹配带来的一些不足.该方法可以被用来实现为某一站点查找网络上相似度高的站点及通过键入表单属性给出拥有相似表单的站点列表.  相似文献   

20.
化学教育信息资源网络导航系统开发   总被引:1,自引:0,他引:1  
在化学的研究和学习中,为了更好地查询和利用Internet上的化学资源,需要提供一个快捷、方便的网络资源指南.化学教育信息资源导航系统搭建了基于数据的Web平台,满足化学资源分类利用的需求,系统收集、整理和筛选了几百个网站,并对所链接的网站作了相关介绍,旨在方便对因特网信息资源的智能性获取.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号