首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 877 毫秒
1.
本文以PageRank算法和HITS算法为例,对基于超链接分析技术的搜索引擎排序算法进行分析,并总结了超链接分析技术应用于搜索引擎结果排序的局限性。  相似文献   

2.
专业搜索引擎的排序算法研究   总被引:5,自引:0,他引:5  
探讨影响搜索引擎排序的一般性因素:词频和词位置信息、用户行为信息、网页之间的链接信息等,在此基础上针对专业搜索引擎的排序算法,提出主题相关度并结合基础教育搜索引擎进行实验。实验结果表明,专业搜索引擎中主题相关度的适当应用能明显改善排序结果。  相似文献   

3.
严海兵  崔志明 《情报学报》2007,26(3):361-365
基于关键字匹配的搜索引擎排序网页时仅仅考虑评价网页的重要性,而忽视分类;基于分类目录的搜索引擎很难动态分析Web信息。本文在分析它们不足的前提下,提出利用模糊聚类的方法对搜索引擎的检索结果进行动态分类,依据超链分析算法PageRank和Web文档隶属度相结合进行分类排序,并给出具有调节值的结合公式。实验证明,该算法能够更有效地满足用户的需要,提高检索效率。  相似文献   

4.
本文重点分析了Google搜索引擎的PageRank技术的实现算法、优点及不足之处,并提出利用行为反馈再排序机制进行优化。  相似文献   

5.
搜索引擎的排序技术研究   总被引:9,自引:1,他引:9  
提出按搜索引擎的排序技术把搜索引擎分为三代,介绍了主要的几种搜索引擎排序技术,并对第三代搜索引擎的发展进行了分析。  相似文献   

6.
主要介绍了设计开发Web主题信息采集系统的一个核心算法——超链接主题预测算法。文章在已有理论的基础上,通过实验分析,发现超链接的主题主要取决于三个因素:父网页的主题相关度、锚文本的主题相关度和Web子图的链接结构特性,从而提出了基于Web页面内容和链接结构的超链接主题预测算法,系统评价结果显示该算法有很好的效果。  相似文献   

7.
搜索引擎检索结果的组织技术   总被引:9,自引:0,他引:9  
赵荣  黄燕云  张露 《情报学报》2004,23(1):69-72
本文综合分析了几种主要的搜索引擎检索结果排序组织技术的原理及应用 ,包括关键词词频和位置原理、网页链接级别算法和结果分类组织等。  相似文献   

8.
Nutch是一个开放源代码的web搜索引擎,是以Lucene为基础实现的搜索引擎应用程序,由于不夹杂商业利益,它对搜索结果的排序算法较为透明公平。文章重点讨论Nutch的工作原理及其中文分词技术,并尝试构建基于nutch的中文搜索引擎。  相似文献   

9.
用户兴趣分类在个性化搜索引擎中的应用   总被引:2,自引:0,他引:2  
个性化搜索引擎是指在普通搜索1引擎的基础上,根据用户的背景,兴趣等调整排序算法,针对不同的用户提供不同的服务.本文对搜索引擎的排序算法和用户行为进行了深入细致的研究,通过隐性方法收集用户行为信息,统计并构建用户长期兴趣模型,短期兴趣模型,时段兴趣模型等,利用向量相似度计算获取最适合用户当前状态的兴趣模型,最后将该兴趣模型结合到搜索引擎的排序算法中,影响文档得分,实现结果集的个性化排序.实验证明,该方法简单有效,可以增加搜索引擎对用户兴趣的应变能力.  相似文献   

10.
融合新闻编辑中超链接的价值主要表现为:超链接发挥参考文献功能,让新闻报道在时空中穿梭,改变了新闻叙事方式。文章论述了融合新闻编辑中运用超链接的方法和技术——利用超链接分层表达、立体展现,设置关键词搜索链接和更加广泛的搜索链接,提防死链接。从搜索引擎优化角度看,文章认为应该高度重视内部链接,积极寻求被外部网站链接。  相似文献   

11.
王建雄 《图书情报工作》2012,56(21):114-118
在传统PageRank算法的基础上进行一些优化与改进,提出一种新的主题敏感的PageRank算法,通过计算超链接与领域向量的相似度来区分超链接对网页的贡献度,从而有效抑制主题漂移;同时为PageRank算法加入时间因子来防止PageRank偏重旧网页的问题,加入站内外区分因子来防止针对PageRank算法作弊的行为.改进算法弥补了原算法的不足,提高了主题搜索的效率.  相似文献   

12.
数字图书馆的知识信息导航技术研究   总被引:4,自引:0,他引:4       下载免费PDF全文
迷航是超文本信息模型的主要问题。解决此问题需要使用超文本数据信息的导航方法 :导游线路方法 ,导航图方法 ,利用搜索引擎 ,自动超链接技术等。参考文献 6。  相似文献   

13.
本文通过文献调查,对2002~2007年国外关于搜索引擎检索结果研究的文献进行了概述与分析,从搜索引擎检索结果覆盖面、重叠性、相关性三个方面,对搜索引擎检索结果覆盖面的评价、影响因素及改进方法,搜索引擎检索结果重叠性的评价,搜索引擎检索结果相关性的评价、页面排序算法及文本分析方法对搜索引擎检索结果相关性的影响及改进作用、搜索引擎检索结果相关性的其他影响因素作一个综述,以期了解国外的研究态势,供国内的后续研究参考.  相似文献   

14.
随着网上信息量的海量增加,搜索引擎的发展也非常迅速,搜索引擎成为广大用户上网不可或缺的得力助手。本文从功能服务和排序技术两个方面对目前中国使用率最高的两大搜索引擎——Google和百度进行比较分析,以期为更好的掌握和使用搜索引擎提供借鉴意义。  相似文献   

15.
主题爬行是专业搜索引擎的基础,爬行策略与爬行算法是主题爬行技术的核心,通过分析主题爬行的基本原理,对爬行策略与爬行算法进行分类比较,展示爬行策略与爬行算法的研究进展及当前研究热点,为主题爬行技术的进一步研究提供参考。  相似文献   

16.
探讨、分析网络资源采集与学科导航系统的理论基础和核心技术,包括机器人搜索引擎技术、UTF-8(Unicode)编码、PageRank排序算法、正则表达式等。并结合系统的开发实例,介绍系统的设计目标与系统数据流程。通过给出部分核心代码进行举例说明,详细阐明系统模块的设计以及技术实现。  相似文献   

17.
搜索引擎的几种常用排序算法   总被引:14,自引:0,他引:14  
常璐  夏祖奇 《图书情报工作》2003,47(6):70-73,88
介绍几种比较著名的搜索引擎排序算法,分别是词频位置加权、Direct Hit、PageRank和竞价排名服务,并重点讨论影响它们的因素以及各自的优缺点,最后对它们进行简要的分析和比较。  相似文献   

18.
在现有相关研究的基础上,对基于通用搜索引擎的深层网络表面化方法的基本原理进行分析,对表单域取值范围的确定、查询处理、查询结果的超链接设置等与深层网络表面化相关的若干关键问题进行探讨。  相似文献   

19.
万维网信息检索系统开发技术   总被引:7,自引:0,他引:7  
当前搜索引擎技术有很大的局限性 ,本文首先分析了当前搜索引擎的若干缺陷 ,然后深入探讨在检索服务器端的若干处理技术 ,包括了Robot技术、索引技术、数据库技术、检索技术和相关度排序技术 ,同时还介绍了智能浏览器和智能体等客户端技术 ;最后文中还提出了综合运用这些技术的一个万维网信息智能检索系统的原型设想  相似文献   

20.
论文讨论当前搜索引擎在检全率、检准率等方面存在的问题,提出一种基于C/S模式的中文元搜索工具MetaSearcher来解决上述问题,重点介绍了该工具的关键技术和排序算法.接着对该元搜索工具进行性能评估,得出该元搜索工具在响应速度和排序客观性方面比一般搜索引擎具有一定优势的结论.论文同时指出了后续研究方向.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号