首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
以PageRank算法和HITS算法为例,分析超链接分析技术的搜索引擎排序算法,总结超链接分析技术应用于搜索引擎结果排序的局限性。  相似文献   

2.
专业搜索引擎的排序算法研究   总被引:5,自引:0,他引:5  
探讨影响搜索引擎排序的一般性因素:词频和词位置信息、用户行为信息、网页之间的链接信息等,在此基础上针对专业搜索引擎的排序算法,提出主题相关度并结合基础教育搜索引擎进行实验。实验结果表明,专业搜索引擎中主题相关度的适当应用能明显改善排序结果。  相似文献   

3.
严海兵  崔志明 《情报学报》2007,26(3):361-365
基于关键字匹配的搜索引擎排序网页时仅仅考虑评价网页的重要性,而忽视分类;基于分类目录的搜索引擎很难动态分析Web信息。本文在分析它们不足的前提下,提出利用模糊聚类的方法对搜索引擎的检索结果进行动态分类,依据超链分析算法PageRank和Web文档隶属度相结合进行分类排序,并给出具有调节值的结合公式。实验证明,该算法能够更有效地满足用户的需要,提高检索效率。  相似文献   

4.
本文重点分析了Google搜索引擎的PageRank技术的实现算法、优点及不足之处,并提出利用行为反馈再排序机制进行优化。  相似文献   

5.
搜索引擎的排序技术研究   总被引:9,自引:1,他引:9  
提出按搜索引擎的排序技术把搜索引擎分为三代,介绍了主要的几种搜索引擎排序技术,并对第三代搜索引擎的发展进行了分析。  相似文献   

6.
主要介绍了设计开发Web主题信息采集系统的一个核心算法——超链接主题预测算法。文章在已有理论的基础上,通过实验分析,发现超链接的主题主要取决于三个因素:父网页的主题相关度、锚文本的主题相关度和Web子图的链接结构特性,从而提出了基于Web页面内容和链接结构的超链接主题预测算法,系统评价结果显示该算法有很好的效果。  相似文献   

7.
搜索引擎检索结果的组织技术   总被引:9,自引:0,他引:9  
赵荣  黄燕云  张露 《情报学报》2004,23(1):69-72
本文综合分析了几种主要的搜索引擎检索结果排序组织技术的原理及应用 ,包括关键词词频和位置原理、网页链接级别算法和结果分类组织等。  相似文献   

8.
Nutch是一个开放源代码的web搜索引擎,是以Lucene为基础实现的搜索引擎应用程序,由于不夹杂商业利益,它对搜索结果的排序算法较为透明公平。文章重点讨论Nutch的工作原理及其中文分词技术,并尝试构建基于nutch的中文搜索引擎。  相似文献   

9.
用户兴趣分类在个性化搜索引擎中的应用   总被引:2,自引:0,他引:2  
个性化搜索引擎是指在普通搜索1引擎的基础上,根据用户的背景,兴趣等调整排序算法,针对不同的用户提供不同的服务.本文对搜索引擎的排序算法和用户行为进行了深入细致的研究,通过隐性方法收集用户行为信息,统计并构建用户长期兴趣模型,短期兴趣模型,时段兴趣模型等,利用向量相似度计算获取最适合用户当前状态的兴趣模型,最后将该兴趣模型结合到搜索引擎的排序算法中,影响文档得分,实现结果集的个性化排序.实验证明,该方法简单有效,可以增加搜索引擎对用户兴趣的应变能力.  相似文献   

10.
融合新闻编辑中超链接的价值主要表现为:超链接发挥参考文献功能,让新闻报道在时空中穿梭,改变了新闻叙事方式。文章论述了融合新闻编辑中运用超链接的方法和技术——利用超链接分层表达、立体展现,设置关键词搜索链接和更加广泛的搜索链接,提防死链接。从搜索引擎优化角度看,文章认为应该高度重视内部链接,积极寻求被外部网站链接。  相似文献   

11.
王建雄 《图书情报工作》2012,56(21):114-118
在传统PageRank算法的基础上进行一些优化与改进,提出一种新的主题敏感的PageRank算法,通过计算超链接与领域向量的相似度来区分超链接对网页的贡献度,从而有效抑制主题漂移;同时为PageRank算法加入时间因子来防止PageRank偏重旧网页的问题,加入站内外区分因子来防止针对PageRank算法作弊的行为.改进算法弥补了原算法的不足,提高了主题搜索的效率.  相似文献   

12.
复合型Web信息检索系统   总被引:5,自引:0,他引:5  
向桂林 《情报学报》2003,22(5):545-549
本文首先分析了常见的三种搜索引擎 :基于内容分析的搜索引擎、基于超链分析的搜索引擎、基于反馈分析的搜索引擎的弊端 ,提出了一种能够集三种搜索引擎优点于一身的复合型Web信息检索系统 ,并详细阐述了该系统的实现方法  相似文献   

13.
针对多媒体链接在网页中分布的特点,对PageRank、Shark-Search两种典型的主题搜索算法进行相关参数的改进,采用改进后的两种算法从网页内容和网页网页的角度计算多媒体网页与主题的相似度。实验结果表明,改进的Shark-Search多媒体主题搜索算法比改进后的PageRank搜索算法更能有效地提高多媒体主题搜索的效率,同时也更适合网络多媒体资源的主题搜索。  相似文献   

14.
网络信息计量学研究(Ⅰ)--网络链接研究的现状及趋势   总被引:12,自引:0,他引:12  
本文阐述了网络链接研究的意义、现状、存在的问题及发展趋势。网络链接研究是网络技术进步的产物 ,也是促进网络在社会生活各领域产生更为深刻影响的现实要求。网络链接研究不仅成为促进网络信息计量学产生和发展的重要动力 ,而且是探索网络空间结构和进行网络知识挖掘的必然工具 ,它的突破将极大地提高网络信息检索效率。网络链接分析是一个新兴的研究领域 ,在理论研究领域目前主要集中在 3个方面 ,即网络链接分析与期刊文献引文分析的异同、网络链接的目的和类型以及网络影响因子的探讨。在应用领域 ,其研究主要涉及核心网站的确定、网络结构挖掘和知识发现、搜索引擎检索质量的改进和在机构研究能力评价中的应用等。这些方面都是近期研究的重点。虽然网络链接研究逐步受到各相关领域研究者的关注 ,并已经取得了一些成果 ,但总的来说 ,还没有成熟的理论、方法可供借鉴 ,应用领域的研究还具有相当的局限性。  相似文献   

15.
数字图书馆的知识信息导航技术研究   总被引:4,自引:0,他引:4       下载免费PDF全文
迷航是超文本信息模型的主要问题。解决此问题需要使用超文本数据信息的导航方法 :导游线路方法 ,导航图方法 ,利用搜索引擎 ,自动超链接技术等。参考文献 6。  相似文献   

16.
网络信息计量学综述   总被引:26,自引:1,他引:26  
文章对网络信息计量学作了一个综述。首先探讨了网络信息计量学的产生,然后论述了网络信息计量学的定义、研究对象和内容、研究目的和意义、研究方法和工具等基础理论问题,最后从网络搜索引擎、网络链接分析、Web挖掘三个方面对网络信息计量学的研究现状作了全面、详细的介绍。参考文献145。  相似文献   

17.
PageRank算法的原理简介   总被引:9,自引:0,他引:9  
在介绍PageRank算法基本思想、基本公式和计算实例的基础上,介绍如何利用PageR- ank算法提高网页PR的方法,最后指出PageRank算法存在的不足,并对其发展趋势进行分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号