首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 984 毫秒
1.
自PageRank提出以来,就引起了学界广泛关注。在概述PageRank算法的基础上,从Topic-Related PageR-ank﹑时间维加权PageRank和科研学术网络中加权PageRank这3个方面对加权PageRank算法进行了综述和评价。  相似文献   

2.
基于概念的权重PageRank改进算法   总被引:2,自引:0,他引:2  
杨彬  康慕宁 《情报杂志》2006,25(11):70-72
对比了基于链接分析的搜索引擎排序算法PageRank和HITS。针对原有PageRank算法采用的平分页面自身PageRank值的策略,提出了一种按权值分配的改进算法。权值由页面间的概念关联比重和用户的搜索概念确定。  相似文献   

3.
杨泳丹 《科技通报》2019,35(7):178-181,185
针对PageRank算法存在的不足,本文对网络链接的结构进行分析,并以此为基础对PageRank的算法进行了改进,提出了主题链接相似度的PageRank算法。本文算法的核心是将当前网页与入链网页的主题相关度作为传递权值,替换PageRank算法中以平均值作为权值。本文的PageRank-I算法将网页之间的链接作为链接的向量,以这种链接的关系来对向量的余弦相似度进行主题相关性的描述,而不用对额外的文本信息进行处理,减少了系统负担。实验结果证实本文的PageRank-I算法在没有增加系统的额外负担的同时,也没有增加时间上的复杂度,解决了PageRank算法中主题漂移的问题。  相似文献   

4.
研究主要针对PageRank只考虑链接关系,而不考虑相关性的缺点进行了一些改进,把Web数据挖掘技术的内容挖掘应用到PageRank算法中,基于超链接文本和内容与主题的相关性,提出了PageRank算法的优化算法,并通过实验仿真,实验结果表明改进后的方法对提高更高相关性的网页的排名是有效的,符合人们的期望。  相似文献   

5.
搜索引擎是互联网资源搜索的入口,搜索的快捷性、准确性是搜索引擎的核心竞争力,如何提高竞争力是业内企业的工作重点。已有的搜索引擎算法中,最具代表性的就是PageRank算法,针对该算法的改进方法也有很多,但效果并不很理想。分析了已有PageRank改进方法的不足,立足于用户搜索行为信息挖掘,采用时序关联分析方法,将关联比例作为权值加入到PageRank计算公式中,改变平均分配权威值的计算方法,从而得到了改进的PageRank算法——TCPR算法,使得搜索排序结果更符合用户的信息需求。  相似文献   

6.
基于PageRank的期刊评价研究   总被引:3,自引:0,他引:3  
文章构建了适用于期刊引用网络的PageRank算法,利用2006年中国科技论文与引文数据库(CSTPCD)分别计算了包含期刊自引和排除自引的1723种统计源期刊的PageRank值,并与影响因子进行了对比研究,根据期刊的流行性和权威性特点把期刊分成了4个区域;重点探讨了化学类期刊的PageRank值与影响因子的关系;并深入讨论了PageRank算法用于期刊评价的优缺点以及适用范围。  相似文献   

7.
介绍了SALSA算法的基本原理及算法步骤 ;同时 ,分别将其与PageRank算法及HITS算法从多个方面进行了比较分析。  相似文献   

8.
[目的/意义]旨在将科技文献的价值进行量化,提高PageRank算法应用在科技文献排名中的准确性。[方法/过程]在加入时间因子的PageRank算法的改进算法WPageRank的基础上,加入引用相关度进行改进,并计算文献的固有价值,与文献的PageRank值进行加权求和,得到文献的最终价值。[结果/结论]本文提出的方法使新发表的高质量文献也可以获得较高排名,并且使领域内的高质量文献更容易被检索到,同时保证了检索的时效性和主题集中性。  相似文献   

9.
结合网页内容分析的PageRank算法初探   总被引:1,自引:0,他引:1  
李树青 《情报杂志》2005,24(12):34-35,38
作为一种相当成功的基于超链分析的算法,PageRank算法可以有效地衡量网页重要度权值,然而进一步的研究也表明,这种纯粹依赖于超链分析的算法由于没有考虑到网页内容对网页重要度权值的影响,所以在一定程度上会造成偏差。因此,合理的将两者进行结合,充分利用网页内容特征对PageRank算法进行改进,可以极大的提高这种算法的有效性。  相似文献   

10.
HITS算法与PageRank算法比较分析   总被引:17,自引:1,他引:17  
对HITS算法作了比较详细的介绍,并且与PageRank算法在设计思想、权重传播模型、数据处理量及适用范围等方面进行了比较分析。  相似文献   

11.
通过引文网络的结构特征,有效地识别科学文献的价值并建立某种序关系,为科学评价提供了有价值的参考,也丰富了科学评价的方法。针对传统PageRank算法在引文网络中得到的结果倾向于发表时间久的文献,而不利于发表时间较短但具有学术影响潜力的文献,为了消除这种“不公平”性,将引文间隔时间引入算法中。图书馆与情报学领域的实证研究说明改进算法有效地优化了评价的结果,相对于传统PageRank算法更有利于发现具有潜力的新发表的文献。  相似文献   

12.
严承希  王军  李晓杰 《情报科学》2018,36(1):118-123
【目的/意义】结合随机游走算法PageRank、词共现和多样性测度指标提出一种改进的热点主题探测方法 C_BI-PageRank,该方法有效提高了热点主题探测的效率和模型质量。【方法/过程】首先对PageRank 算法进行理论 回顾,引入词共现和布里渊系数构建C_BI-PageRank 算法模型,然后采用4 种不同因素组合的PageRank 算法对 Web of Science 系统2006-2016 的应用心理学领域的期刊文献进行实证分析,最后基于波达计数的专家方法进行算 法比较与评价,同时也探索其与词频统计之间的相关性问题。【结果/结论】实证表明C_BI-PageRank不仅在运行效 率上收敛快、运行时间少且质量评估优势明显。该方法引入不同文本主题因素,一定程度解决传统词频分析和机 器学习的不足,为热点主题探测方法提供了新思路。  相似文献   

13.
从信息过滤系统模型功能及其实现出发,探讨了Google中PageRank技术环境下的用户偏好的分析描述与表达.在传统的过滤算法的基础上进行了改进后的过滤算法的模型构建和原形研究,结合实践进行了实验结果分析.  相似文献   

14.
分析了基于链接结构的PageRank算法,考虑算法在网页排序方面的客观优点的同时,指出了其在判定网页主题相关性方面的不足,提出了基于主题预测相关度加权的改进策略,为提高定向信息采集的准确率和召回率提供了理论依据.  相似文献   

15.
在对PageRank算法和主题链接分析的基础上,提出了一种面向主题的链接评价算法TL-PageRank,该算法以"主题随机冲浪"模型为基础,同时利用网页主题分布特性和网页之间相互引用特性,对未爬行链接的权威值进行综合评价.实验表明,TL-PageRank算法在收获率方面比经典的链接评价算法获得了明显的提高.  相似文献   

16.
同行评议是当前对科研项目水平进行科学评价的主要方式之一,然而评议过程中专家评审能力的差别将会对科研项目评审结果产生影响。为此,本文提出了一种基于PageRank算法的评审专家信誉度度量方法,该方法首先利用高斯分布函数计算评审专家的评审能力,然后利用PageRank迭代算法对评审专家的信誉度进行求解,最后通过引入时间因子对评审专家的信誉度进行度量。基于同行评议真实数据集上的实验结果验证了本文提出方法的有效性,该方法将为科研项目评审及专家遴选提供有益参考。  相似文献   

17.
面向信息检索的汉语同义词自动识别和挖掘   总被引:3,自引:0,他引:3  
为了提高同义词自动挖掘的效率,本文提出了从词典释义中自动识别和挖掘同义词的方法,使用超链接分析算法和模式匹配算法,从不同的角度提取同义词:第一部分是把词汇之间注释与被注释的关系看成是一种链接关系。对给定的词汇进行分析,把与给定词汇具有链接关系的所有相关词汇构造一个词汇图,图中的每一个节点代表相关词,每条弧代表了词汇之间注释与被注释的关系。利用超链接分析方法并结合PageRank算法,计算词汇的PageRank值,把PageRank值看成是体现词汇之间语义相似性的衡量指标,最后为每一个词汇生成候选同义词集,并通过一定的筛选原则和方法,推荐出最佳的同义词。第二部分是利用词汇定义模式,对词汇的释义方式进行分析,归纳总结出在词典释义中同义词出现的模式,进而利用模式匹配方法识别和挖掘同义词。此外,利用模式匹配方法对Web网页和期刊论文中的同义词也进行了挖掘测试。测试结果表明,利用模式匹配和超链接分析方法来自动识别和挖掘同义词具有可行性和实用性。  相似文献   

18.
孟瑞玲 《现代情报》2010,30(7):93-96
智能搜索引擎的提出引发了新一轮搜索引擎革命,然而其实现还有一定的困难。以目前非常成熟的PageRank技术为基础进行改进,构建基于个人需要的PageRank算法,可以实现智能搜索引擎所需要的多种个性化功能。目前在大型广域搜索引擎上建立个性化的智能搜索引擎还比较困难,而高校图书馆在信息规模、用户基础和运行条件上都有建立智能搜索引擎的优势。对目前的高校图书馆检索系统进行一定的改进,可以实现智能搜索引擎的个性化功能。  相似文献   

19.
先从网页内容和网页链接的角度计算网页与主题的相似度,然后将二者归一化,最终确定网页与主题的相关度.从分析网页内容相似度的角度保证网页与主题的相关性,从网页链接分析的角度解决网页搜索的权威性和覆盖乔率.算法还对PageRank算法进行了改进,将访问网页的概率加入到算法计算过程中,实验结果表明,新的算法具有较高的搜索效率.  相似文献   

20.
Google的PageRank技术剖析   总被引:39,自引:5,他引:39  
曹军 《情报杂志》2002,21(10):15-18
检索结果排序算法一直是情报检索系统的核心技术之一,在搜索引擎中的地位则更加重要。通过对搜索引警google的关键技术PageRank的深入剖析,分析了其在Google排序系统中的作用,并对其发展所存在的问题进行了探讨。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号