首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
阐述基于网站链接分析的高校评价研究中存在的两点不足,即链接同等重要假设和数据不可靠性。然后设计一种可根据不同网站类型有侧重抓取的广度优先爬虫算法,抓取“211工程”高校网站作为研究样本。基于所得数据构成的社会网络,对社会网络分析中节点重要性测度的3种指标的排名效果进行实验,发现邻近度声望指标最优。并进一步引入PageRank思想,提出一种对邻近度声望指标进行改进的新指标UnivRank。实验结果表明,新指标的效果显著优于其他指标。  相似文献   

2.
文章选择"211"高校图书馆网站首页链接作为分析对象,运用等级列举式分类法,以链接功能为分类标准,对网站的链接构建了分类体系,解决了由于相同内容的链接在各高校设计网页时因命名不同而造成的分析和统计的困难,为进一步对高校图书馆首页链接的量化分析做好准备.最后,对"211"高校图书馆网站首页的链接进行了量化分析.  相似文献   

3.
文摘以我国“211工程”大学图书馆作为研究样本,以Google和Altavista为搜索工具,得到相关网站的12个链接分析指标。通过对这些指标数据进行分类处理与综合分析,全方位展示并评价我国重点大学图书馆网站的规模、影响以及各指标的相对排序位置,为我国大学图书馆网站的建设提供借鉴性信息,并从所得数据的处理结果对链接指标与链接分析工具进行了讨论。  相似文献   

4.
文阳  陈文宇  袁野  朱建 《图书情报工作》2014,58(20):125-130
认为传统的基于主题的链接过滤算法虽然在某一领域的主题爬虫中使用广泛,但该方法只关心抓取的网页与主题之间的相关性,忽略了网站自身链接的结构特点。提出基于域名的链接过滤算法,该方法对基于网页链接中域名的结构特点进行比较,同时以基于主题的链接过滤算法作为辅助,判断出无用的垃圾链接。与单一基于主题的链接过滤算法相比较,基于域名的链接过滤算法的判断方式更为全面,链接过滤效率更高,从而能有效地提高网络爬虫的抓取效率和情报检索的效率。最后,通过仿真实验证明该算法的有效性。  相似文献   

5.
以2008年中国企业信息化500强中的企业作为研究对象,通过Altavista获取其中100家企业门户网站的链接指标,对网站链接指标数据与信息化排名进行相关性分析,发现企业的信息化水平存在较大差距时,网站链接指标与信息化排名显著相关;通过搜索引擎获取其中10家上市企业的绩效指标数据,对网站链接指标数据和绩效指标数据进行相关性分析,发现企业绩效指标与其门户网站的链接总数和外部链接数显著相关。  相似文献   

6.
以30所高校校园网及其图书馆网站作为研究样本,通过搜索工具MtaVista和Alltheweb得到相关网站在校园网的链接指标,并对这些指标数据进行分析,给出各指标与大学排名和科研得分之间的相互关系,得出高校图书馆网站在高校评价中占据着重要的地位及搜索引擎的可靠性和一致性的结论,并分析讨论目前高校图书馆网站在校园网内影响因子较小的原因。  相似文献   

7.
以中美两国各10所著名医院为研究对象,采用链接分析方法,通过Altavista搜索引擎得到网站的相关链接指标数据,运用主成分分析法对链接数据进行处理,从而综合评价各家医院网站资源被利用情况。同时,运用T检验进行医院网站各链接指标的差异性分析,根据统计结果找出医院网站存在的问题,并提出相应对策和建议。  相似文献   

8.
提出人才网页自动识别系统设计,实现对Nutch定向采集系统抓取的高校网站页面进行人才描述网页自动识别。识别过程中使用自动获取的网页的URL特征、网页Title标签特征、链接文字特征以及网页文本内容特征,使用人名词表、正面特征词表、负面特征词表对各项识别特征进行匹配以计算特征值,借助开源软件LibSVM实现基于多特征值的人才网页自动识别。  相似文献   

9.
以美国30所大学图书馆网站为研究样本,通过搜索工具Alta Vista和Alltheweb得到相关网站的链接指标。并对这些指标数据进行分析,指出各指标与大学排名和学术声誉之间的相互关系,构建了大学图书馆网站的链接特征指标.并得出搜索引擎的可靠性和一致性结论。  相似文献   

10.
中美学术型网站链接特征的比较研究   总被引:9,自引:1,他引:8  
本研究以心血管学为例 ,中、美各选择 10个研究型网站 ,通过对样本网站中超文本文件内存在的链接进行统计分析 ,对网站质量与链接特征之间的关系进行了初步探索 ,并对中、美网站的链接特征进行比较分析。在此基础上提出了心血管学研究型网站链接特征评价的参考指标  相似文献   

11.
通过本节的研究我们发现:①网站各层在规模、文件类型和所拥有的网络链接数量等方面的变化具有明显的规律性,它取决于各层的功能定位;②对于链接密度和页面平均链接数在网站各层之间的变化,本研究未能给予精确的描述,仅就其变化趋势和原因进行了分析。从网站各层功能及其在链接上所表现出的特点来看,功能定位不同的层次,链接出现的频率是不同的,甚至应该能以链接出现频率的变化确切地判断其相应的功能定位,但依靠链接密度和页面平均链接数难以实现这个目标,必须考虑建立与页面功能和链接频率都相关的新的度量指标;③本研究结果证实,我们通过比较网站的网络影响因子筛选出的9个研究对象,其信息组织是比较合理的。这暗示我们,网站信息资源组织的合理程度与其网络影响力可能具有一定的联系。  相似文献   

12.
This study examines queries submitted through two municipal government websites over a 3-year period to discover patterns in information seeking that current web log analysis literature have not discovered or addressed. The findings reveal: in spite of subtle differences strong similarities remain between two different communities' information needs from municipal government websites; demographic variables and close physical proximity do not appear to affect these similarities; there appears to be a belief that municipal government websites can deliver all types of information; and, using methods presented in this paper, municipal governments may better manage their online information resources.  相似文献   

13.
在科研合作日益显著的趋势下,基于作者合作的学术影响力测度研究明显分为两方面:一是用合作这一因素对传统的引用影响力指标进行调整;二是直接测度作者在合作网络中的影响力,并探索与引用影响力指标的相关性。结果表明,作者在合作网络中的中心度指标与其被引次数、h指数、g指数均呈正相关。在科研合作的背景下,要综合评价作者的学术影响力,应将两者结合起来。最后从科学交流模式和作者学术关系的视角,讨论双重测度作者学术影响力的理论依据。  相似文献   

14.
In the information retrieval process, functions that rank documents according to their estimated relevance to a query typically regard query terms as being independent. However, it is often the joint presence of query terms that is of interest to the user, which is overlooked when matching independent terms. One feature that can be used to express the relatedness of co-occurring terms is their proximity in text. In past research, models that are trained on the proximity information in a collection have performed better than models that are not estimated on data. We analyzed how co-occurring query terms can be used to estimate the relevance of documents based on their distance in text, which is used to extend a unigram ranking function with a proximity model that accumulates the scores of all occurring term combinations. This proximity model is more practical than existing models, since it does not require any co-occurrence statistics, it obviates the need to tune additional parameters, and has a retrieval speed close to competing models. We show that this approach is more robust than existing models, on both Web and newswire corpora, and on average performs equal or better than existing proximity models across collections.  相似文献   

15.
This paper provides a ranking of 69 marketing journals using a new Hirsch-type index, the hg-index which is the geometric mean of hg. The applicability of this index is tested on data retrieved from Google Scholar on marketing journal articles published between 2003 and 2007. The authors investigate the relationship between the hg-ranking, ranking implied by Thomson Reuters’ Journal Impact Factor for 2008, and rankings in previous citation-based studies of marketing journals. They also test two models of consumption of marketing journals that take into account measures of citing (based on the hg-index), prestige, and reading preference.  相似文献   

16.
俞立平 《图书情报工作》2016,60(12):109-114
[目的/意义] 在多属性评价视角下,学术期刊影响力指标时间轴并不统一,存在时间异质性,评价对象涉及期刊创刊以来的所有论文被引、过去5年论文被引、过去两年论文被引、评价当年被引等等,迫切需要解决这个问题。[方法/过程] 以CSSCI科技管理类期刊为例,提出了两个新指标:隔年影响因子、隔年h指数,并基于灰色关联分析和期刊被引数据统计,验证了这两个指标的合理性。[结果/结论] 期刊被引指标的设计必须尊重时效性、鲁棒性、年度内评价等原则;多属性评价时,期刊评价被引指标必须尽量保证时间轴一致;来源指标与隔年被引指标数据均来自于期刊载文当年数据,多属性评价时间轴本质上只有一个。  相似文献   

17.
In this paper, we present Waves, a novel document-at-a-time algorithm for fast computing of top-k query results in search systems. The Waves algorithm uses multi-tier indexes for processing queries. It performs successive tentative evaluations of results which we call waves. Each wave traverses the index, starting from a specific tier level i. Each wave i may insert only those documents that occur in that tier level into the answer. After processing a wave, the algorithm checks whether the answer achieved might be changed by successive waves or not. A new wave is started only if it has a chance of changing the top-k scores. We show through experiments that such lazy query processing strategy results in smaller query processing times when compared to previous approaches proposed in the literature. We present experiments to compare Waves’ performance to the state-of-the-art document-at-a-time query processing methods that preserve top-k results and show scenarios where the method can be a good alternative algorithm for computing top-k results.  相似文献   

18.
[目的/意义]我国地域辽阔、高校众多,了解不同高校之间的科学合作现状,对于推进"2011计划"有着重要意义。以SCI和SSCI数据库中的全体数据作为数据来源,针对传统科学计量学方法和现有软件无法处理海量数据的问题,开发出全新的数据处理方法,用于实现对不同机构之间的论文合作分析。[方法/过程]以我国111所"211"高校作为研究对象,对主要研究型大学之间以SCI和SSCI论文为代表的高水平论文合作情况进行定量研究,计算各高校在论文合作网络中的中介中心性并排序,进而绘制合作网络图谱。[结果/结论]我国高校科研论文合作的现状与全貌是科研实力较强的"985"综合性高校排序靠前,而学科专业性较强、地理位置偏僻的高校排序靠后;我国目前的大学科学论文合作整体存在以地理聚类为主、学科聚类为辅的合作关系特征。这一特征为科研管理和教育管理工作提供了启示,即:既要发挥"985"高校的领军作用,也要发挥区域中优势高校的增长极作用,在"2011计划"的学科框架下实现广泛交流。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号