首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
K-means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题.本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K-means改进算法.该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被引矩阵,然后基于同被引矩阵进行层次聚类.算法记录每次迭代过程中被聚为一类的学术文献间的距离以及两次迭代间的距离差,当两次迭代的距离差取得最大值时取其聚类数作为第二步K-means算法的K值,并且将此时的类中心作为第二步K-means算法的初始聚类中心.第二步聚类则依据文献内容实现K-means算法.实验通过与经典K-means算法和基于凝聚层次聚类算法的改进K-means算法的对比,证明了本文提出的改进的K-means算法具备更优的聚类效果.  相似文献   

2.
论“引文耦合”与“同被引”   总被引:3,自引:0,他引:3  
科学文献的引用与被引用,使得大量文献分群聚类.引文聚类包括“双引”、“三引”以及三引以上的引文聚类.科学文献的双引聚类分析涉及两个最本的概念:“引文耦合”与“同被引”.对“引文耦合”与“同被引”的分析研究,是文献计量学的重要内容之一.本文主要讨论这两种引文聚类关系的广义概念、分析方法及其意义. 一、“引文耦合”与“同被引”的概念在科技文献的引文中,人们经常可以看到不同文章的作者在不约而同地引用某篇或某几篇完全相同的文献.针对这种现象,美国学者开斯勒(M·M·Kessler)博士于1963年首次提出  相似文献   

3.
李红  韩毅 《图书情报工作》2015,59(12):71-77
[目的/意义] 时值As, We, May, Think问世70周年之际,期望通过该文被引情况的计量分析,揭示该文对我国相关学科研究的学术影响。[方法/过程] 应用基于内容的引文分析方法,利用CNKI数据库检索As, We, May, Think的引用文献,在简单分析引用文献的年代分布和学科分布后,从引用文献的主题分布、主题分布演化特征来揭示该文的主要学术影响域,从主要来源学科引用文献的具体内容分析来证实该文对相关学科的学术影响范围与深度。[结果/结论] As, We, May, Think对中国的学术影响并未随着时间的推移而衰减,尤其对图书情报领域、计算机领域研究具有极其重要的意义。  相似文献   

4.
王剑  高峰  王健  刘茜 《图书情报工作》2014,58(13):95-99
在深入分析被引频次评价不足的基础上,利用引文认知的相关理论,以Boehringer Ingelheim Fonds数据库中的学术文献为分析样本,采用引用位置和引用内容作为认知的表现因素,借助认知的相关理论和统计学的方法,从定量角度测算被引频次与认知之间的相关性的共性特征。研究结果表明:被引频次和施引作者的认知行为在统计意义上存在着显著相关性,即被引频次是研究领域内认知的一种体现。  相似文献   

5.
[目的 /意义]施引作者在引用过程中会概括、提炼被引论文成果价值点,发现此类信息有助于全面、深入地了解被引论文的学术价值。[方法 /过程]提出一种无监督多特征加权的价值点识别方法,进一步发现原文中未提及或未显著提及的价值点;对Athar引用语料库中高被引的20篇文献进行实验。[结果 /结论 ]实验结果表明,原文中未显著提及但引用中却强调的价值点可揭示被引论文发表后同行的共识与认可、引导跨库检索应用化成果、更新与补充被引论文关键词、收集被引论文主题缩写词等功能,实现对被引论文动态标引,提高论文显示度、检索效率以及跨库关联能力。由此,基于引用内容发现的价值点可以作为一种描述被引论文价值的动态生成的新型元数据即引用标签,发挥重点提示、检索与推荐等功能,丰富引用内容服务。未来将在更多领域、语种、类型以及更大的论文数据集上验证价值点发现的可行性和实用性。  相似文献   

6.
马晓雷  文秋芳 《图书情报工作》2011,55(4):110-113,137
被引内容指的是被引用文献在引用文献中被引述的具体内容。Small曾经指出被引内容的研究价值,但迄今为止,在文献计量学领域被引内容分析仍然没有广泛展开。针对这一情况,提出一种分析领域知识的新方法———基于文本聚类的被引内容分析法,这种方法可以在一定程度上解决引文分析存在的问题。以第二语言教育为分析领域,研究结果证明该方法的可行性以及被引内容的研究价值。  相似文献   

7.
[目的/意义]与众多基于未被引现象的统计分析不同,本文利用演绎分析方法探索论文未被引的产生机制。[方法/过程]将未被引现象置于科学交流的宏大背景下,提出论文未被引的竞争-选择机制,指出竞争-选择机制是以文献内容为基础的相关判断与抉择过程,同时受到文献外在特征的深刻影响,以此为基础从时间维度及空间维度展开具体分析过程。[结果/结论]从时间演化角度上看,新旧相关文献间的竞争是引发论文未被引现象的主要原因;从时间截面上看,在问题解决循环往复过程中,文献查询、文献参考及新潜在相关信息表达中的同质文献竞争是产生论文未被引现象的重要原因,而引用选择是以竞争为背景的自发自组织过程。  相似文献   

8.
了解和掌握《图书情报工作》在国际学术界被关注的程度和内容等信息,阐述其在图书情报领域中的地位和学术影响力.采用文献计量学的理论和方法对《图书情报工作》中的论文被WoS数据库引用进行多方位统计分析,从111篇被引用文献分析研究入手,继而对111篇被引文献在WoS数据库中进行施引的82篇文献进行分析研究.结果显示《图书情报工作》的国际学术影响力不断扩大,越来越多地受到国际图书情报专家及科研人员的认可和关注,并在学科交流中起着越来越重要的作用.  相似文献   

9.
提出同步协作检索结果的相关性判断策略及其实现算法,设计并实现检索结果的分配、检索结果的用户相关性判断、相关结果的集成和用户结果判断权重的反馈,并通过实验验证其可行性。  相似文献   

10.
介绍注疏文献的引用特点,并对注疏文献的引用情况进行分类。分析注疏文献引文分析的流程,提出利用学科本体和XML表示的注疏文献,解决引文分析中的难点。通过对《十三经注疏》中各部注疏文献之间的耦合分析,以及被引文献的同被引分析,尝试对古籍文献的影响力进行评估。  相似文献   

11.
介绍作者引用认同和作者引证形象的概念,提炼作者引用认同和作者引证形象的特征,并与传统的作者被引分析进行比较;从狭义和广义上介绍期刊引用认同和期刊引证形象的概念,构建期刊引用认同和期刊引证形象的指标体系;界定机构引用认同和机构引证形象的概念和特征;提出引用认同和引证形象的分析角度。  相似文献   

12.
13.
引文评价中的引文方式与力度因素   总被引:3,自引:0,他引:3  
陈晓丽 《图书馆》2000,(6):43-45
本文从引文内容、引文方式、引文深度及引文力度的角度分析不同引文对文献的支持作用。  相似文献   

14.
Citation Needed     
The ability to add hyperlinks to a news story is a key feature of online news. In addition to the—aging—technical novelty, one can wonder what functions hyperlinks perform in news stories. Previous research, as well as my previous examination of meta-journalistic discourses, has shown that one of the alleged functions of links is to display the writer's sources. In that sense, hyperlinks are “journalistic objects of evidence” as they can directly point to the documents, data or discourses used as rough material for a news story. The present paper puts that particular function of hyperlinks to the test. It conducts a content analysis on a sub-sample of the stories published on six Belgian news sites that contain at least one external link, and compares the links with the sources explicitly mentioned in the news story itself. Results highlight that links and the mentions of sources do not overlap completely. Many sources are not reflected in links, and most links do not point to primary sources per se. Other functions of links emerge, such as providing a service or contextual information to the readers. These findings thus question the material nature of “journalistic objects of evidence” and the possibility for journalists to build networks of distributed responsibility with links.  相似文献   

15.
Citation Wars     
《The Reference Librarian》2013,54(65):125-136
Summary

During the 1990s a sometimes bitter controversy in legal circles has raged concerning what has become known as “citation reform.” Major proponents of reform include small legal publishers, the American Bar Association, and the American Association of Law Libraries (AALL). Major opponents include the West Group and a number of federal judges and court clerks. Proponents argue for a universal, public domain, vendor neutral, medium neutral citation system (short title: universal citation) based on two premises: (1) a change is necessary to break the West Group's virtual monopoly on its own citation system, which the courts have up to now declared worthy of copyright protection; and (2) the proposed system is objectively superior to West's version. Because West's citation system is used extensively by the courts, its monopoly status keeps the cost of legal research artificially high at a time when inexpensive technologies like the Internet and CD-ROMs are increasingly making it possible to lower the cost of access to case law. In addition, compared to the West system, a public domain, vendor neutral system is simpler, is permanent when the case is first issued, is uniform for all jurisdictions, covers all formats, print and electronic, and is easier to understand. This article explores the issues surrounding the controversy, discusses the pros and cons of both systems, and analyzes current copyright cases that are likely to determine the outcome of the argument.  相似文献   

16.
引文数据中的负面引用初探   总被引:1,自引:0,他引:1  
论文根据中外文理科引文数据库中的有关数据和抽样调查的实例,分析了总引文次数中负面引用的比例,认为当引文数据足够大时,负面引用的影响相对减小。论文还提出在具体运用引文数据进行评价时,应通过同行专家仔细审读引文上下文,以便剔除明显的负面引用;要正确对待引文数据,既不高估,也不忽视。  相似文献   

17.
彭爱东 《情报学报》2008,27(1):84-88
专利引文分析是专利情报分析的重要组成部分,但由于引文分析方法本身的特点,如需要对不同年份、不同领域、不同地点授权的专利的被引数据进行对比,单纯利用从数据库中检索出来的原始被引数据将会使分析结果出现很大偏差,因此有必要对专利引文数据进行修正以确保专利引文分析的有效性.本文首先分析了引起偏差的各种因素,它们分别是专利被引年限的人为切断,专利技术领域的不同,以及专利数量、引文数量的不断上升.在偏差因素分析的基础上,介绍了两种对被引数据进行修正的方法--固定效果修正及准结构化修正.前者简单剥离所有偏差因素对专利被引数据的影响,后者则能有选择地消除某种偏差因素的作用.  相似文献   

18.
与传统的引文分析方法不同,引用认同和引证形象分析以作者(引用者和被引者)为研究对象。文章选取图书情报界6位著名学者作为研究对象,进行实证研究,探讨引用认同和引证形象的分布规律以及作者的引用风格,并对作者引用认同和引证形象做对比分析。  相似文献   

19.
引荐分析法:一种新的引文分析法   总被引:3,自引:0,他引:3  
作为一种重要的情报学分析方法,引文分析法自问世以来就深受国际图情界重视,并得到作者同被引(ACA)和引用认同(CI)等重大改进,但ACA对施引者尤其是高影响力施引者关注不足,而CI不便于应用.为弥补上述缺憾,提出引荐分析法(CRA),它综合了引文分析法和知识图谱等方法,通过分析高影响力作者的施引列表来寻找该作者眼中的学界同行,在对大量专家的引荐结果进行汇总后可获得较为精确的领域研究结构全景图.采用h指数遴选学科专家,并以国内图情界为例进行了实证研究,结果表明CRA不仅有助于挖掘更为丰富的引文信息,为分析学科结构提供新的方法,而且有助于丰富社会网络研究.  相似文献   

20.
基于引文内容分析的引用情感识别研究   总被引:1,自引:0,他引:1  
[目的/意义]针对自动识别论文引用情感问题,提出一种基于引文内容分析的识别方法并进行可视化展示,克服基于简单引用频次计量无法区分不同引用情感的问题。[方法/过程]首先,利用正则表达式抽取出论文全文中的引文内容信息;然后,利用TF-IDF算法筛选出引用情感特征词,结合情感词典,利用情感分析技术对引文内容进行引用情感识别;最后,利用可视化工具展示出引用情感整体分布情况。[结果/结论]该方法能够有效识别出抗衰老领域论文数据集中引用情感情况。实验结果显示,该领域正面引用占总引用次数的21%,中立引用占总引用次数的78%,负面引用仅占总引用次数的1%。与传统引文网络相比较,基于引用情感的可视化图谱可以有效识别出不同引用情感在整体数据集合上的分布情况。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号