首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 316 毫秒
1.
[目的/意义]传统的文献主题提取方法主要是通过关键词、摘要、全文等提取文献的主题内容,使得主题内容不全面或存在"噪音",而从文献内容语义出发,结合引用内容提取文献的主题,能够更加准确地提取出多文档的主题内容。[方法/过程]提出一种面向多文档的基于语义和引用加权的科技文献主题提取算法,利用文献的引用内容和关键词构建Labeled-LDA主题模型,形成文档-主题概率向量,再根据K-means聚类方法聚类文档,提取每类文档集的主题内容。[结果/结论]以PubMed生物医学数据库中的数据作为实验数据,测试该方法的可靠性,结果证明该方法能够准确、全面地提取出多文档的主题内容。  相似文献   

2.
高被引论文与“睡美人”论文引用曲线及影响因素研究   总被引:2,自引:0,他引:2  
[目的/意义]通过对潜在“睡美人”论文的引用分布分析,提炼其特征,以期为“睡美人”论文的预判研究提供思路。[方法/过程]采用引用曲线这一更为直观的反映论文引用分布的方法,以“天文学和天体物理”这一领域为例,构建其10的高被引论文、“睡美人”论文的10-20年被引用数据并进行引文分布的对比分析。[结果/结论]研究发现两类文献的引用曲线模式及特点——高被引论文的持续增长型、显峰型、双峰型、振荡型,“睡美人”论文的持续增长型、显峰型、双峰型、振荡型、稳定型等被引用曲线模式;针对施引文献、研究主题演化方向探讨了各模式引用曲线形成的相关因素,发现两类文献达到引用高峰的时间存在差异。  相似文献   

3.
《编辑学报》论文被Web of Science数据库引用情况分析   总被引:1,自引:0,他引:1  
鲍国海 《编辑学报》2014,26(6):617-618
对被Web of Science数据库(WOS)引用的《编辑学报》56篇论文,从被引和施引作者、作者单位、论文关键词、施引期刊等方面进行分析,并对这些引文同时被《中文社会科学引文》(CSSCI)数据库引用情况作比较,从中了解《编辑学报》在国内外学术界被关注的程度、研究主题及相关学者等信息,发现引用和施引论文的学者及研究机构,提出缩短出版周期等建议,进一步提高《编辑学报》的学术质量及其在学科领域的影响力。  相似文献   

4.
传统引文分析方法中,文献间的相互关系通常由引用关系决定,也就是说,如果文献A引用文献B,则证明B对A有一定的贡献,然而具体的贡献值与引用原因却很难进行界定。采用主题模型的方法,将原著、引文、被引文献看作是主题模型上的概率分布,通过全文抽取的方法,对引用的原因以及引文贡献值进行分析。首先介绍研究背景与研究意义,并对基本概念进行阐述;然后介绍引文抽取方法、 利用Labeled-LDA模型建立主题模型方法等;最后通过实验部分建立基于不同主题的文献引用网络图,并利用工具使其可视化表示。  相似文献   

5.
[目的/意义]引文是施引文献与被引成果的纽带,反映了后继者的借鉴和肯定。本研究在传统题录关键词网络的基础上,创新地将引文上下文关键词作为研究材料,所构建知识图谱不仅能揭示文献主题的深层次信息,也能够反映受众主观筛选和利用文献的知识过程。[方法/过程]选取数字人文为研究领域,获取3个文献集和两个引文文本集,构建两个无向的关键词共现网络和两个有向的基于文献引证的关键词网络。通过共现网络,观察数字人文领域知识的吸收与扩散;通过引证关键词网络,观察数字人文的形成与转化。[结果/结论]研究揭示数字人文的研究重点、核心领域与核心技术,从受众的角度为数字人文领域未来研究提供借鉴和参考。  相似文献   

6.
王剑  高峰  王健  刘茜 《图书情报工作》2014,58(13):95-99
在深入分析被引频次评价不足的基础上,利用引文认知的相关理论,以Boehringer Ingelheim Fonds数据库中的学术文献为分析样本,采用引用位置和引用内容作为认知的表现因素,借助认知的相关理论和统计学的方法,从定量角度测算被引频次与认知之间的相关性的共性特征。研究结果表明:被引频次和施引作者的认知行为在统计意义上存在着显著相关性,即被引频次是研究领域内认知的一种体现。  相似文献   

7.
[目的/意义]施引文献与被引文献往往存在着某种相似性,揭示这种现象背后的形成机制有助于深入理解引文的本质。[方法/过程]采用指数随机图模型,以图书馆与情报学领域为对象开展实证分析,旨在揭示文献相似性对引用关系的影响机制。[结果/结论]实证研究发现:在网络结构、机构、期刊层面存在显著的引用文献相似倾向。具体地,引用关系更倾向于嵌入三角传递结构;来源于相同机构和期刊的文献之间更容易产生引用关系;来源于学科优势地位国家的文献之间更容易产生引用。实证结果充分说明社会接近性是引用行为的重要形成机制,反映了引用偏好的社会属性。  相似文献   

8.
全面了解图书情报学(LIS)学科知识影响力,对于明确LIS的学科地位具有重要意义。以Wo S数据库为数据源,将2000—2019年间LIS 573篇高被引文献作为知识输出源,通过回溯的方式获取来自非图情学科的施引文献85 638篇,参照比格兰模型对施引文献所属学科进行划分,利用LDA主题聚类对施引学科主题及其演化特征进行分析,研究发现LIS知识输出至多元的学科和主题:来自其他学科的施引文献整体上呈上升趋势,其主要施引学科(按降序排列)依次为医学、计算机科学、管理学、经济学、教育学、社会学、心理学、新闻传播学、地球科学、工程学、生物学、政治学、化学、农学等;从主题分布情况来看,来自其他学科的施引文献主题多元,且这些学科的不同主题对LIS学科知识的引用均处于不断上升的趋势,同时不同学科主题演化呈现不同的特点。  相似文献   

9.
李红  韩毅 《图书情报工作》2015,59(12):71-77
[目的/意义] 时值As, We, May, Think问世70周年之际,期望通过该文被引情况的计量分析,揭示该文对我国相关学科研究的学术影响。[方法/过程] 应用基于内容的引文分析方法,利用CNKI数据库检索As, We, May, Think的引用文献,在简单分析引用文献的年代分布和学科分布后,从引用文献的主题分布、主题分布演化特征来揭示该文的主要学术影响域,从主要来源学科引用文献的具体内容分析来证实该文对相关学科的学术影响范围与深度。[结果/结论] As, We, May, Think对中国的学术影响并未随着时间的推移而衰减,尤其对图书情报领域、计算机领域研究具有极其重要的意义。  相似文献   

10.
[目的/意义]学术文献影响力评价指标不断推陈出新,但尚缺乏在研究主题层面对文献影响力的评价,为发现不同研究主题内具有高影响力和引用价值的文献,本研究给出一种基于研究主题的文献影响力评价方法。[方法/过程]以Web of Science数据库中2011年-2015年间情报学领域500篇高被引文献为样本,利用LDA模型对样本文献进行主题建模,将主题对文献的支持度与文献被引频次相结合,计算特定主题文献的被引频次(specific topic cited frequency,简称STCF),并根据每篇文献在相应主题内的STCF值对文献进行影响力排序。[结果/结论]结果表明,STCF值能反映文献的主题内容、细粒度体现文献的学术地位、呈现文献研究主题的多元性,能够有效弥补被引频次、Altmetrics指标的不足。  相似文献   

11.
学术文献引文推荐研究进展   总被引:1,自引:0,他引:1  
[目的/意义]学术文献引文推荐是指对于给定的学术文献,自动化地为其推荐合适的引文和参考文献。借助于引文推荐,用户可以在一定程度上提高撰写学术文献的效率,降低对重要相关文献的漏引。[方法/过程]分析国内外引文推荐研究的最新进展,阐述引文推荐问题的演化过程,从局部引文推荐和全局引文推荐等方面对引文推荐进行梳理,重点归纳文档相似性、主题模型、翻译模型、协同过滤和混合推荐等5种引文推荐常用方法,并总结引文推荐常用数据集和测评方法。[结果/结论]已有引文推荐研究的主要问题在于未考虑用户偏好的动态变化性及研究领域的综合性,在用户研究和实际应用方面仍有所欠缺;未来引文推荐的研究可运用语义化表达方法和自然语言生成技术,从基于上下文的引文推荐和跨语言引文推荐等方面进行展开。  相似文献   

12.
[目的/意义] 对引文文本分类的标准、实现方法和应用进行梳理,分析存在的问题,提出可改进的方向。[方法/过程] 总结目前引文文本分类的几个重要角度,如基于引用功能、基于情感倾向、基于引文影响力等,对引文文本分类的实现方法进行比较,分析其优缺点。[结果/结论] 目前引文文本没有统一的分类标准和实现方法,引文文本的获取较为困难,计算机分类算法准确率较低,中文引文文本分析文献少。未来研究思路和方向应该是:统一文本分类的标准,提高引文文本计算机处理技术的准确性,扩大应用范围。  相似文献   

13.
[目的/意义]论文被引频次只能反映论文的宏观影响力,无法揭示论文在他人研究中的具体作用和影响,因此,本文提出从引用内容的主题和功能两方面对论文的影响力进行分析。[方法/过程]以2014年诺贝尔生理学或医学奖获得者J.O'Keefe的高被引论文为实例,首先,采用文献计量学方法对引用内容主题进行分析;对其,影响范围及领域进行可视化分析;其次,从引用性质和功能角度,将引用内容分成正面引用、负面引用和中性引用;最后,将中性引用进一步划分为3类,分别是研究背景介绍、理论基础和实验基础。[结果/结论]结果表明,共词分析可以很好地表达论文影响的主题领域;引用内容的分类可以提供一篇论文被引用的多方面原因。在本实验中没有负面引用,多于10%的引用为正面引用,大约50%的中性引用都是作者在研究背景章节中介绍与施引文献相关的研究工作。  相似文献   

14.
丁文姚  李健  韩毅 《图书情报工作》2019,63(22):118-128
[目的/意义] 探索期刊论文科学数据引用特征与规律不仅有助于描述学科领域对科学数据的利用情况,还能够揭示学术成果表达中的数据引用模式。[方法/过程] 以我国图书情报领域6种期刊2017年与2018年第一期刊载论文为样本,结合国家标准《信息技术科学数据引用》的引用元素,采用内容分析法从9个维度对样本论文的科学数据引用行为进行数据编码,应用统计学方法描述图书情报领域期刊论文科学数据引用特征并探索不同维度特征间的关联关系。[结果/结论] 图书情报领域期刊论文广泛引用来自国内外的统计整理类科学数据,对期刊论文中个人研究科学数据的引用量较大;科学数据引用标注方式与科学数据类型存在一定对应关系,但多样化的标注方式缺乏统一性;二手引用现象较为突出,二手引用程度与科学数据创建者类型相关。  相似文献   

15.
��[Purpose/significance] Through the fitting analysis of the citation curves of emerging technology topics, this paper refined and summarized the main types and characteristics of the citation curves, in order to provide a useful reference for the study of prediction methods for radical innovation topics at the micro level.[Method/process] Firstly, the hypothesis of using citation curves to trace the emerging technology topics to produce radical innovation was proposed and the concept and measurement method of the transition index were proposed. The criteria of predicting radical innovation were summarized and the method model of radical innovation identification was constructed from the two dimensions of knowledge transition and continuous growth. Then used the time slices cited data of each emerging technology topic to construct the citation curves, classify and summarize the types and characteristics of citation curves of different emerging technology topics.[Result/conclusion] The citation curves of emerging technology topics includes four types:continuous growth in the near future; continuous decline in the near future; short life cycle; consistent trends in similar years. According to the identification criteria of radical innovation, the citation curves have the potential to become radical innovation if they have many transitions and a large transition range, and the highest citation peak occurs later, and maintains a high citation rate in the near future with a sustained stable or rapid growth. Combined with the assessment of the prediction results by domain experts and the research progress of different emerging technology topics, it is verified that the citation curve fitting analysis can effectively predict the breakthrough of emerging technology topics.  相似文献   

16.
[目的/意义] 对学术论文引用预测影响因素和预测方法进行梳理,分析现存问题并提出发展方向。[方法/过程] 采用文献调研法,综述国内外研究进展,总结预测影响因素和预测方法的相关内容和特点。[结果/结论] 现有影响因素指标繁多,无统一标准;预测方法理论基础薄弱;引文预测动态性研究不足;预测模型通用性受限。未来应加强引文预测的理论研究、加强传统文献计量和替代计量的结合、加强自然语言处理的深度应用、建立统一的基线标准、构建更加精准的预测模型。  相似文献   

17.
��[Purpose/significance] This paper summarizes the influencing factors and prediction methods of academic paper citation, analyzes the existing problems and proposes the future development directions.[Method/process] This paper used the literature research method to review the research progress of academic papers at home and abroad, and summarized the relevant content and characteristics of influencing factors and prediction methods.[Result/conclusion] There are many indicators of influencing factors, but there is no unified selection criteria. The theoretical basis of prediction methods is weak. The research on dynamics of citation prediction is insufficient. The generality of prediction models is limited. In the future, we should strengthen the theoretical research of citation prediction methods, the combination of traditional bibliometrics and alternative metrics, the deep application of natural language processing, and establish a unified baseline standard, a more accurate prediction model.  相似文献   

18.
[目的/意义] 针对60年间作者引用行为演变的分析,了解引文评价的局限性,促进学术论文评价方法的发展和完善。[方法/过程] 通过对1957-2017年物理学和哲学代表性期刊的280篇论文的3 314条参考文献和5 222次引文进行识别,判断和统计其在不同年代的引用特征,并讨论引用行为的演变趋势对引文评价的可能影响。[结果/结论] 通过调查发现如下结论:一是期刊论文在参考文献载体类型和年代分布上没有明显变化,但在篇均参考文献量、参考文献文内平均被引用次数、论文的引用认同和引用深度等方面存在明显变化趋势;二是引用行为的变化,使得引文分析作为学术论文评价的依据受到质疑。论文篇均参考文献量的增长以及深度引用与负面引用比重的下降,使得引文评价的参考性减弱。  相似文献   

19.
[目的/意义]确定基于引用关系提取关键文献时各种方法的优缺点、适用场合,从而使用户快速捕捉领域重要文献,掌握领域概貌。[方法/过程]基于文献引用关系,从文献被引频次、文献引用网络、文献共被引网络3个角度,结合HistCite、CiteSpace等软件探讨领域关键文献的识别方法,通过同源数据的实际验证,对不同方法进行判别比较。[结果/结论]基于被引频次的方法更适合选择特定领域中哪些文献对总体文献的科学进步产生重大影响角度提取关键文献,对应的关键文献集合呈现非常分散的特性;基于引用网络的方法更适合从特定领域研究动态提取发展过程中的关键文献,对应的关键文献集合呈现非常明显的集中特性;基于共被引网络的方法更适合从特定领域研究基础角度提取关键文献,对应的关键文献集合呈现较强的集中性,且能发现原始采集中未发现的大量关键文献。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号