首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 199 毫秒
1.
基于引文内容分析的档案学高被引论文引用特征研究方法,文章界定三种引用情感类型,实证研究基于引文内容的主题识别和情感类型识别。揭示档案学高被引论文反映的引用主题和引用行为动机。  相似文献   

2.
徐琳宏  丁堃  陈娜  李冰 《情报学报》2020,39(1):25-37
基于内容的引文情感分析克服了传统基于引用频次的引用同一化问题,是引文内容分析领域一个重要的研究热点。然而引文情感分析依赖于带标注的数据集,目前大规模高质量的引文情感语料资源匮乏,严重制约了该领域的研究。因此,本文在分析引文情感表达方式的基础上提出了一套适用于引文情感表示的标注体系,并详细阐述了语料库建设的技术和方法。采用人机结合的标注策略,借助完善的引文标注系统,构建了规模较大的中文文献的引文情感语料库。统计结果显示,在中文信息处理和科技管理领域情感褒义和贬义总的引用的占比分别为22%和6%,引文情感标注kappa值达到0.852,表明该语料库能够客观地反映作者的情感倾向性,可为论文评价、引文网络分析和情感分析等相关领域的研究提供数据支撑。  相似文献   

3.
[目的/意义]通过梳理图书情报领域情感研究的现状和发展脉络,以识别该主题范围的核心作者和重要文献,归纳总结相关研究框架及研究特点,并展望未来研究趋势。[方法/过程]以Web of Science、LISA、Google Scholar等数据库中图书情报领域情感研究文献为分析对象,借助HistCite软件对引文数据进行挖掘分析;采用内容分析法构建了情感研究框架。[结果/结论]图书情报领域情感研究处于快速发展期,人机交互及IT利用、信息行为中的情感研究是图书情报学者比较重视的研究方向,社交网络环境中的用户情感倾向识别是热点研究方向。图书情报情感研究还存在理论发展滞后、术语和分类体系混杂等问题需突破。  相似文献   

4.
定义和比较“引文”和“引用”两个紧密相关而又相互独立的概念,并基于Journal of Informetrics(JOI)期刊中的论文数据进行相关的实证分析。通过从JOI期刊全文数据中识别出在正文中出现的引用信息,统计文章中引用个数的分布情况,计算引用个数与引文篇数之间的相关系数,分析引用和引文之间的多对多关系,并提出一种新的加权的计算引文总被引次数的方法。结果表明,这种方法可以更早地识别出最新发表的高被引论文,因此在科学预见和科学评价方面具有重要的应用价值和前景。  相似文献   

5.
基于被引次数的引文分析无法直接揭示论文的研究内容,利用关键词或从标题、摘要和全文中抽取的主题词很难客观反映论文的被引原因。本文以碳纳米管纤维研究领域的高被引论文为研究对象进行引文内容抽取和主题识别,经人工判读验证:基于引文内容分析的高被引论文识别的核心主题能够较好地揭示高被引论文的被引原因(引用动机),而且与论文的研究内容相符合;与基于全文、基于标题和摘要的主题识别相比,在引文内容分析基础上识别的主题具有更好的主题代表性,能够有效揭示被引文献的研究内容,是对原文相关信息的重要补充。本文的实验表明基于引文内容分析的高被引论文主题识别是可行而且有效的。图4。表4。参考文献31。  相似文献   

6.
[目的/意义] 针对60年间作者引用行为演变的分析,了解引文评价的局限性,促进学术论文评价方法的发展和完善。[方法/过程] 通过对1957-2017年物理学和哲学代表性期刊的280篇论文的3 314条参考文献和5 222次引文进行识别,判断和统计其在不同年代的引用特征,并讨论引用行为的演变趋势对引文评价的可能影响。[结果/结论] 通过调查发现如下结论:一是期刊论文在参考文献载体类型和年代分布上没有明显变化,但在篇均参考文献量、参考文献文内平均被引用次数、论文的引用认同和引用深度等方面存在明显变化趋势;二是引用行为的变化,使得引文分析作为学术论文评价的依据受到质疑。论文篇均参考文献量的增长以及深度引用与负面引用比重的下降,使得引文评价的参考性减弱。  相似文献   

7.
[目的/意义]学术成果被国际临床指南引用,作为追踪学术成果应用到临床实践的一种重要指标,已用于多个国家科技评价中衡量医学研究影响力。但我国尚未有研究探讨医学领域研究成果被临床指南引用情况及论文特征。[方法/过程]本研究以呼吸病学领域为例,采用专家咨询法确定国际临床指南,通过背对背方式对论文被指南引用性质和研究类型进行注释,应用文献计量法对引用情感、引用论文的年龄、研究类型等被引论文特征进行分析。[局限]本研究仅分析了成功被临床指南引用的论文,而已经发表的与分析指南所涵盖的主题潜在相关但未在临床指南中引用的论文数量尚未得知。[结果/结论]结果发现临床指南引用的论文知识周期中值时间为4年,93.55%为临床研究,100%为正面引用和中性引用,13.86%发表在影响因子在10分以上的期刊,51.49%被基金资助,63.89%为国内合作。本研究所揭示的指南引用论文特征将为提高我国临床医学研究影响力提供一定的参考依据。  相似文献   

8.
常红  田野 《图书情报工作》2021,64(22):96-105
[目的/意义] 分析Wilson信息行为模型的扩散和影响力,即模型的每个组成元素是如何被其他文献引用,旨在探索用户信息行为研究的跨学科特性。[方法/过程] 采用引文分析和内容分析方法,揭示该模型在时间维度、文献类型、学科维度等的被引情况以及模型概念的共现关系,并利用Gephi进行可视化展示。[结果/结论] 研究发现Wilson信息行为模型的影响力随时间的推移不断增加,并且更倾向于被实证型论文引用。其次,由于该模型采用跨学科视角,其在社会科学、计算机科学和医学等非图书情报领域的影响力非常明显。最后,引用该模型的文献注重对模型内容的探讨,模型的各个方面都进行不同程度的扩散,但缺乏较为深入的分析。  相似文献   

9.
[目的/意义]学科交叉融合使得学科间知识交流日益频繁,从个体引文网络和整体引文网络入手,对我国人文社会科学领域跨学科知识流动进行量化分析,对“新文科”背景下该领域学科的守正与创新具有重要意义。[方法/过程]以2016-2020年23个学科450本期刊的论文引用关系为数据源,基于个体引文网络,从23个学科自身出发,根据学科互引关系确定模糊规则,利用Matlab进行模糊推理,确定学科知识固化程度;基于整体引文网络,运用“累积”的思想,计算学科知识累积流动率和累积影响力,根据知识流动情况划分学科类型。[结果/结论]研究结果表明,从个体引文网络视角分析,语言学、体育学、法学综合知识固化程度较高,统计学综合知识固化程度最低;从整体引文网络视角分析,将该领域23个学科根据知识流动划分为3种类型,经济学和管理学的累积影响力最大。研究发现“累积”思想对学科的评价效力优于直接引文分析,能够挖掘“隐藏”的学科知识流动潜在信息,为我国人文社科领域的学科建设和发展提供一定的启示。  相似文献   

10.
[目的/意义] 为了解我国标准文献的学术影响力, 以为标准文献的利用提供参考, 从标准文献的角度出发, 分析其被引证特征。[方法/过程] 选择中国引文数据库中1994-2013年标准类引文数据, 采用文献计量的方法, 从标准引文总量、篇均标准引文量等方面分析标准文献的总体被引用情况和学科分布情况。[结果/结论] 标准引文量和篇均标准引文量占引文总量比例很小;各学科标准引文量差异较大, 工科和医科对标准文献的引用较多;标准引文数量和被引频次较高的专题集中于自然科学;大部分社会学科标准引用量为零;标准引文的半衰期整体上较长, 老化速度较慢。  相似文献   

11.
[目的/意义] 将引用内容分析与引文著录分析进行比较,旨在引起国内学者、出版商、图书馆、信息服务等相关人员和部门对引用内容研究的关注,促进引文分析理论和实践的全面发展。[方法/过程] 首先对引文著录与引用内容的相关概念进行分析,然后从引用频次的计算、引用极性的分类、引用动机的分析、引文网络中文献之间的关系、应用发展5个角度将引用内容分析与引文著录分析进行比较,得出引用内容分析相对引文著录分析的优势所在。[结果/结论] 与引文著录分析相比较,引用内容分析在科学评价和揭示科学技术发展的特征方面更合理,是引文著录分析的有力补充。  相似文献   

12.
学术文献引文上下文自动识别研究   总被引:2,自引:2,他引:0  
[目的/意义] 引文内容分析能够帮助揭示文献引用关系的深层语义内涵,而引文上下文识别作为引文内容分析的基础显得尤为重要。[方法/过程] 梳理已有引文上下文研究的现状,总结当前引文上下文识别的不足,在此基础上归纳引文上下文识别的5类特征,并采用文本分类和序列标注两种方法开展引文上下文自动识别实验。[结果/结论] 实验结果表明,本文提出的特征能够很好地提升引文上下文识别效果,且基于文本分类的SVM分类效果要优于基于序列标注的CRF。  相似文献   

13.
[目的/意义] 为更好地提升基于内容的引文分析效果,对国内外引用对象相关研究进行调研总结,为引用内容分析研究提供借鉴。[方法/过程] 通过调研国内外引用对象相关研究,梳理引用对象的概念定义、分类体系、应用领域和自动化识别等方面研究进展,总结当前引用对象研究不足并提出未来发展方向。[结果/结论] 引用对象从语义层面评价文献学术研究的贡献和利用价值,为引文分析方法增加了重要维度。引用对象研究需要从理论、技术和应用三个方向进行深化:理论上,加强多维度引用对象特征的研究和分析;技术上,探索基于大规模语料的自动化识别方法;应用上,尝试基于引用对象的科研评价服务。  相似文献   

14.
刘晓娟  马梁 《图书情报工作》2017,61(24):105-113
[目的/意义]通过探索出版年份对学术著作引文分布的影响情况及学科间的差异性,为合理利用引文进行学术著作评价提供参考。[方法/过程]以BKCI收录的出版于2005-2015年间的学术著作为研究数据集,分析学术著作的出版量、被引频次的大小与分布以及学术著作的被引模式随出版年份和学科领域的变化情况。[结果/结论]各学科学术著作的出版量和被引频次随着出版年份推移的变化趋势大致相同,但相对大小差异显著。社会科学和艺术与人文科学学科的学术著作的数量显著高于其他学科,但其被引频次始终维持在较低的水平;从被引频次的分布上看,各学科均呈现出两极分化的趋势;各学科学术著作的被引模式略有不同。  相似文献   

15.
[目的/意义] 概率主题模型算法在不断得到改进与扩展,本文对国内外已有的利用引文构建的主题模型进行研究,分析和对比不同模型的生成过程与算法,并探讨利用引文构建的主题模型在科技文本分析中的应用与可扩展的研究方向。[方法/过程] 通过Web of Science数据库和CNKI数据库获取国内外利用引文构建主题模型的相关文献,经人工判读后筛选出具有代表性的文献,对这些文献中利用引文构建的主题模型,从建模思想、生成过程、参数估计与推断算法等方面进行对比与分析。[结果/结论] 目前国内外利用引文构建的主题模型主要包括研究主题与引文分布的主题模型、研究被引与施引主题间关系的主题模型,以及基于引用内容的引用主题模型;主题模型中引入引文信息后,能够获得更完整的主题内容和特定主题下的重要文献,并可识别施引文献和被引文献之间主题间的关系及影响;已有的模型多集中在概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)和潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型基础上进行扩展。未来可扩展研究引入引用内容的主题模型、模型的性能优化和评价方法、模型的应用研究等。  相似文献   

16.
[目的/意义] 比较中美专利引文的异同,对两者深入认识理解,明晰两者在揭示专利关联度、反映专利所有者间竞争关系、判断专利商业价值和法律稳定性等方面的异同,以利于专利引文价值的更好实现。[方法/过程] 研究中美专利引文的区别,并深入分析其专利制度和社会观念层面的原因。[结果/结论] 中美专利引文在著录内容、引用位置、排序标准、标识要素、类型标注及对PCT申请的国际阶段产生的专利引文态度等方面均存在差异,因而在建立专利引文数据库、挖掘专利引文情报时,只有区别处理,才能提高专利引文分析成果的准确性,更加有效地实现专利引文的价值。  相似文献   

17.
[目的/意义]引用语境是科学论文中包含引用的句子,是对引文的描述性或评价性文字。通过提取和分析引用语境中的线索词,可以了解引用语境的一般特征。[方法/过程]以Journal of Informetrics(JOI)期刊为例,选取人称代词、行为动词和连接词三类常用的线索词,分别计算它们在引用语境中的频次、占比和排序。通过比较各类线索词在引用语境和非引用语境中的存在度,识别引用语境中的常用句型和论证模式。[结果/结论]在JOI期刊中,引用语境主要表现出如下特点:侧重于第一人称和第三人称论述,既展现他人的工作,也展现作者的研究;偏重于研究方法类引用,常用的行为动词为"use"base"和"study";强调通过转折和列举等逻辑方式进行论证,最常用的连接词位"also"和"but"。分析引用语境中的线索词,对于更好地理解科学论文中的引用的功能和动机具有重要的价值和意义。  相似文献   

18.
利用引文内容监测多学科交叉现象的方法与实证   总被引:1,自引:0,他引:1  
[目的/意义]旨在从引文内容分析的角度探测不同学科的专业知识交叉情况。[方法/过程]首先采集PLOS ONE上6个学科的1 389篇学术论文,其中包含引文内容45 496条;然后利用句法分析方法识别引文内容中的名词词语;接着利用词语的类间分布熵计算词语术语度,确定引文内容中的学科术语;最后统计学科术语在其余5个学科的分布情况,探究其背后的学科交叉情况。[结果/结论]分析学科术语在其他学科的频次,得到6个学科之间的学科交叉性。引文内容术语能够探测学科的交叉融合现象,对改进传统的学科多样性测度具有重要的参考价值。  相似文献   

19.
学术文献引文推荐研究进展   总被引:1,自引:0,他引:1  
[目的/意义]学术文献引文推荐是指对于给定的学术文献,自动化地为其推荐合适的引文和参考文献。借助于引文推荐,用户可以在一定程度上提高撰写学术文献的效率,降低对重要相关文献的漏引。[方法/过程]分析国内外引文推荐研究的最新进展,阐述引文推荐问题的演化过程,从局部引文推荐和全局引文推荐等方面对引文推荐进行梳理,重点归纳文档相似性、主题模型、翻译模型、协同过滤和混合推荐等5种引文推荐常用方法,并总结引文推荐常用数据集和测评方法。[结果/结论]已有引文推荐研究的主要问题在于未考虑用户偏好的动态变化性及研究领域的综合性,在用户研究和实际应用方面仍有所欠缺;未来引文推荐的研究可运用语义化表达方法和自然语言生成技术,从基于上下文的引文推荐和跨语言引文推荐等方面进行展开。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号