首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于归因分析的引用模式挖掘及其实证研究
引用本文:崔蕴学,王贤文,王勇臻.基于归因分析的引用模式挖掘及其实证研究[J].情报学报,2023(4):381-392.
作者姓名:崔蕴学  王贤文  王勇臻
作者单位:大连理工大学科学学与科技管理研究所暨WISE实验室
基金项目:国家自然科学基金项目“科学文献全景大数据下的研究热点及研究前沿探测”(71974029);;中央高校基本科研业务费项目(DUT21RC(3)068);
摘    要:学术文献的引用模式背后潜藏着纷繁复杂的引用动机,制约着学术界对科研人员引用行为的深入理解。针对这一问题,本文以归因分析为研究视角,选取PubMed Central数据库的50万条引用关系作为研究样本,旨在揭示引用模式背后的原因构成并予以定量解释。首先,从引用的学术动机和非学术动机出发,遴选了12类引用因素作为特征,用于刻画引用关系;其次,根据所构建的特征,采用决策森林算法在50万条真实引用关系和等量配对的虚拟引用关系上进行分类实验;最后,借助SHAP (SHapley Additive exPlanations)解释框架对实验结果进行归因,评估了12类引用因素在引用决定中的影响程度和作用方式。研究结果表明,不同的引用因素在决定是否引用一篇文献的过程中所发挥的作用具有较大差异。具体而言,主题相关性、研究背景相似性以及被引作者学术水平等因素在引用决定中发挥了主要作用,而其他因素如期刊影响力、话题热点性等,则在引用决定中起次要作用。除此之外,不同引用因素对引用决定的作用方式也不尽相同,其特征取值与对引用决定的影响程度的变化关系可归结为4种类型:S曲线型、对数增长型、二分型以及随机波动型。

关 键 词:归因分析  引用模式  SHAP
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号