首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
[目的/意义]分析学科规范引文影响力在科学评价中的可行性及其与同行评议的相关性,为负责任计量及以其为支撑的同行评议提供借鉴。[方法/过程]选取F1000以及InCites平台,将29 850篇细胞生物学文献、30 326篇生物技术文献的CNCI (学科规范化引文影响力)与被引频次进行相关分析,对其中956篇细胞生物学论文的CNCI与F1000分值进行斯皮尔曼相关系数检验。[结果/结论]研究结果表明,从统计学视角看CNCI与被引频次呈高度正相关,与F1000分值呈显著正相关,同时亦存在二者相悖的情形。因此,CNCI在一定程度上能够反映同行评议结果、能代偿实施学术影响力归誉的功能,并适用于跨学科比较;但同行评议或CNCI单独作为科学评价标准都会有失偏颇,以CNCI为代表的新一代负责任计量指标为支撑的同行评议将成为未来科学评价的主流。  相似文献   

2.
基于LDA与新兴主题特征分析的新兴主题探测研究   总被引:1,自引:0,他引:1  
本文尝试基于LDA主题模型探测文档集中的新兴主题.本文采用主题的新颖度、发文量指标,并引入被引量,得到新兴主题的特征指标,在此基础上对主题在进入成熟阶段前各个时期的特征进行了分析.并提出了针对上述新兴主题探测指标,基于LDA主题模型抽取文档的语义主题词,利用文档-主题矩阵建立主题和文档的映射,得到主题的新颖度指标和发文量指标、被引量指标,并形成新兴主题探测表格和探测曲线VDP,从而探测出新兴主题,并对新兴主题VDP与基线VDP距离的发展趋势进行预测,根据拟合的曲线对其进行分析,得到最值得关注的新兴主题.  相似文献   

3.
主题词组合新颖性与论文学术影响力的关系研究   总被引:1,自引:0,他引:1  
[目的/意义] 研究学术论文内容的组合新颖性与其学术影响力的关系,为研究论文的学术影响力提供新的研究视角。[方法/过程] 采用文本挖掘方法对论文题目、摘要和关键词中的主题词进行提取,通过构建领域主题词共现网络,为每篇论文设计了新颖组合率、中等组合率和常规组合率3个指标,将领域论文划分为不同的新颖性/常规性类型,然后对不同类型论文中高被引论文所占的比例进行统计分析。[结果/结论] 同时具有主题词组合高新颖性和高常规性特点的论文成为高被引论文的几率显著高于其他类型的论文,因此建议研究者在科学研究中应注重新颖知识与常规知识的适当组合。  相似文献   

4.
学术文献引文推荐研究进展   总被引:1,自引:0,他引:1  
[目的/意义]学术文献引文推荐是指对于给定的学术文献,自动化地为其推荐合适的引文和参考文献。借助于引文推荐,用户可以在一定程度上提高撰写学术文献的效率,降低对重要相关文献的漏引。[方法/过程]分析国内外引文推荐研究的最新进展,阐述引文推荐问题的演化过程,从局部引文推荐和全局引文推荐等方面对引文推荐进行梳理,重点归纳文档相似性、主题模型、翻译模型、协同过滤和混合推荐等5种引文推荐常用方法,并总结引文推荐常用数据集和测评方法。[结果/结论]已有引文推荐研究的主要问题在于未考虑用户偏好的动态变化性及研究领域的综合性,在用户研究和实际应用方面仍有所欠缺;未来引文推荐的研究可运用语义化表达方法和自然语言生成技术,从基于上下文的引文推荐和跨语言引文推荐等方面进行展开。  相似文献   

5.
[目的/意义]学术文献影响力评价指标不断推陈出新,但尚缺乏在研究主题层面对文献影响力的评价,为发现不同研究主题内具有高影响力和引用价值的文献,本研究给出一种基于研究主题的文献影响力评价方法。[方法/过程]以Web of Science数据库中2011年-2015年间情报学领域500篇高被引文献为样本,利用LDA模型对样本文献进行主题建模,将主题对文献的支持度与文献被引频次相结合,计算特定主题文献的被引频次(specific topic cited frequency,简称STCF),并根据每篇文献在相应主题内的STCF值对文献进行影响力排序。[结果/结论]结果表明,STCF值能反映文献的主题内容、细粒度体现文献的学术地位、呈现文献研究主题的多元性,能够有效弥补被引频次、Altmetrics指标的不足。  相似文献   

6.
[目的/意义]针对目前医学领域基于主题的语义相似度计算研究较少,尚不足以揭示主题间在语义层面的关系,提出一套用于主题间语义相似度计算的方法,进而从语义角度判断主题间关系,为主题新颖性判断、主题关联研究等提供参考。[方法/过程]以MeSH词表为语义计算的基础,剖析词表结构与现有研究成果,从入口词、语义距离、注释3个维度综合测度主题间的语义相似度,利用PubMed中2011-2014年干细胞领域的文献进行实证研究。[结果/结论]利用通用验证主题词对,验证了本文所提3个测度维度的有效性。通过主题间语义相似度的计算,发现干细胞领域2011-2014年较为新颖的主题为未成年人干细胞研究。后续研究中还需融入基于统计的主题相似度,从而更加全面地揭示主题间的关系,发现语义层面领域的新颖性研究主题。  相似文献   

7.
基于F1000与WoS的同行评议与文献计量相关性研究   总被引:1,自引:1,他引:0  
为比较同行评议与文献计量方法在科学评价中的有效性及相关性,选取F1000以及Web of Science数据库,采用SPSS16.0软件,将近2000篇论文的F1000因子与Web of Science数据库中指标进行相关性比较。结果显示,F1000因子与统计区间内的被引频次呈显著正相关,同时一些F1000因子很高的论文并没有高频被引,反之亦然。结论指出:从统计学的视角,文献计量指标与同行评议结果具有正向相关性,但是无论是同行评议还是文献计量,单独作为科学评价标准都会有失偏颇,以引文分析为代表的定量指标与同行评议方法的结合将是未来科学评价的主流。  相似文献   

8.
[目的/意义]从主题视角对环境科学领域的零被引论文进行分析,对比零被引论文与高被引论文在文章内容、外在指标方面的不同,揭示零被引论文存在的原因。[方法/过程]首先,对来自Web of Science数据库的国内环境科学领域的260篇高被引论文、907篇零被引论文的摘要进行PLDA主题识别,然后通过主题相似度计算发现主题间的关联,以主题热度作为内部指标,发文时间、发文期刊作为外部评价指标,最后,把论文主题内容与外部指标结合进行零被引与高被引论文之间的相同主题、不同主题对比分析。[结果/结论]在研究主题相同情况下,期刊的影响因子大小是影响零被引论文的主要因素;在主题不同的情况下,论文研究的主题内容是导致零被引论文的主要原因。  相似文献   

9.
[目的/意义]基于内容的过滤推荐中,针对向量空间模型表示文本时容易造成维度灾难的问题,提出利用余弦值r与匹配度值Sim相结合的方法对原有模型进行改进。[方法/过程]由文献资源和用户兴趣分别筛选出权重较大特征词的词向量,进而由公式计算余弦值r,结合对应的特征词权重进一步计算出匹配度值Sim,将其作为向目标用户推荐文献的依据,并利用河北工业大学图书馆的相关数据对改进模型、向量空间模型及LDA主题模型进行实验,最后利用查准率、召回率、F1值及运行时间等评价指标对3种模型的实验结果进行分析。[结果/结论]实验结果表明所提出的改进模型相比较于实验中的向量空间模型与LDA主题模型具有更高的应用价值与运行效率。  相似文献   

10.
[目的/意义] 创新是学术论文的本质要求,如何有效评价学术论文的创新力一直以来备受国内外专家和学者关注。随着信息技术的发展,利用计算机技术从论文内容角度对单篇学术论文的创新力进行评价逐步成为可能。[方法/过程] 提出一种基于研究主题对比的单篇学术论文创新力评价方法。该方法首先利用Keygraph算法提取代表论文研究主题的关键词,然后,将论文的研究主题与科学研究前沿主题进行相似度计算,最后,结合期刊影响因子和Altmetrics两项外在指标提出一种论文创新力综合评价模型。[结果/结论] 通过对"碳纳米管"材料研究领域的实证研究证明,该方法能够有效、迅速和准确地从论文内容角度对单篇学术论文的创新力进行评价。  相似文献   

11.
[目的/意义] 进一步探讨Web 2.0环境下选择性计量指标的有效性。[方法/过程] 以"data mining"为检索词,获得Mendeley与Web of Science两平台的交叉文献集合,分别对交叉文集的被引频数与阅读数、被引频数与标签数进行相关性检验后,从每组选取指标值差异最大与最小的各100篇文献进行具体分析。[结果/结论] 传统计量指标被引频数与Mendeley中的阅读数和标签数均存在弱相关性,证实了以阅读数和标签数为代表的选择性计量指标可以在一定程度上评估文献的影响力,且文献类型、出版年份和作者h指数会对用户阅读、引用等文献利用行为产生影响。未来文献影响力评价的发展方向应为传统文献计量方法与选择性计量方法的结合。  相似文献   

12.
[目的/意义]传统的文献主题提取方法主要是通过关键词、摘要、全文等提取文献的主题内容,使得主题内容不全面或存在"噪音",而从文献内容语义出发,结合引用内容提取文献的主题,能够更加准确地提取出多文档的主题内容。[方法/过程]提出一种面向多文档的基于语义和引用加权的科技文献主题提取算法,利用文献的引用内容和关键词构建Labeled-LDA主题模型,形成文档-主题概率向量,再根据K-means聚类方法聚类文档,提取每类文档集的主题内容。[结果/结论]以PubMed生物医学数据库中的数据作为实验数据,测试该方法的可靠性,结果证明该方法能够准确、全面地提取出多文档的主题内容。  相似文献   

13.
刘红煦  王铮 《图书情报工作》2018,62(16):102-110
[目的/意义]为了探讨在学科论文评价上,Altmetrics指标间的量度结果是否具有一致性,试图通过已有测量数据构建基于Altmetrics的文献综合评价模型,为评价数据的使用和重用创建新的度量标准。[方法/过程]获取PLoS ALMs上土木工程学科2009年至2016年发表的全部文章的Altmetrics指标,采用相关分析、主成分分析方法将15个原始指标划分到4个主成分,得到适用于具体学科的Altmetrics评价指标体系,并对Altmetrics的单一指标与综合评价指标进行相关度分析,采用"公平性测试"方法探索时间对论文评价相关度的差异。[结果/结论]研究发现采用"公平性测试"方法消除时间影响后,引用指标相关性上升,而与社交媒体传播相关的指标有所下降,但Twitter指标不降反增,且始终与F值具有较高的相关性。  相似文献   

14.
[目的/意义] 对学术论文引用预测影响因素和预测方法进行梳理,分析现存问题并提出发展方向。[方法/过程] 采用文献调研法,综述国内外研究进展,总结预测影响因素和预测方法的相关内容和特点。[结果/结论] 现有影响因素指标繁多,无统一标准;预测方法理论基础薄弱;引文预测动态性研究不足;预测模型通用性受限。未来应加强引文预测的理论研究、加强传统文献计量和替代计量的结合、加强自然语言处理的深度应用、建立统一的基线标准、构建更加精准的预测模型。  相似文献   

15.
��[Purpose/significance] This paper summarizes the influencing factors and prediction methods of academic paper citation, analyzes the existing problems and proposes the future development directions.[Method/process] This paper used the literature research method to review the research progress of academic papers at home and abroad, and summarized the relevant content and characteristics of influencing factors and prediction methods.[Result/conclusion] There are many indicators of influencing factors, but there is no unified selection criteria. The theoretical basis of prediction methods is weak. The research on dynamics of citation prediction is insufficient. The generality of prediction models is limited. In the future, we should strengthen the theoretical research of citation prediction methods, the combination of traditional bibliometrics and alternative metrics, the deep application of natural language processing, and establish a unified baseline standard, a more accurate prediction model.  相似文献   

16.
基于共词分析法的学科主题演化研究方法的构建   总被引:1,自引:0,他引:1  
唐果媛 《图书情报工作》2017,61(23):100-107
[目的/意义]相比于以单纯的关键词统计排序为主的词频分析法,和以文献作为分析对象、需要庞大的引文索引作为基础的共引分析法,共词分析法具有一定的优势。因此,基于共词分析法来研究学科主题演化规律。[方法/过程]构建基于共词分析法的学科主题演化研究方法,包括4个模块,分别是:数据准备、演化阶段划分、主题识别和主题演化分析。[结果/结论]在主题识别阶段改进了词频g指数来选取共词分析的对象;在主题演化分析模块,提出从静态和动态两个角度来分析学科主题的演化情况,构建三维战略坐标来进行静态分析,并构建学科主题演化现象识别模型来进行动态分析。  相似文献   

17.
齐燕 《图书情报工作》2017,61(24):114-122
[目的/意义]首次被引速度是反映文献及其作者或承载期刊的影响力的重要维度,也在一定程度上决定了后续被引情况。尝试通过一些改进工作克服部分现有评价指标存在的问题,如评价结果区分度过小甚至错误、应用受限,以及不适应出版周期缩短的现实趋势等。[方法/过程]基于文献引用详细信息考察从计时单元细化进行指标改进的可行性,对现有研究中的两类指标进行改进,提出评估首次被引速度的新指标:S类指数(包括SF、Sz指数)和FM指数。考虑到要达到一定的数据量特定学者的发文时间跨度通常相对较大进而数据特征更为丰富的特点,选择他人同主题研究中的我国图书情报与文献学领域10名科研人员为研究对象进行实证研究,在CNKI引文数据库中获取324篇文献的首次施引文献,基于"被引-首引文献对"的年度或月度的时间差进行相应指标的计算。[结果/结论]从10位学者的新旧指数的评估结果看,相对于现有研究指标,新的FM指数具有非常显著的区分度及精细度的提升;新的S类指数具有与h指数相近的评价效力,同时其计时数据的客观、稳定的特性使其具有比传统S指数相对更大的应用空间;而且原始数据的获取对数据库没有过多要求,仅需进行一些数据处理和运算的编程工作,具有较大的可行性。  相似文献   

18.
基于专利申请及审查制度的专利引文评价效能实证研究   总被引:1,自引:0,他引:1  
[目的/意义]研究专利申请及审查制度下的专利引文作用机理,厘清专利引文评价效能,是保证学术评估客观合理的重要前提。[方法/过程]以美、中、日三国诉讼专利和许可专利为实证样本,分析专利引文频次与专利价值的相关性,并结合专利申请和专利审查制度就专利引文对施引专利、被引专利的评价效能进行深入剖析。[结果/结论]专利引文频次对专利价值而言是一个正向、负向、中性混杂的评价指标,专利引文对专利价值的评价需建立在对引用动机、引文扮演角色和实际发挥作用等诸多要素的深入细致分析上,否则,专利引文对专利价值不具有客观的评价效能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号