首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 343 毫秒
1.
[目的/意义]针对海量科技文献新颖性评估需求,从科技论文研究问题与方法视角出发,利用科技论文摘要与相关引文文本,构建科技论文的评述画像,用于辅助科技论文新颖性评估。[方法/过程]提出一种综合“自评+他评”内容的科技论文评述画像方法。该方法基于期刊论文结构化摘要文本解析问题和方法等句子,以单篇期刊论文为目标文献,将施引文献中引文句子作为引文数据集并分类后,可视化呈现科技论文的自评和他评内容。目前科技论文评述画像分为两种:一是按照引用问题与方法等分类并可视化,二是按照自引他引及情感分析进行分类可视化。[结论/结果]构建的科技论文评述画像能够从论文作者与引文作者的双重视角综合展示目标论文的研究成果,结合自引他引及情感分析信息可有效辅助科技论文新颖性评估。  相似文献   

2.
[目的/意义]针对被引频次指标在学术论文评价中的局限性,提出基于多维度引用特征的学术论文评价方法,提高引文指标在单篇论文评价中的可靠性。[方法/过程]通过被引频次标准化消除学科、时间等因素的影响,作为频次指标;通过引用主体的重要性、引用时间跨度、引用强度、引用位置、引用情感、主题相似度6个维度的引用特征,区分不同引用中被引文献对施引文献的作用,作为特征权重;将频次指标和特征权重相结合,对学术论文进行定量评价。[结果/结论]改进基于引用的学术论文评价方法,有效解决被引频次指标对所有引用同等对待的问题。该方法的评价结果比被引频次指标更加合理,还能更细致地剖析论文的被引特征。  相似文献   

3.
[目的/意义] 引文情感分析揭示施引文献对被引文献的褒义、贬义和中性的情感倾向性,解析文献之间深层语义关系,能够帮助更加准确地评价被引文献和作者。[方法/过程] 以自然语言处理领域文献的引文情感为数据集,利用引文中情感表达的引文标识位置指引和情感词汇等特征,采用支持向量机(SVM)构建引文情感的自动识别系统,探索生成更大规模数据的方法。[结果/结论] 实践应用证明,该系统特征的区分度较强,准确率达到93.4%,识别效果较好。引文情感的自动识别系统实用价值较强,拓宽了引文网络分析的研究方法和内容,能够完善论文评价体系。  相似文献   

4.
[目的/意义]针对z指数评价学者学术影响力存在的问题,提出融合引文分析与Altmetrics改进z指数得到znew指数方法,以提高对学者影响力评价的科学性与合理性。[方法/过程]文章融合学术论文被引频次、下载量和期刊影响因子指标,考虑作者贡献度,构建学术论文综合学术影响力综合指标(AC),以替代z指数评价的基本单元——被引频次(C)单一指标,改进得到znew指数。以图书情报学领域2016—2020年的发文为数据来源,统计获得发文量排名前50位的学者,分别计算他们的znew指数、z指数、p指数、h指数、总发文量N、加权综合学术影响力(AC)、篇均影响力(AC/N)、体现论文影响力分布的一致性指标μ,并实证分析了znew指数评价学者学术影响力的效果。[结果/结论]znew指数在继承z指数优势的基础上,同时也具有自身特有的优势和特点,可较公平和客观地对学者的影响力进行评价。  相似文献   

5.
[目的/意义]语句层共被引的关系内容抽取与分类有助于揭示共被引论文间的主题关联。[方法/过程]文章从共被引主题的相似性和相关性出发,利用引用标注位置、作者、语义角色分析、句法分析等信息,将语句层共被引关系划分为同系列、同主题、发展关联、运用关联、并列关联,然后抽取相应的引用主题,构建<被引论文及主题,关系类型,共被引论文及主题>双层三元组,实现共被引关系内容结构化表达,并在Neo4j图数据库中呈现。[结果/结论]实验采用Athar引用语料库;结果表明,本文研究方法可提高语句层共被引网络中关系的可读性和共被引论文的语义搜索、问答与推荐的效率。[局限]实验方法针对英文文献而设计,未来将在更多领域的英文语料上进行验证,并从名词性关系识别、术语选择等方面完善关系内容抽取与分类。  相似文献   

6.
[目的/意义]提出融合母评论文本信息的评论短文本情感分类模型以提高互联网环境下短文本评论情感分析效果,适应舆情工作中的实际应用需求。[方法/过程]以短视频平台舆情事件的评论数据为实验对象,利用GRU提取母评论文本特征和直接提取评论区特征,分别将这些特征与CNN提取原评论文本特征并行融合进行情感分类。[结果/结论]相较于传统深度学习方法,引入的母评论文本特征使两个数据集的情感分类效果都获得了一定提升,F1值等均分别提升了2%和1%,说明本文提出的特征引入方案能够提升评论短文本的分类效果,为舆情工作中的情感监测实际应用提供了思路,验证了舆情相关理论研究对实际技术应用有借鉴和指导意义。  相似文献   

7.
张晓丹 《情报杂志》2021,(1):184-188
[目的/意义]随着互联网数字资源的剧增,如何从海量数据中挖掘出有价值的信息成为数据挖掘领域研究的热点问题。文本大数据分类是这一领域的关键问题之一。随着深度学习的发展,使得基于深度学习的文本大数据分类成为可能。[方法/过程]针对近年来出现的图神经网络文本分类效率低的问题,提出改进的方法。利用文本、句子及关键词构建拓扑关系图和拓扑关系矩阵,利用马尔科夫链采样算法对每一层的节点进行采样,再利用多级降维方法实现特征降维,最后采用归纳式推理的方式实现文本分类。[结果/结论]为了测试该文所提方法的性能,利用常用的公用语料库和自行构建的NSTL科技期刊文献语料库对本文提出的方法进行实验,与当前常用的文本分类模型进行准确率和推理时间的比较。实验结果表明,所提出的方法可在保证文本及文献大数据分类准确率的前提下,有效提高分类的效率。  相似文献   

8.
[目的/意义]揭示不同年龄的参考文献对促进知识创新的作用规律。[方法/过程]以物理学2006年发表的SCI论文为例,计算每篇论文在D算法、Rela_DZ算法和DZ算法3种算法下的颠覆性指数,综合运用统计描述和线性回归、分位数回归,从参考文献年龄的跨度和多样性两个方面,研究科研论文颠覆性与参考文献年龄之间的关系。[结果/结论]参考文献年龄跨度和多样性都对科研论文的3种颠覆性指数有负向影响,但是所有回归分析的结果中3个模型的拟合R2都偏低,但结论一致,即参考文献年龄对科研论文颠覆性指数的影响并不明显,因此操纵参考文献年龄的非科学引用并不会影响颠覆性指数的评价结果。  相似文献   

9.
[目的/意义]旨在将科技文献的价值进行量化,提高PageRank算法应用在科技文献排名中的准确性。[方法/过程]在加入时间因子的PageRank算法的改进算法WPageRank的基础上,加入引用相关度进行改进,并计算文献的固有价值,与文献的PageRank值进行加权求和,得到文献的最终价值。[结果/结论]本文提出的方法使新发表的高质量文献也可以获得较高排名,并且使领域内的高质量文献更容易被检索到,同时保证了检索的时效性和主题集中性。  相似文献   

10.
[目的/意义]探索突发公共卫生事件网络舆情发展周期中的主题和情感演化历程,研究影响网民情感波动的因素,为网络舆情有效管控提供决策支持。[方法/过程]结合博文数量的时序特征和生命周期理论进行周期划分,利用LDA模型、BERT-BiLSTM-Attention模型构建研究框架,探究不同周期的舆情主题差异及情感演化。[结果/结论]线下病毒变异演化和线上舆情主题与情感演化具有关联性。在新型冠状病毒变异语料库中,BERT-BiLSTM-Attention模型分类准确率为0.8817,F1值为0.8778,其在情感演化分析上具有优越性。构建的“数据采集预处理、舆情周期划分、主题演化和情感演化到获得策略输出”的全过程分析框架对相关部门有效引导网络舆情提供了决策支持和理论支撑,BERT-BiLSTM-Attention模型能更准确地进行情感分类。[局限]数据源单一,面向时间维度上的演化历程未进行时空结合的演化分析。  相似文献   

11.
王超 《情报探索》2020,(6):33-39
[目的/意义]探讨论文被引量与下载量之间的关系,对论文影响力评价有重要的意义。[方法/过程]通过CNKI数据库,以《中文核心期刊要目总览》中理工农医类及经济、历史、法律、哲学类期刊2006年刊载的55 000多篇论文为基础,分析不同类论文的被引量分布特征,比较同被引量论文的下载量以及相近下载量论文的平均被引量,采用Spearman相关性方法计算不同类论文下载量、被引量的等级相关系数。[结果/结论]不同类论文的被引量分布具有一致趋势:随被引量的增多论文数比例较快地减小直至为0,相应的被引量分布可以由指数衰减函数近似函数表征。在绝对数量上,论文的下载量、被引量存在较大差别,二者之间的相关性不明显,与下载、被引的自身特征以及各类论文的文献使用特征有关。Spearman等级相关分析表明,论文层级上,下载量、被引量的等级相关性较强,某一篇论文在一定时期内的下载量可以依靠其排序位数预测其统计意义上的被引排序数,可以为论文评价提供参考。  相似文献   

12.
俞立平 《现代情报》2021,41(1):137-143
[目的/意义] 学科核心期刊载文量下降现象需要引起重视,有必要在此背景下分析论文篇幅与被引之间的关系。[方法/过程] 本文提出篇幅影响因子的概念,采用普通回归与分位数回归,基于CNKI引文数据库,对CSSCI数据库收录的17 275篇经济学期刊进行了系统分析。[结果/结论] 研究结果表明:学科期刊载文量下降现象需要引起足够的重视;篇幅影响因子与论文篇幅无关;论文篇幅与被引无关;关于论文篇幅与被引关系的研究方法有待改善;建议将载文量作为CSSCI评价指标。  相似文献   

13.
以哈尔滨工程大学船舶工程学院教师近3年发表的论文引文为统计源,采用引文分析法,从引文数量、引文类型、引文语种、引文年代以及高引期刊等进行统计分析,根据期刊馆藏资源建设中存在的问题,提出提高期刊资源保障率的设想。  相似文献   

14.
[目的/意义]旨在为新型学术评价指标的准确筛选、学者学术影响力提升和各级图书馆开展科研支持决策等创新服务提供参考。[方法/过程]量化了Altmetrics指标对引文量产生贡献的大小,选取综合学科大样本数据集,运用适合社交媒体平台的计数型数据类型的负二项回归模型进行拟合。[结果/结论]16个被调查的Altmetrics指标中,6个指标对引文量产生了显著影响。问答平台一个单位变化将增加引文量0.1945的变化,政策指标则贡献了引文量0.0226的提升。博客、谷歌社交平台、门德利等社交媒体平台上的分享有利于学术传播;而推特指标则使得论文学术影响力略有所降低,与众多小样本研究形成了鲜明的对比。  相似文献   

15.
郑继来  郑德俊  周露 《情报杂志》2012,31(8):74-78,97
引用认同是引文研究的新视角,是从引用者本身出发,包含引用认同和被引网络图两个方面.以22位普赖斯奖获得者(见表1)的2895篇论文、53405条引文为研究对象,借助Histcite、Bibexcel、CitespaceⅡ等科学计量和信息可视化工具,了解他们的学术社会网络关系,揭示了国际科学计量学领域的关键文献、权威期刊和关键词情况,为国内相关学者了解本领域的国际研宄现状提供参考.  相似文献   

16.
[目的/意义]有效融合引文网络中的引用关系和文本属性等多元数据,增强文献节点间的语义关联,从而为数据挖掘和知识发现等任务提供有力的支撑。[方法/过程]提出了一种引文网络的知识表示方法,先利用神经网络模型学习引文网络中的k阶邻近结构;然后使用doc2vec模型学习标题、摘要等文本属性;最后给出了基于向量共享的交叉学习机制用于多元数据融合。[结果/结论]通过面向干细胞领域的CNKI引文数据集的测试,在链路预测上取得了较好的性能,证明了方法的有效性和科学性。  相似文献   

17.
何星星  武夷山 《情报杂志》2012,31(8):98-102
传统期刊论文评价工作关注的是论文内部特征和引用情况,从新的视角提出以文献的利用数据(包括网页点击量、浏览量、下载量)及调整指标(点击下载率、下载引用率)来综合评价一篇文章的表现力,并利用《PLoS Biology》与F1000系统数据做了实证分析,证明了上述指标的可行性,其表现也优于被引这一单一指标.  相似文献   

18.
王晓芬  邓东宁  邹晓顺  肖夏 《现代情报》2010,30(10):153-154
文章介绍了一种新的适用于计算机的引文检索和引文分析的方法——关系矩阵法,这种方法能更快速更方便地进行引文分析和引文检索,并具有更强大的功能,例如计算文献的耦合单位。  相似文献   

19.
张玲玲  蔺梅芳 《现代情报》2019,39(1):169-177
本次研究在P指数基础上,提出了时间——引文分布下学者学术评价Py指数。具体而言,基于文献引文分布,结合文献被引频次阈值、文献被引半衰期阈值,构建时间——引文分布下的论文分区,即普通论文、潜力论文、热门论文、经典论文。根据4种分区论文影响力差异性,按照普通论文、潜力论文、热门论文、经典论文影响力递增原则,设计论文被引频次递增权值,提出Py公式。以CNKI平台2000-2017年图情领域核心论文被引频次前100位作者数据进行实证分析,讨论Py指数表现。结果表明:Py指数能从论文本身的价值与影响去反映学者的学术成就,凸显优质论文相比普通论文所带来的更强的学术肯定意义;Py指数区分度、灵敏度、公平公正性、有效性与科学性方面较H指数、P指数表现更佳。  相似文献   

20.
鞠秀芳 《现代情报》2018,38(11):14-17
真实性、准确性、直接性与完整性是引用参考文献的首要准则,然而种种研究表明,当前的研究论著中引而不注、过度引用、模糊标注甚至虚假引用等不当引用行为日渐增多,这极大地影响了科学研究领域的学术风气,给读者阅读、期刊审稿及成果评定等工作带来了许多不便。本文利用文本相似度算法建立期刊引文有效性识别方法,试图从海量期刊引文数据中识别出期刊引文的真实有效性。实验表明,本文的期刊引文有效性识别方法在引文有效性方面实现了较好的识别效果,可为虚假引文的识别工作提供可靠的依据,从而为编辑人员发现、修正虚假引用问题提供帮助,彰显科学研究的严谨务实精神。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号