首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
[目的/意义]基于科技文献构建问题—方法矩阵,探索科技文献研究内容新颖性评估方法,辅助科技查新应用。[方法/过程]对科技文献内容进行信息抽取,提取研究问题和方法内容文本并构建问题—方法矩阵。利用LDA模型对科技文献采用的问题与方法进行分类,将科技文献在问题—方法矩阵中定位并可视化。通过设定阈值划分区域,确定待评估科技文献研究问题和方法所在区域,进行新颖性评估分析,并通过实验验证该方法的有效性。[结果/结论]提出的基于问题—方法矩阵的文献新颖性评估方法通过可视化方式不仅有利于辅助科技查新判断,还可服务于创新选题。[局限]基于科技文献的研究问题与方法信息抽取和新颖性评估计算的自动化方法有待进一步研究。  相似文献   

2.
尹莉 《情报探索》2020,(4):9-15
[目的/意义]旨在研究引文分析中引入情感分析后对论文排名的影响。[方法/过程]提出一种引文情感分析方法,确定引文文本中的情绪,并使用监督分类器为每个文本句分配一个分数来确定其情感倾向,利用C4.5决策树对引文的极性进行分类;提出一个考虑定量(引用次数)和定性(情感分析)因素的论文评价指数pc指数,并基于该指数对论文进行了排名。[结果/结论]C4.5决策树对引文的极性进行分类,获得了较为准确的结果;pc指数对朴素算法进行改进后获得了对被引论文的影响力新的排名,排名对于较小的语料库影响不大(只有4篇论文排名发生了变化),而对于更大的语料库,预计影响会更大。  相似文献   

3.
[目的/意义] 引文情感分析揭示施引文献对被引文献的褒义、贬义和中性的情感倾向性,解析文献之间深层语义关系,能够帮助更加准确地评价被引文献和作者。[方法/过程] 以自然语言处理领域文献的引文情感为数据集,利用引文中情感表达的引文标识位置指引和情感词汇等特征,采用支持向量机(SVM)构建引文情感的自动识别系统,探索生成更大规模数据的方法。[结果/结论] 实践应用证明,该系统特征的区分度较强,准确率达到93.4%,识别效果较好。引文情感的自动识别系统实用价值较强,拓宽了引文网络分析的研究方法和内容,能够完善论文评价体系。  相似文献   

4.
[目的/意义]探讨期刊论文被引频次离散系数与影响因子的关系有利于深化文献计量研究,对于学术期刊评价也具有积极意义。[方法/过程]以CSSCI经济学期刊为例,基于中国知网的引文数据库,采用回归分析研究了两者之间的关系。[结果/结论]论文质量差异是期刊论文被引频次离散系数差异的原因;期刊论文被引频次离散系数与影响因子负相关;期刊论文被引频次离散系数与影响因子之间呈U型曲线;条件成熟时可以将期刊论文被引频次离散系数作为期刊评价指标;对于其他学科期刊论文被引频次离散系数与影响因子的关系有待进一步研究。  相似文献   

5.
[目的/意义]设计了一种基于语义内容的论文创新性事前测度方法,揭示论文创新性与学术影响力之间的关系及其机理。[方法/过程]将单篇论文创新性分为新颖性和常规性两个特性;通过Word2Vec模型训练关键词向量,融合关键词语义计算论文新颖性及常规性;进一步结合统计回归分析方法分析了论文创新性对被引次数的影响。[结果/结论]以WoS收录的自然语言处理研究论文为对象进行分析,结果表明:(1)文章提出的论文新颖性和常规性的测度方法充分考虑了文本语义,在论文发表之初就可以获得其创新性评价结果,且创新性得分结果相对合理;(2)回归分析结果表明,科研论文越新颖其被引次数越少;(3)在新颖性相同的情况下,科研论文的常规性越高则被引次数越多,常规性对论文被引次数的影响程度相对于新颖性更强;(4)引文影响力更适用于高常规化科研领域的评价问题。  相似文献   

6.
目的 了解《生物化学与生物物理进展》发文、文献引用规律及该刊情报吸收能力、期刊论文的覆盖范围、科研人员合作现状及特点、发现生物化学与生物物理研究领域科研人员的文献需求特征,为该学科研究人员查阅文献和编辑部提高期刊质量提供参考。方法 以《生物化学与生物物理进展》2000~2004年被SCI-E收录的941篇论文为研究对象,采用文献计量学分析方法分别对期刊载文量、篇均引文数、作者发文数量、合作情况、高产作者、地区分布、高产机构、引文数量、引文年代、普赖斯指数、自引率、期刊互引、高频次被引期刊和论文被引等指标进行统计分析。结果 高产著者100人发文224篇(23.80%),高产机构20个发文447篇(47.50%),篇均引文量为14.31条,主要的引文类型为期刊(95.72%),普赖斯指数56.05%,自引率1.60%,被引用频次居前13位的期刊的文献引用量占总引用期刊文献量的35.26%,收录论文被引率24.65%,篇均被引次数为0.37。结论 期刊论文涉猎文献范围较广,作者分布在全国24个省市区以及欧亚四国,合作率高。该刊拥有一支实力雄厚、对刊物影响较大、造诣较深的活跃高产作者群,中国科学院生物物理研究所在国内生物化学与生物物理研究领域处于领先地位。论文引文类型以期刊为主,研究引用文献比较新颖,论文被引率和篇均被引次数有待进一步提高。  相似文献   

7.
[目的/意义] 在信息检索、科技论文评价和知识结构演化方面,引文分析都起着至关重要的作用。随着格式化全文数据库的出现,引文分析迈入了4.0时代——全文引文分析阶段。但是,目前还没有中文的格式化全文数据库,这极大地制约了全文引文分析在我国科技文献中的研究和应用。[方法/过程] 在本文中我们提出建立高效的中文全文引文分析依赖的数据集和检索平台的方法,主要包括:1)提出了基于规则和SVM分类方法的论文元数据和引用提取方法;2)提出基于Spark平台的实现高效引文内容分析标准化数据集生成方法;3)提出建立引用内容的科技文献检索平台。[结果/结论] 引文内容分析标准化数据集的建立将全面提升全文引文分析在我国科技领域中的研究效能,提高科技文献查找精度。  相似文献   

8.
我国科技人员自引现象分析   总被引:3,自引:0,他引:3  
崔红 《情报理论与实践》1998,21(3):153-154,176
0引言 自引现象是科学著文过程中比较普遍的现象,R.Tagliacozzo和A.Dimitroff分别于1977年和1995年研究了自然科学文献和图书情报学文献的自引现象[1,2].Tagliacozzo的研究表明植物生理学论文自引率为16.6%,神经生理学论文的自引率为17.5%,并且发现自引引文"年龄更青".他认为自引现象与合著者多少、著文作者的文献书目内容多少或论文量是无关的.  相似文献   

9.
李纲  徐健  余辉  马亚雪 《现代情报》2017,37(9):171-176
[目的/意义]基于被引片段识别的科技文摘生成是文献计量学、信息检索和自然语言处理等领域共同关注的研究问题。通过梳理相关成果,可为后续研究提供借鉴。[方法/过程]本文首先介绍被引片段概念,进而从被引片段识别与分类、文摘生成与评价等步骤对相关研究进行综述。[结果/结论]当前被引片段识别总体上可以分为机器学习和检索两类,分面判定还存在标准不一致的问题,摘要生成与评估方法相关研究较欠缺。  相似文献   

10.
[目的/意义]科技论文是学术界传递和交流知识的重要方式。科技论文评审是对科技论文承载的知识的价值衡量,高效准确的科技论文评审分类预测可以快速判断论文价值,加速有价值的知识传播进程。[方法/过程]本文讨论开放同行评审中自动评审分类方法,利用科技论文语义信息和开放同行评审中的专家评分,分别构建基于传统机器学习和基于深度学习的科技论文文本表示及分类模型,提供自动评审分类结果。[结果/结论]实验结果表明,融合语义信息和评分信息的评审分类模型比单纯依靠评分均值进行评审判断更为有效,以评分+均值为评分信息输入、基于SCIBERT的质量评审分类模型准确率最高,达到90.17%。本文提出的自动评审分类方法具有可用性,准确率较高,可以辅助期刊编辑快速筛选有潜力的科技论文,促进科技论文智能评审的发展。  相似文献   

11.
[目的/意义]探索不同社会科学学科间差异,支持学科建设、科技检索服务,进一步完善文献学科的分类体系。[方法/过程]基于多种深度学习模型和预训练语言模型构建社会科学文献学科分类器,利用CSSCI目录中的20多个一级学科中近350万篇文献构成的数据集进行实验;利用Sentence-BERT输出摘要句子向量并进行层次聚类,根据聚类结果划分学科组,并计算模型对于不同学科组的分类性能以缓和学科交叉的影响;利用模糊准确性指标输出模型对每条记录输出的前N个高概率学科以弥补原有学科分类的局限性。[结果/结论]在“摘要+标题”上使用深度预训练语言模型取得最佳性能;基于层次聚类所得的学科组进行的分类较单一学科性能有所提升;模型的模糊准确性在N=3时能够达到96%。[局限]未考虑从全文文本上获取更丰富的文献学科特征进行自动分类。  相似文献   

12.
[目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表示模型及其自动化抽取方法,对学者快速阅读和机器自动化处理具有重要意义。[方法/过程]文章在分析科技文献非结构化摘要结构的基础上,结合知识元本体理论,构建了一个面向科技文献非结构化摘要的知识元本体模型。通过分析非结构化摘要的写作特征,将文本按句子级划分为目的、方法、结果或结论三个要素,统计每个要素句中的线索词、句型和位置,建立相关规则库,根据本体模型和规则库构建相关抽取算法。最后,下载《计算机技术与发展》中的部分文献进行实验。[结果/结论]通过增加句型集和线索词集,完善了非结构化摘要的要素,构建了非结构化摘要知识元本体模型。实验结果表明,根据本文提出的模型能有效地对非结构化摘要中的知识元进行抽取。[局限]实验的不足之处是需要人工对摘要中的句型和线索词进行归纳总结。  相似文献   

13.
[目的/意义]分析科技创新路径识别研究中用到的主要研究方法与开源工具,提出利用引文内容挖掘实现科技创新路径识别方法及开源工具。[方法/过程]首先,基于引文分析、结构洞分析、凝聚子群分析、文本内容挖掘、引文内容挖掘等不同角度分析了科技创新路径识别的主要方法;其次,从数据源、文本格式、挖掘内容、处理能力等方面阐述了用于实现引文内容挖掘的科技创新路径识别的3个开源工具:Mallet、Knime、NLTK;最后,分析了实现科技创新路径可视化的5个开源工具:Pajek、Ucinet、Gephi、D3.js、VOSViewer。[结果/结论]通过研究发现,利用开源工具深入挖掘引文内容中蕴含的丰富语义信息,识别不同引用动机,进而进行可视化展示可以有效的实现科技创新路径表达。  相似文献   

14.
[目的/意义]针对被引频次指标在学术论文评价中的局限性,提出基于多维度引用特征的学术论文评价方法,提高引文指标在单篇论文评价中的可靠性。[方法/过程]通过被引频次标准化消除学科、时间等因素的影响,作为频次指标;通过引用主体的重要性、引用时间跨度、引用强度、引用位置、引用情感、主题相似度6个维度的引用特征,区分不同引用中被引文献对施引文献的作用,作为特征权重;将频次指标和特征权重相结合,对学术论文进行定量评价。[结果/结论]改进基于引用的学术论文评价方法,有效解决被引频次指标对所有引用同等对待的问题。该方法的评价结果比被引频次指标更加合理,还能更细致地剖析论文的被引特征。  相似文献   

15.
[目的/意义]随着我国关于政策文本研究文献的日益增多,对国内CSSCI期刊发表的相关研究文献进行综合述评有助于梳理政策文本分析研究的脉络,为未来政策文本研究的深入提供参考。[方法/过程]基于文献计量学和可视化分析视角,绘制我国政策文本研究的作者共现图谱、机构共现图谱、关键词共现图谱、关键词聚类图谱、关键词突变图谱等。[结果/结论]可视化地呈现了我国政策文本研究中具有影响力的作者及科研机构间的合作情况,通过分析关键词共现、聚类、突变情况以揭示政策文本研究发展脉络,并对研究方法、研究视角与研究领域进行总结。  相似文献   

16.
科技政策研究代表人物与核心文献可视化网络   总被引:2,自引:0,他引:2  
栾春娟  侯海燕 《科学学研究》2008,26(6):1164-1167
 引文计量方法常被用来确定某一研究领域的代表人物与核心文献。以国际科学技术政策研究权威期刊《科研政策》(Research Policy)的全部引文数据作为样本,通过作者共被引分析与文献共被引分析,确定了国际科技政策研究领域的代表人物与核心文献;并在此基础上,利用信息可视化技术,绘制出科技政策研究领域代表人物与核心文献的可视化网络,为科技政策研究者提供重要参考。  相似文献   

17.
张毅  李欣 《情报科学》2019,37(11):169-177
【目的/意义】将人工智能技术与可视化技术相结合,解析文章题名与摘要中包含的隐藏信息,为探索我国 图书情报领域的研究历史与现状提供全新研究视角。【方法/过程】从CNKI数据库中下载CSSCI来源期刊中图书情 报学领域的全部文章元数据148 956条,利用自然语言处理技术抽取题名与摘要中的标签、分类以及情感倾向,通 过统计、聚类、神经网络预测以及知识图谱等方法,绘制期刊下载与被引关系图、构建影响文献被引因素模型、研究 热点与情感倾向迁移图以及高质量文章的知识图谱等。【结果/结论】揭示了1957-2018年图书情报领域文献被引与 下载的关系,挖掘文献被引的影响因素,找出研究热点的变迁演化以及高被引文献的特征。  相似文献   

18.
刘雅娟  王岩 《科研管理》2000,21(1):93-98
近年来,在基础研究评估的诸多指标体系中,无一例外地引进了文献计量学的方法,其中论文、引文和期刊影响因子又被作为重要指标考虑因子之一。高影响因子的期刊是由于有一定数量的高质量论文支撑的结果,正是这些高质量的论文,才可能产生高水平的期刊,亦即期刊影响因子高。同一学科领域内高水平的期刊一定有多于一般水平期刊的高质量论文。引文是衡量论文影响力的重要因子之一。尽管引文情况复杂,有自引、他引、正引、反引、大段引用,点到而已;并且受学科、期刊数、从事人员多少等影响,也还有创新被认识等问题,但引文的重要性是客观存在的。  相似文献   

19.
20引文位置(Citation location) 受引论文在施引文献中出现的地方称为引文位置(CL). 文献计量学家可能会通过施引文献的说明性书面文字,例如:前言、研究方法、结果与讨论和结论等来划分引文的位置,或者通过直接把施引文献分成次序性部分,例如1,2,3,……等部分,来确定引文的位置.Cano于1989年在一篇讨论引证行为的论文中,首先研究了出现在文献开头、中间和结尾的引文.王崇德在1982年对我国科学院化学学部委员(今天的院士)论文的引证论文进行研究,发现他们论文的受引文献,主要出现在"文献评述"和"理论部分".  相似文献   

20.
[目的/意义]分析Altmetrics指标与引文量间的相关性,为进一步完善国内科研成果评价体系提供借鉴,探寻影响文献社交媒体影响力的主要因子。[方法/过程]选取Web of Science平台上Library&Information Science(LIS)学科分类下的51321篇期刊论文,采用相关性分析、因子分析、描述性统计等方法,分别探寻Altmetrics指标与引文量、Altmetrics指标之间的相关性,对比不同时段与全时段文献、高被引文献与全文献在相关性测度时的差异,并提取出3个能最佳解释Altmetrics影响力的共性因子。[结果/结论]WoS被引量和Scopus被引量显著相关。从整体来看,被引频次与Altmetrics指标间相关性较弱。从不同时间阶段来看,以2010年“Altmetrics”概念提出的元年为节点,前后两个时间阶段的Altmetrics指标值及其相关性确实发生了显著变化。此外,高被引文献的被引量与Altmetrics指标间的相关性普遍加强。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号