首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 468 毫秒
1.
尹莉 《情报探索》2020,(4):9-15
[目的/意义]旨在研究引文分析中引入情感分析后对论文排名的影响。[方法/过程]提出一种引文情感分析方法,确定引文文本中的情绪,并使用监督分类器为每个文本句分配一个分数来确定其情感倾向,利用C4.5决策树对引文的极性进行分类;提出一个考虑定量(引用次数)和定性(情感分析)因素的论文评价指数pc指数,并基于该指数对论文进行了排名。[结果/结论]C4.5决策树对引文的极性进行分类,获得了较为准确的结果;pc指数对朴素算法进行改进后获得了对被引论文的影响力新的排名,排名对于较小的语料库影响不大(只有4篇论文排名发生了变化),而对于更大的语料库,预计影响会更大。  相似文献   

2.
研究主要针对PageRank只考虑链接关系,而不考虑相关性的缺点进行了一些改进,把Web数据挖掘技术的内容挖掘应用到PageRank算法中,基于超链接文本和内容与主题的相关性,提出了PageRank算法的优化算法,并通过实验仿真,实验结果表明改进后的方法对提高更高相关性的网页的排名是有效的,符合人们的期望。  相似文献   

3.
[目的/意义]针对被引频次指标在学术论文评价中的局限性,提出基于多维度引用特征的学术论文评价方法,提高引文指标在单篇论文评价中的可靠性。[方法/过程]通过被引频次标准化消除学科、时间等因素的影响,作为频次指标;通过引用主体的重要性、引用时间跨度、引用强度、引用位置、引用情感、主题相似度6个维度的引用特征,区分不同引用中被引文献对施引文献的作用,作为特征权重;将频次指标和特征权重相结合,对学术论文进行定量评价。[结果/结论]改进基于引用的学术论文评价方法,有效解决被引频次指标对所有引用同等对待的问题。该方法的评价结果比被引频次指标更加合理,还能更细致地剖析论文的被引特征。  相似文献   

4.
[目的/意义]科学准确识别关键共性技术对企业和国家来说都是至关重要的战略议题。[方法/过程]文章提出了一种基于专利文献分析的关键共性技术识别框架,运用文本挖掘和技术演化分析方法,获取特定领域的关键共性技术。首先,使用Viterbi算法识别专利文献中的专业术语,通过LDA算法捕捉专利文献中的技术主题聚类;其次,通过将技术主题的共类特征数值化,作为共性程度的度量;随后,将技术主题节点在技术演化转移网络中的关键程度作为技术关键性的表征,并使用PageRank算法衡量技术主题的关键性。最后,以机器人及数控机床技术为例,验证了该方法的可行性和有效性。[结果/结论]该方法可实现高效、准确的关键共性技术识别,为国家制定创新扶持政策提供支撑。[局限]研究仍需扩大科技文献的收集范围,以实现更全面的关键共性技术识别。  相似文献   

5.
[目的/意义]针对海量科技文献新颖性评估需求,从科技论文研究问题与方法视角出发,利用科技论文摘要与相关引文文本,构建科技论文的评述画像,用于辅助科技论文新颖性评估。[方法/过程]提出一种综合“自评+他评”内容的科技论文评述画像方法。该方法基于期刊论文结构化摘要文本解析问题和方法等句子,以单篇期刊论文为目标文献,将施引文献中引文句子作为引文数据集并分类后,可视化呈现科技论文的自评和他评内容。目前科技论文评述画像分为两种:一是按照引用问题与方法等分类并可视化,二是按照自引他引及情感分析进行分类可视化。[结论/结果]构建的科技论文评述画像能够从论文作者与引文作者的双重视角综合展示目标论文的研究成果,结合自引他引及情感分析信息可有效辅助科技论文新颖性评估。  相似文献   

6.
刘爱琴  安婷 《现代情报》2019,39(8):52-58
[目的/意义]面向非相关文献的知识关联能够促进新知识的产生,为科学研究提供了一种有效的辅助手段。[方法/过程]本文以《中国分类主题词表》为主题词受控词表,首先对文献摘要进行中文分词处理并提取主题词,利用计量分析技术和聚类技术分析文献间特征的相似、相异水平,然后基于该系统为用户检索并利用用TOP-K算法反馈用户精确结果。[结果/结论]设计了面向非相关文献的知识关联检索系统,从更细的粒度层面揭示文献之间的知识关联,为用户提供高质量的服务。  相似文献   

7.
[目的/意义]知识图谱作为近年来大数据、人工智能技术飞速发展背景下出现的知识探索、推理发现的新兴技术,对专利检索新业务形态开展,提升业务效率减轻人工负担有着广阔的应用前景。[方法/过程]通过对知识图谱构建流程、技术架构与专利文献业务特点分析结合,对知识图谱语义模型在低质量专利检索和可视化等场景应用进行了探讨。[结果/结论]知识图谱在专利检索场景中适用性较强,相关技术环境/工具成熟,同时其垂直领域多知识体系特点,其语义模型构建还需要高质量文献和专家进行协助和迭代。  相似文献   

8.
[目的 /意义]分析我国科技报告的研究热点和发展方向,以促进我国科技报告相关工作的进一步发展。[方法 /过程]以中国知网《中国学术期刊(网络版)》为数据源,以"科技报告"为关键词,题名作为检索条件,利用文献计量分析法,结合相关分析软件,对我国科技报告相关文献从期刊来源、重点学科、高频作者以及关键词共现等方面进行了可视化计量分析。[结果 /结论 ]我国科技报告主要研究热点为制度建设、检索和体系建设,主要研究单位为科技信息(情报)机构。  相似文献   

9.
[目的/意义]随着网络和社交媒体的发展,网络"意见领袖"在网络社区的信息传播和交流中发挥着越来越重要的作用,在社会生活的各个方面对网络民意产生巨大的影响。因此,识别网络"意见领袖",掌握其特征和规律成为了网络信息传播研究的重要方面。[方法/过程]在PageRank思想的基础上,利用文本的TF-IDF计算网络社区用户节点的连接强度,以此改进PageRank算法,提出一种LeaderRank方法用来评价网络社区用户节点的重要度,并结合其他指标及BP神经网络进行"意见领袖"的发现实验以及进一步的数据挖掘工作。[结果/结论]实验结果表明,该方法相较于神经网络具有更高的识别率,该方法可以灵活配合其他指标和方法使用,具有更好的适用性、扩展性和稳定性。  相似文献   

10.
通过引文网络的结构特征,有效地识别科学文献的价值并建立某种序关系,为科学评价提供了有价值的参考,也丰富了科学评价的方法。针对传统PageRank算法在引文网络中得到的结果倾向于发表时间久的文献,而不利于发表时间较短但具有学术影响潜力的文献,为了消除这种“不公平”性,将引文间隔时间引入算法中。图书馆与情报学领域的实证研究说明改进算法有效地优化了评价的结果,相对于传统PageRank算法更有利于发现具有潜力的新发表的文献。  相似文献   

11.
[目的/意义]研究“睡美人”文献的识别方法,对尽早发现重要科技成就及其发明人、加快科技成果转化以及完善学术评价方法等均具有重要意义。[方法/过程]针对高校学术论文成果评价这一特定场景,提出“先客观指标粗筛、后多维参数细选”的研究思路,组合使用K值算法和三指标法,对东北大学发表于Web of Science核心合集的论文样本集进行了“睡美人”文献挖掘的实证研究。[结果/结论]该方法共识别出12篇“睡美人”文献,并对其被引特征、期刊特征、睡眠特征、内容特征等因素进行了分析。实获数据处理结果表明了该方法的有效性,相关研究方法和结果可对东北大学学术论文评价提供重要参考。  相似文献   

12.
[目的/意义]研究学术文献被撤销的规律和特征对于客观认识撤稿现象、净化学术环境、加强科研诚信建设具有重要价值。当前对于撤稿的研究集中于期刊论文,很少关注会议文献。[方法/过程]以撤稿观察数据库中7579篇被撤销会议文献为研究对象,分析总结被撤销文献的时间、来源和学科分布特征以及被撤销原因和时滞。[结果/结论]会议文献撤稿与期刊论文撤稿在原因和时滞上存在重要差异,中国是会议文献撤稿的“重灾区”。研究认为,科研人员、审稿人、出版商、科研管理机构亟需共同努力,加强对于学术会议的质量控制,提高相关主体行为的规范性。  相似文献   

13.
搜索引擎是互联网资源搜索的入口,搜索的快捷性、准确性是搜索引擎的核心竞争力,如何提高竞争力是业内企业的工作重点。已有的搜索引擎算法中,最具代表性的就是PageRank算法,针对该算法的改进方法也有很多,但效果并不很理想。分析了已有PageRank改进方法的不足,立足于用户搜索行为信息挖掘,采用时序关联分析方法,将关联比例作为权值加入到PageRank计算公式中,改变平均分配权威值的计算方法,从而得到了改进的PageRank算法——TCPR算法,使得搜索排序结果更符合用户的信息需求。  相似文献   

14.
The paper attempts to provide an alternative method for measuring the importance of scientific papers based on the Google’s PageRank. The method is a meaningful extension of the common integer counting of citations and is then experimented for bringing PageRank to the citation analysis in a large citation network. It offers a more integrated picture of the publications’ influence in a specific field. We firstly calculate the PageRanks of scientific papers. The distributional characteristics and comparison with the traditionally used number of citations are then analyzed in detail. Furthermore, the PageRank is implemented in the evaluation of research influence for several countries in the field of Biochemistry and Molecular Biology during the time period of 2000–2005. Finally, some advantages of bringing PageRank to the citation analysis are concluded.  相似文献   

15.
同行评议是当前对科研项目水平进行科学评价的主要方式之一,然而评议过程中专家评审能力的差别将会对科研项目评审结果产生影响。为此,本文提出了一种基于PageRank算法的评审专家信誉度度量方法,该方法首先利用高斯分布函数计算评审专家的评审能力,然后利用PageRank迭代算法对评审专家的信誉度进行求解,最后通过引入时间因子对评审专家的信誉度进行度量。基于同行评议真实数据集上的实验结果验证了本文提出方法的有效性,该方法将为科研项目评审及专家遴选提供有益参考。  相似文献   

16.
尹莉 《情报探索》2014,(11):13-15
介绍了一种新的基于接近中心度的排名算法Top Rank(k),并将其与已有的Page Rank算法进行分析比较,说明了它们各自的特点。通过实证分析,论证了在确定条件下,Top Rank(k)算法比Page Rank算法更有效,突出表现为节省大量时间。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号