共查询到10条相似文献,搜索用时 31 毫秒
1.
2.
引文网络中文献深度聚合方法与实证研究——以WOS数据库中XML研究论文为例 总被引:1,自引:1,他引:0
科学文献之间通过引用关系构成了特定研究主题的知识网络,其单向无回路的特征揭示了学科主题的知识结构和发展过程.本文以WOS数据库中XML研究论文所构成的引文网络为例,利用引文关系权重与文献节点权重确定核心文献,并在此基础上从阈值和权值“高地”两个角度对核心文献进行聚合.研究发现:文献核心程度的确定过程充分考虑了不同引用实质上的重要程度区别,据此计算得到的引文和文献节点权重能够准确反映文献的质量;阈值聚合能够迅速发现整个学科发展过程中最核心的文献和引文;权值“高地”聚合分析结果更为多样,并能弥补阈值聚合在揭示次重要子结构方面的不足,发现整个知识体系发展过程中丰富的研究维度. 相似文献
3.
基于C-value与TF-IDF的文献簇主题识别研究 总被引:1,自引:0,他引:1
引文分析是科技情报分析的一种重要方法和技术,特别是建立在共耦合和共被引基础上的引文聚类分析逐渐发展成为科技情报分析中最活跃的研究领域之一.引文聚类分析形成一系列由科技文献组成的文献簇,并不能直接体现出文献簇的主题,因此需要识别这些文献簇的内容特征.本文分析了引文分析中文献簇主题识别的典型方法及局限,提出了结合C-value和TF-IDF算法的文献簇主题识别方法.实验表明,该方法可以充分地利用C-value和TF-IDF算法的优点,对C-value和TF-IDF算法中不合理的地方予以了改进,从而可以更好地应用于引文分析中文献簇的主题识别. 相似文献
4.
计算机科学文献的老化速度 总被引:4,自引:0,他引:4
本文以计算机技术学科类具有代表性的10种期刊2001年发表的全部论文为统计对象,收集其引用文献进行该学科的文献老化研究。对该学科引文的时序分布、当年指标、最大引文年限、引文半衰期、普赖斯指数等文献老化量度指标进行统计分析。结果表明:该学科的中、外文文献最大引文年限分别为第3和第4年,引文半衰期为5.5年,普赖斯指数为45.8%,并提出分别以该学科中、外文文献发表后的11年和16年作为文献保存年限参考值,建议把该学科近5年内发表和出版的文献作为文献订购的时限。 相似文献
5.
林平 《大学图书情报学刊》2007,25(1):86-90
科学文献的相互引用关系是引文分析的主要依据.引文分析是以文献引用数据为基础,用以揭示其数量特征和规律的一种文献计量分析方法.作者对<大学图书情报学刊>1998年与2004年的引文数量进行了量化分析,指出了刊物在引文数量、引文文献类型、引文语种、引文主题、引文原始来源期刊的发展和变化情况,提出了值得重视的有关问题. 相似文献
6.
以Web of Science的艾滋病疫苗研究文献作为数据来源,利用引文分析可视化软件HistCite,找出代表艾滋病疫苗研究领域发展的重要文献,并分析文献之间引用与被引用关系和引用序列,获得引文编年图谱,梳理出艾滋病疫苗研究领域的发展规律和历史发展轨迹,为国内外相关领域的研究人员提供一定的参考。 相似文献
7.
8.
9.
[目的/意义] 概率主题模型算法在不断得到改进与扩展,本文对国内外已有的利用引文构建的主题模型进行研究,分析和对比不同模型的生成过程与算法,并探讨利用引文构建的主题模型在科技文本分析中的应用与可扩展的研究方向。[方法/过程] 通过Web of Science数据库和CNKI数据库获取国内外利用引文构建主题模型的相关文献,经人工判读后筛选出具有代表性的文献,对这些文献中利用引文构建的主题模型,从建模思想、生成过程、参数估计与推断算法等方面进行对比与分析。[结果/结论] 目前国内外利用引文构建的主题模型主要包括研究主题与引文分布的主题模型、研究被引与施引主题间关系的主题模型,以及基于引用内容的引用主题模型;主题模型中引入引文信息后,能够获得更完整的主题内容和特定主题下的重要文献,并可识别施引文献和被引文献之间主题间的关系及影响;已有的模型多集中在概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)和潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型基础上进行扩展。未来可扩展研究引入引用内容的主题模型、模型的性能优化和评价方法、模型的应用研究等。 相似文献