共查询到20条相似文献,搜索用时 614 毫秒
1.
相关反馈是一种根据用户或系统的相关性判断重构初始检索提问的方法,已被证明可以有效地改进检索效果.具体到学术文献,其引用关系表征了文献内容上的相关性,因而可以为相关反馈提供有价值的辅助信息.本文提出了一种基于引用上下文、文献同被引和文献耦合的相关反馈改进算法.该算法的基本思想包括:利用学术文献的引用上下文信息扩充词包模型(bags of words)进行文本表示;在相关文献判断阶段利用相关文献在引文网络中与其他文献的同被引强度和耦合强度扩充相关文献集合;结合基于聚类的相关反馈思想抽取查询扩展项.实验证明该算法提高了相关反馈效果.此外,相关分析的结果表明文献同被引以及文献耦合强度与文献内容相似度具有显著的相关性. 相似文献
2.
3.
4.
高被引论文与“睡美人”论文引用曲线及影响因素研究 总被引:2,自引:0,他引:2
[目的/意义]通过对潜在“睡美人”论文的引用分布分析,提炼其特征,以期为“睡美人”论文的预判研究提供思路。[方法/过程]采用引用曲线这一更为直观的反映论文引用分布的方法,以“天文学和天体物理”这一领域为例,构建其10的高被引论文、“睡美人”论文的10-20年被引用数据并进行引文分布的对比分析。[结果/结论]研究发现两类文献的引用曲线模式及特点——高被引论文的持续增长型、显峰型、双峰型、振荡型,“睡美人”论文的持续增长型、显峰型、双峰型、振荡型、稳定型等被引用曲线模式;针对施引文献、研究主题演化方向探讨了各模式引用曲线形成的相关因素,发现两类文献达到引用高峰的时间存在差异。 相似文献
5.
6.
参考文献引用分类标注与科技期刊和论文的评价 总被引:6,自引:0,他引:6
为了规范参考文献的引用,减小引文问题对科技期刊和论文评价所造成的影响,使得以引文为基础的各种分析方法在科技期刊和论文的评价中更加合理、更加科学,提出了参考文献引用分类标注的概念.依据被引文献对论文作用的不同和引用意义的差别,将论文所引用参考文献分为正相关性引用类、负相关性引用类和平行相关性引用类,建议在论文写作中标注出分类的标志,编辑和审稿人在编审时可据此核实参考文献引用的正确性.在论文评价时分类进行检索统计,有利于进一步规范引文分析的各项指标,变笼统的引文分析为细化的据类分析评价,使引文分析评价体系更加科学、更加可靠. 相似文献
7.
[目的/意义] 为了解我国标准文献的学术影响力, 以为标准文献的利用提供参考, 从标准文献的角度出发, 分析其被引证特征。[方法/过程] 选择中国引文数据库中1994-2013年标准类引文数据, 采用文献计量的方法, 从标准引文总量、篇均标准引文量等方面分析标准文献的总体被引用情况和学科分布情况。[结果/结论] 标准引文量和篇均标准引文量占引文总量比例很小;各学科标准引文量差异较大, 工科和医科对标准文献的引用较多;标准引文数量和被引频次较高的专题集中于自然科学;大部分社会学科标准引用量为零;标准引文的半衰期整体上较长, 老化速度较慢。 相似文献
8.
选择中外档案学领域典型期刊近十年的数据,从引文量、引文类型、高被引期刊、高被引作者、引用半衰期等方面比较分析国内外学者引证行为,得出:国内引文总量高于国外,但附引率和篇均引文量低于国外,外文在国内档案学论文中的引用越来越多;国内引文数量集中区间长于国外,但高引文量的论文篇数低于国外;期刊论文、图书、史料和网络文献是档案学学者主要的引用来源,网络文献的引用越来越多;国内档案学高被引文献大多为专著,国外则多为期刊论文;《档案学通讯》和Restaurator分别是国内外档案学者引用最多的期刊;冯惠玲和Neevel JG分别是国内外被引频次最高的档案学者;国内档案学者倾向于引用新文献,国外档案学引文半衰期比国内长。 相似文献
9.
K-means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题.本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K-means改进算法.该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被引矩阵,然后基于同被引矩阵进行层次聚类.算法记录每次迭代过程中被聚为一类的学术文献间的距离以及两次迭代间的距离差,当两次迭代的距离差取得最大值时取其聚类数作为第二步K-means算法的K值,并且将此时的类中心作为第二步K-means算法的初始聚类中心.第二步聚类则依据文献内容实现K-means算法.实验通过与经典K-means算法和基于凝聚层次聚类算法的改进K-means算法的对比,证明了本文提出的改进的K-means算法具备更优的聚类效果. 相似文献
10.
林业类科技核心期刊文献引用研究 总被引:1,自引:0,他引:1
为全面、深入分析文献引用对林业类科技核心期刊质量的影响,通过资料分析,采用数理统计方法,选择同一层次的5家林业类科技核心期刊,对其2014年全年的参考文献的引用情况(篇均引文量、引文类型、引文语种、引文的时效性、期刊自引率)进行统计和分析.结果表明:5家期刊参考文献的引用情况不尽相同,篇均引文量需要提高;参考文献来源类型主要是期刊;语种以中文为主,其次是英文,其他语种引用比较少;参考文献时效性和期刊自引率控制较为合理,但有提升空间.通过统计数据分析,希望期刊编辑重视刊发文章引文的各项指标,从而提高刊发文章质量. 相似文献
11.
12.
被引内容指的是被引用文献在引用文献中被引述的具体内容。Small曾经指出被引内容的研究价值,但迄今为止,在文献计量学领域被引内容分析仍然没有广泛展开。针对这一情况,提出一种分析领域知识的新方法———基于文本聚类的被引内容分析法,这种方法可以在一定程度上解决引文分析存在的问题。以第二语言教育为分析领域,研究结果证明该方法的可行性以及被引内容的研究价值。 相似文献
13.
14.
以CNKI真实数据集为研究对象,通过共引文献统计功能得出一个文献耦合网络。首先采用形式概念分析的方法构建耦合文献形式背景,其次对耦合网络中的知识载体与知识属性剥离解析,而后探寻知识概念的偏序关系,进而建立耦合文献概念格。经由知识聚类、关联规则挖掘等一系列格上作业,可视化地勾勒出文献耦合网络的知识结构以及知识属性之间的组分异质性规律,探索概念格技术与引文分析方法的融合机制。 相似文献
15.
16.
2001~2006年国际情报学研究的引文分析 总被引:1,自引:0,他引:1
目的:了解当前国际情报学研究现状,总结研究热点,提供参考信息。方法:采用引文分析方法,对国外6种情报学核心期刊2001~2006年发表的学术论文进行调查分析,并用SPSS对高频被引文献进行同被引聚类分析。根据各个类中的文献内容分析当前研究的热点。结果:检得SSCI数据库中相关文献2320篇,其参考文献出现频次高于30次的论文47篇。高被引论文聚类分析树图分6类。结论:当前情报学研究热点主要集中于六个方面:网络信息资源评价、文献及作者同被引分析、信息组织处理、用户信息检索行为研究、情报学在医学领域的应用及基本理论阐述。 相似文献
17.
科学知识借助引用关系发生动态扩散,客观记录科学发展与演化的轨迹。由于知识之间存在千丝万缕的联系,以孤立的观点看待科学知识的影响与价值往往得到的是片面的感观。本文从联系的视角观察科学知识产出,尝试通过被引、引用、文献耦合与共被引等文献关系为单篇论著构建引文扩散网络,探讨"文献嵌入网络"的概念、测度方式及其在引文扩散过程中起到的特殊作用。案例分析显示,科学知识的形成相伴于科学知识网络的发展,同时也受到这个网络的影响:科学知识向科学领域的扩散,遵循从核心领域向周边领域的扩散模式;施引文献可以揭示目标文献中没有显式呈现的信息;四种文献关系之间可能存在相当程度的重合,引文扩散过程显示出知识的"黏滞性"与非常明显的"小世界"特征。对科学产出的扩散网络进行量化有助于为全面评价其价值提供更多客观依据。 相似文献
18.
《中华儿科杂志》未被引文章分析 总被引:7,自引:2,他引:5
将<中华儿科杂志>2005年全年发表的353篇论文逐一在清华同方引文数据库检索(检索日期截至2007年10月7日),其中40.5%的文章从未被引用过.诊断标准类文章均被引用,是刊载文章中唯一100%被引用的栏目;论著类文章未被引比例较低(15.4%);15篇述评、专论类文章中4篇未被引用(26.7%),其中2篇外籍专家述评稿件均未被引用;病例报告、临床病例讨论、临床经验交流栏目文章未被gl用率分别为87.0%、80.0%、29.3%;答疑、争鸣、讨论类文章未被引比例较高(80.0%).通过对未被引文章的深入剖析,旨在为国内医学期刊编辑工作实践提供依据. 相似文献
19.
当年高被引论文的主题词链聚类分析及其在情报预测中的应用 总被引:5,自引:1,他引:4
本文利用《科学引文索引》光盘数据寻找出某一专题文献中发表当年即被引用的论文,对这些论文两两比较它们之间拥有的相同主题词数目,以此数据为依据对这些当年高被引论文进行聚类分析。将这一结果与同年及翌年的高校引论文同披引聚类分析的结果相比较,探索将当年高被引论文的主题词链聚类分析应用于情报预测中的可能性。 相似文献
20.
定义和比较“引文”和“引用”两个紧密相关而又相互独立的概念,并基于Journal of Informetrics(JOI)期刊中的论文数据进行相关的实证分析。通过从JOI期刊全文数据中识别出在正文中出现的引用信息,统计文章中引用个数的分布情况,计算引用个数与引文篇数之间的相关系数,分析引用和引文之间的多对多关系,并提出一种新的加权的计算引文总被引次数的方法。结果表明,这种方法可以更早地识别出最新发表的高被引论文,因此在科学预见和科学评价方面具有重要的应用价值和前景。 相似文献