首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 614 毫秒
1.
相关反馈是一种根据用户或系统的相关性判断重构初始检索提问的方法,已被证明可以有效地改进检索效果.具体到学术文献,其引用关系表征了文献内容上的相关性,因而可以为相关反馈提供有价值的辅助信息.本文提出了一种基于引用上下文、文献同被引和文献耦合的相关反馈改进算法.该算法的基本思想包括:利用学术文献的引用上下文信息扩充词包模型(bags of words)进行文本表示;在相关文献判断阶段利用相关文献在引文网络中与其他文献的同被引强度和耦合强度扩充相关文献集合;结合基于聚类的相关反馈思想抽取查询扩展项.实验证明该算法提高了相关反馈效果.此外,相关分析的结果表明文献同被引以及文献耦合强度与文献内容相似度具有显著的相关性.  相似文献   

2.
同被引聚类与引用耦合聚类是两种常用的文献聚类方法,本文从聚类的时效性和实际可操作性、聚类结果的完整性和稳定性、聚类原理与专利法理逻辑和创新协同效应的契合性等方面对两种方法进行对比分析,发现引用耦合聚类方法在揭示专利间的相似性方面更具优势,同被引聚类方法则更适用于发现基础专利和揭示技术演化规律。两者若结合使用,则能在解决实际问题的过程中实现优势互补。
  相似文献   

3.
三、判断1、情报是知识。2、情报学与图书馆学其实是同一门学问。3、零次情报是指科研和生产活动中未经记录整理的最新知识。4、布氏定律是一个粗浅的经验定律。5、引文耦合与同被引反映的都是两篇引用文献之间的关系。6、情报检索的含义是图书馆文献检索的同义词.  相似文献   

4.
高被引论文与“睡美人”论文引用曲线及影响因素研究   总被引:2,自引:0,他引:2  
[目的/意义]通过对潜在“睡美人”论文的引用分布分析,提炼其特征,以期为“睡美人”论文的预判研究提供思路。[方法/过程]采用引用曲线这一更为直观的反映论文引用分布的方法,以“天文学和天体物理”这一领域为例,构建其10的高被引论文、“睡美人”论文的10-20年被引用数据并进行引文分布的对比分析。[结果/结论]研究发现两类文献的引用曲线模式及特点——高被引论文的持续增长型、显峰型、双峰型、振荡型,“睡美人”论文的持续增长型、显峰型、双峰型、振荡型、稳定型等被引用曲线模式;针对施引文献、研究主题演化方向探讨了各模式引用曲线形成的相关因素,发现两类文献达到引用高峰的时间存在差异。  相似文献   

5.
介绍注疏文献的引用特点,并对注疏文献的引用情况进行分类。分析注疏文献引文分析的流程,提出利用学科本体和XML表示的注疏文献,解决引文分析中的难点。通过对《十三经注疏》中各部注疏文献之间的耦合分析,以及被引文献的同被引分析,尝试对古籍文献的影响力进行评估。  相似文献   

6.
参考文献引用分类标注与科技期刊和论文的评价   总被引:6,自引:0,他引:6  
董建军 《编辑学报》2006,18(6):406-409
为了规范参考文献的引用,减小引文问题对科技期刊和论文评价所造成的影响,使得以引文为基础的各种分析方法在科技期刊和论文的评价中更加合理、更加科学,提出了参考文献引用分类标注的概念.依据被引文献对论文作用的不同和引用意义的差别,将论文所引用参考文献分为正相关性引用类、负相关性引用类和平行相关性引用类,建议在论文写作中标注出分类的标志,编辑和审稿人在编审时可据此核实参考文献引用的正确性.在论文评价时分类进行检索统计,有利于进一步规范引文分析的各项指标,变笼统的引文分析为细化的据类分析评价,使引文分析评价体系更加科学、更加可靠.  相似文献   

7.
[目的/意义] 为了解我国标准文献的学术影响力, 以为标准文献的利用提供参考, 从标准文献的角度出发, 分析其被引证特征。[方法/过程] 选择中国引文数据库中1994-2013年标准类引文数据, 采用文献计量的方法, 从标准引文总量、篇均标准引文量等方面分析标准文献的总体被引用情况和学科分布情况。[结果/结论] 标准引文量和篇均标准引文量占引文总量比例很小;各学科标准引文量差异较大, 工科和医科对标准文献的引用较多;标准引文数量和被引频次较高的专题集中于自然科学;大部分社会学科标准引用量为零;标准引文的半衰期整体上较长, 老化速度较慢。  相似文献   

8.
选择中外档案学领域典型期刊近十年的数据,从引文量、引文类型、高被引期刊、高被引作者、引用半衰期等方面比较分析国内外学者引证行为,得出:国内引文总量高于国外,但附引率和篇均引文量低于国外,外文在国内档案学论文中的引用越来越多;国内引文数量集中区间长于国外,但高引文量的论文篇数低于国外;期刊论文、图书、史料和网络文献是档案学学者主要的引用来源,网络文献的引用越来越多;国内档案学高被引文献大多为专著,国外则多为期刊论文;《档案学通讯》和Restaurator分别是国内外档案学者引用最多的期刊;冯惠玲和Neevel JG分别是国内外被引频次最高的档案学者;国内档案学者倾向于引用新文献,国外档案学引文半衰期比国内长。  相似文献   

9.
K-means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题.本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K-means改进算法.该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被引矩阵,然后基于同被引矩阵进行层次聚类.算法记录每次迭代过程中被聚为一类的学术文献间的距离以及两次迭代间的距离差,当两次迭代的距离差取得最大值时取其聚类数作为第二步K-means算法的K值,并且将此时的类中心作为第二步K-means算法的初始聚类中心.第二步聚类则依据文献内容实现K-means算法.实验通过与经典K-means算法和基于凝聚层次聚类算法的改进K-means算法的对比,证明了本文提出的改进的K-means算法具备更优的聚类效果.  相似文献   

10.
林业类科技核心期刊文献引用研究   总被引:1,自引:0,他引:1  
为全面、深入分析文献引用对林业类科技核心期刊质量的影响,通过资料分析,采用数理统计方法,选择同一层次的5家林业类科技核心期刊,对其2014年全年的参考文献的引用情况(篇均引文量、引文类型、引文语种、引文的时效性、期刊自引率)进行统计和分析.结果表明:5家期刊参考文献的引用情况不尽相同,篇均引文量需要提高;参考文献来源类型主要是期刊;语种以中文为主,其次是英文,其他语种引用比较少;参考文献时效性和期刊自引率控制较为合理,但有提升空间.通过统计数据分析,希望期刊编辑重视刊发文章引文的各项指标,从而提高刊发文章质量.  相似文献   

11.
文献计量学共引分析系统设计与开发   总被引:24,自引:5,他引:19  
崔雷  胡海荣  李纪宾 《情报学报》2000,19(4):308-312
本文主要介绍运用VisualFoxPro5.0,利用文献计量法中同被引聚类分析、共词聚类分析和共篇聚类分析原理,设计文献计量共引分析系统,对来自SCI和MEDLINE光盘的文献实现由专题文献直接形成直观聚类图的过程。本系统主要包含以下模块同被引分析,共词分析,共篇分析,聚类,帮助。  相似文献   

12.
马晓雷  文秋芳 《图书情报工作》2011,55(4):110-113,137
被引内容指的是被引用文献在引用文献中被引述的具体内容。Small曾经指出被引内容的研究价值,但迄今为止,在文献计量学领域被引内容分析仍然没有广泛展开。针对这一情况,提出一种分析领域知识的新方法———基于文本聚类的被引内容分析法,这种方法可以在一定程度上解决引文分析存在的问题。以第二语言教育为分析领域,研究结果证明该方法的可行性以及被引内容的研究价值。  相似文献   

13.
应用引文共引聚类-内容词分析法对学科发展的研究   总被引:6,自引:1,他引:6  
侯跃芳  崔雷  吴迪 《情报学报》2007,(2):309-314
将引文共引聚类与内容词分析法相结合揭示专题发展,通过引文共引聚类描述妊娠糖尿病专题研究的发展历史,通过高频引文的重要来源文献的内容词分析描述该专题研究现状,同时计算来源文献类内相似度、关联度及类间差异度,验证引文共引聚类的效果.  相似文献   

14.
以CNKI真实数据集为研究对象,通过共引文献统计功能得出一个文献耦合网络。首先采用形式概念分析的方法构建耦合文献形式背景,其次对耦合网络中的知识载体与知识属性剥离解析,而后探寻知识概念的偏序关系,进而建立耦合文献概念格。经由知识聚类、关联规则挖掘等一系列格上作业,可视化地勾勒出文献耦合网络的知识结构以及知识属性之间的组分异质性规律,探索概念格技术与引文分析方法的融合机制。  相似文献   

15.
《西南工学院学报》1992-1994年引文分析   总被引:8,自引:0,他引:8  
使用引文分析法对1992-1994年三年中出版的《西南工学院学报》刊出的156篇论著中引用的817条文献做了研究。其中80年代和90年代的文献占引文的77%;中文与英文文献的被引率分别为62.1%和33.8%;期刊被引率为52%,专著为41%,普赖斯指数为34.9%近十年的引文量占78%,引用文献的半衰期为6年。通过引文分析,发现该学报的引文运用率为88%,低于其他大学学报(自然科学版),而无引文的论著高达12%。这是应注意的差距。  相似文献   

16.
2001~2006年国际情报学研究的引文分析   总被引:1,自引:0,他引:1  
王孝宁  崔雷 《情报学报》2007,26(3):399-407
目的:了解当前国际情报学研究现状,总结研究热点,提供参考信息。方法:采用引文分析方法,对国外6种情报学核心期刊2001~2006年发表的学术论文进行调查分析,并用SPSS对高频被引文献进行同被引聚类分析。根据各个类中的文献内容分析当前研究的热点。结果:检得SSCI数据库中相关文献2320篇,其参考文献出现频次高于30次的论文47篇。高被引论文聚类分析树图分6类。结论:当前情报学研究热点主要集中于六个方面:网络信息资源评价、文献及作者同被引分析、信息组织处理、用户信息检索行为研究、情报学在医学领域的应用及基本理论阐述。  相似文献   

17.
闵超  张帅  孙建军 《情报学报》2020,(3):259-273
科学知识借助引用关系发生动态扩散,客观记录科学发展与演化的轨迹。由于知识之间存在千丝万缕的联系,以孤立的观点看待科学知识的影响与价值往往得到的是片面的感观。本文从联系的视角观察科学知识产出,尝试通过被引、引用、文献耦合与共被引等文献关系为单篇论著构建引文扩散网络,探讨"文献嵌入网络"的概念、测度方式及其在引文扩散过程中起到的特殊作用。案例分析显示,科学知识的形成相伴于科学知识网络的发展,同时也受到这个网络的影响:科学知识向科学领域的扩散,遵循从核心领域向周边领域的扩散模式;施引文献可以揭示目标文献中没有显式呈现的信息;四种文献关系之间可能存在相当程度的重合,引文扩散过程显示出知识的"黏滞性"与非常明显的"小世界"特征。对科学产出的扩散网络进行量化有助于为全面评价其价值提供更多客观依据。  相似文献   

18.
《中华儿科杂志》未被引文章分析   总被引:7,自引:2,他引:5  
关卫屏  游苏宁 《编辑学报》2008,20(6):560-562
将<中华儿科杂志>2005年全年发表的353篇论文逐一在清华同方引文数据库检索(检索日期截至2007年10月7日),其中40.5%的文章从未被引用过.诊断标准类文章均被引用,是刊载文章中唯一100%被引用的栏目;论著类文章未被引比例较低(15.4%);15篇述评、专论类文章中4篇未被引用(26.7%),其中2篇外籍专家述评稿件均未被引用;病例报告、临床病例讨论、临床经验交流栏目文章未被gl用率分别为87.0%、80.0%、29.3%;答疑、争鸣、讨论类文章未被引比例较高(80.0%).通过对未被引文章的深入剖析,旨在为国内医学期刊编辑工作实践提供依据.  相似文献   

19.
本文利用《科学引文索引》光盘数据寻找出某一专题文献中发表当年即被引用的论文,对这些论文两两比较它们之间拥有的相同主题词数目,以此数据为依据对这些当年高被引论文进行聚类分析。将这一结果与同年及翌年的高校引论文同披引聚类分析的结果相比较,探索将当年高被引论文的主题词链聚类分析应用于情报预测中的可能性。  相似文献   

20.
定义和比较“引文”和“引用”两个紧密相关而又相互独立的概念,并基于Journal of Informetrics(JOI)期刊中的论文数据进行相关的实证分析。通过从JOI期刊全文数据中识别出在正文中出现的引用信息,统计文章中引用个数的分布情况,计算引用个数与引文篇数之间的相关系数,分析引用和引文之间的多对多关系,并提出一种新的加权的计算引文总被引次数的方法。结果表明,这种方法可以更早地识别出最新发表的高被引论文,因此在科学预见和科学评价方面具有重要的应用价值和前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号