首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 343 毫秒
1.
考察特定领域文本中蕴含的细粒度知识实体的使用情况,对知识实体的评估和选择具有重要意义。学术文本中的细粒度知识实体通常具有多个类型、多种关联关系,挖掘知识实体的同质与异质关联关系,有助于深入了解特定领域知识实体的实际使用情况。目前相关研究大多针对学术文本中单一知识实体的抽取和评估,缺乏对知识实体间关系的关注,在一定程度上限制了基于实体抽取进行知识发现的能力。文章以自然语言处理领域为例,对学术论文全文中的细粒度知识实体关联数据进行挖掘,并通过可视化方式揭示关联数据中蕴含的信息。主要是选取全国计算语言学会议2009-2018年间收录的中文论文为原始语料,人工标注论文中使用的知识实体,并针对NLP特点将其细分为“指标实体”“工具实体”“资源实体”“方法实体”4种类型;结合关联规则挖掘算法Apriori和复杂网络分析软件构建知识实体关联网络,揭示该领域常用的知识实体,以及这些知识实体的使用相关性。  相似文献   

2.
马晓雷  文秋芳 《图书情报工作》2011,55(4):110-113,137
被引内容指的是被引用文献在引用文献中被引述的具体内容。Small曾经指出被引内容的研究价值,但迄今为止,在文献计量学领域被引内容分析仍然没有广泛展开。针对这一情况,提出一种分析领域知识的新方法———基于文本聚类的被引内容分析法,这种方法可以在一定程度上解决引文分析存在的问题。以第二语言教育为分析领域,研究结果证明该方法的可行性以及被引内容的研究价值。  相似文献   

3.
传统的文献计量学主要基于题录数据展开研究,随着开放获取运动的推进,基于全文数据的文献计量学分析悄然兴起,出现全文引文分析、知识实体抽取、语篇结构功能分析等研究热点。文章从数据基础、研究内容、流程方法3个角度系统阐述全文计量分析的范式和框架。在数据方面,通过回顾分析对象从题录数据到全文数据的变化,展现文献计量学由外在关联到内在本体的演化。在内容方面,选取语词、语句和语篇等不同层面的研究热点,对近年该领域的国内外研究进展和前沿问题进行综述。在方法方面,总结文本分析(包括计算语言学、社会语言学)和计量分析(包括加权分析、序列分析)两类主要的分析范式。  相似文献   

4.
[目的/意义]学术全文本下的关系抽取是学术全文本知识图谱构建的关键技术,所构建的学术知识图谱能够实现文献的结构化、知识化,提高研究人员检索文献、分析文献和把握科研动态的效率,以及通过图谱的认知推理,有助于隐式知识发现.[方法/过程]通过外部知识来增强关系抽取已在不少研究取得成果,但针对特定领域的关系抽取往往缺少可用的外...  相似文献   

5.
以文献计量学方法为基础,分别选用Web of Science和中国知网、万方知识服务平台构建数据集来分析国内外引用认同的研究现状,对国内外引用认同的主要载文期刊、高产作者、高被引作者等基本统计信息进行调查,并基于作者共被引方法分析了该领域的主要研究分支。在此基础上综合分析了国内外引用认同研究的内容,概括了引用认同的主要研究主题。  相似文献   

6.
挖掘记载科学知识的交叉领域文献,可以探究交叉领域形成和发展中的知识流动和知识创造规律。本文依据词汇在交叉领域文献中的位置功能,提出了“文献空间观”和交叉领域知识生长过程模型,包括知识吸纳、知识内化和知识创新三大环节,进而构建一种全文本分析方法框架实现对交叉领域知识生长过程的量化分析。以生物信息学领域作为案例开展了实证分析,研究结果发现,知识内化与知识吸纳高度相关,数量差距约6倍,但变化趋势相同;领域知识创新第一次高峰出现时间晚于知识吸纳和内化4年左右;随着学科不断成熟,即时内化率保持相对稳定,总内化率降低,新增吸纳知识的内化时滞降低,内化知识激发知识创新的效率越来越高。本文所提出的面向交叉领域知识生长的全文本分析方法框架,能够丰富学术文献全文本内容分析方法体系。  相似文献   

7.
实体关系抽取的技术方法综述*   总被引:3,自引:0,他引:3  
对实体关系抽取研究以MUC和ACE评测为主线的发展进行总结,并指出实体关系抽取任务普遍存在的三个问题是特定领域标引数据集的获取、模式的获取以及共指消解。在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:基于模式匹配的关系抽取、基于词典驱动的关系抽取、基于机器学习的关系抽取、基于Ontology的关系抽取以及混合抽取方法,旨在为进一步构建实体关系抽取系统提供良好借鉴。  相似文献   

8.
在参考临床研究的相关数据标准和电子病历相关数据标准基础上,构建前瞻性临床研究元数据的宏观框架、中观类组和微观属性等三个层面的元数据语义架构体系(openPCR)。openPCR的宏观框架结构包括临床研究、公用元数据、内部元数据和研究数据集4个部分;中观类组结构是对公用元数据、内部元数据和研究数据集进一步细化后形成的结构;微观属性结构从标识类、定义类、管理类、关系类和表示类来详细描述各级元数据。openPCR成为建立前瞻性临床研究数据库的语义结构体系,为前瞻性临床研究的数据标准化、数据交换与共享以及与电子病历系统的兼容奠定基础。  相似文献   

9.
识别领域知识演变转折点对于把握领域知识扩散规律具有重要意义。以主路径为桥梁,阐明领域知识扩散中的知识继承机制和知识改写机制,以及其中的知识演变现象。以直接引用文献间的信息传递关系为基础,利用互信息构建了反映领域知识演变的两个计量指标:RTP 和 RPT 。以 Web of Science 中太阳能领域文献为例,利用 Pajek 识别出该领域主路径;以主路径文献中的关键词为对象,统计全文中关键词出现的频次,计算演变转折指标并识别出了太阳能领域的知识演变转折点,通过文献分析证明了该方法的有效性。  相似文献   

10.
[目的/意义] 探索构建包含知识元分析的科技前沿情报分析框架。[方法/过程] 分析框架分为研究历程和最新现状两个部分,具有两个特点:第一个特点是在研究历程部分引入知识元分析。不仅通过文献计量从宏观层面展现科技前沿领域整体发展态势,而且通过知识元分析从微观层面揭示具体技术路线的发展变迁。第二个特点是在最新现状部分,通过补充科技前沿领域最新进展,既保持分析结果与时俱进,又对研究历程分析展现出的未来发展方向进行验证。[结果/结论] 利用该分析框架对甲烷直接制乙烯科技前沿进行实证研究,证明该分析框架的可行性,特别是实现了框架的两个特点。知识元分析展现了催化剂的发展变迁历程。研究历程与最新现状的对比分析,不仅验证了宏观和微观分析结果,而且使科技前沿分析更加完善。  相似文献   

11.
12.
基于作者共被引分析的国外知识管理领域流派研究   总被引:1,自引:0,他引:1  
通过对被引频次最高的30个作者的共被引分析,以可视化的方式展示国外知识管理领域的主要流派.对该领域的技术流派、行为流派及经济流派进行深入研究,分析其代表人物和高被引频次文献,以了解知识管理领域潜在的学科结构和力量分布.  相似文献   

13.
Author co-citation analysis (ACA) has long been used as an effective method for identifying the intellectual structure of a research domain, but it relies on simple co-citation counting, which does not take the citation content into consideration. The present study proposes a new method for measuring the similarity between co-cited authors by considering author's citation content. We collected the full-text journal articles in the information science domain and extracted the citing sentences to calculate their similarity distances. We compared our method with traditional ACA and found out that our approach, while displaying a similar intellectual structure for the information science domain as the other baseline methods, also provides more details about the sub-disciplines in the domain than with traditional ACA.  相似文献   

14.
《Journal of Informetrics》2019,13(3):817-829
The number of publications and the number of citations received have become the most common indicators of scholarly success. In this context, scientific writing increasingly plays an important role in scholars’ scientific careers. To understand the relationship between scientific writing and scientific impact, this paper selected 12 variables of linguistic complexity as a proxy for depicting scientific writing. We then analyzed these features from 36,400 full-text Biology articles and 1,797 full-text Psychology articles. These features were compared to the scientific impact of articles, grouped into high, medium, and low categories. The results suggested no practical significant relationship between linguistic complexity and citation strata in either discipline. This suggests that textual complexity plays little role in scientific impact in our data sets.  相似文献   

15.
16.
The preferences of the authors of Chinese library and information science (LIS) journal articles in citing Internet sources were investigated using eight premium Chinese LIS journals from Chinese Social Sciences Citation Index (the observation group) and 10 journals in other disciplines (the control group) from the same database from 1999 to 2008. A total of 252,881 citations were analyzed in terms of count, domain name, and citing purposes. The results show that (a) in comparison to the disciplines in the control group, LIS articles in Chinese journals indicated a strong preference for citing Internet sources, and this preference is increasing; (b) LIS articles did not seem to discriminate against domain names when citing Internet sources; and (c) LIS articles cited more Internet sources as evidence to support research results and conclusions. Excessive dependency on Internet sources may raise concerns over the quality, research ethics, and credibility of research publications. Chinese LIS researchers should place more emphasis on the disadvantages of Internet sources as supporting material. Guidelines and criteria to help researchers, journal editors, students, and librarians assess information on the Web need to be developed.  相似文献   

17.
[目的/意义] 作者共被引分析是探索领域知识结构的重要方法,在复杂的学科发展态势下,其依赖于共被引频次的作者关联度度量颇具争议。对此,提出一种基于语义和位置相似的作者共被引分析改良方法。[方法/过程] 在介绍基本原理的基础上,以图情领域为例开展基于语义和位置相似的作者共被引分析改良方法的效果实证,面向CNKI期刊库进行引文全文挖掘,并对引用句及引用位置进行抽取,结合预训练的领域词嵌入模型计算共被引文献间的深层相似度和作者间的关联强度,利用网络分析和因子分析法对比该方法与传统方法的效果差异。[结果/结论] 结果证明,基于语义和位置相似的作者共被引分析改良方法能更准确地识别共被引作者的关联强度,可发现更为细致的学科知识结构,并具有可拓展性与可应用性。  相似文献   

18.
Entity ranking has recently emerged as a research field that aims at retrieving entities as answers to a query. Unlike entity extraction where the goal is to tag names of entities in documents, entity ranking is primarily focused on returning a ranked list of relevant entity names for the query. Many approaches to entity ranking have been proposed, and most of them were evaluated on the INEX Wikipedia test collection. In this paper, we describe a system we developed for ranking Wikipedia entities in answer to a query. The entity ranking approach implemented in our system utilises the known categories, the link structure of Wikipedia, as well as the link co-occurrences with the entity examples (when provided) to retrieve relevant entities as answers to the query. We also extend our entity ranking approach by utilising the knowledge of predicted classes of topic difficulty. To predict the topic difficulty, we generate a classifier that uses features extracted from an INEX topic definition to classify the topic into an experimentally pre-determined class. This knowledge is then utilised to dynamically set the optimal values for the retrieval parameters of our entity ranking system. Our experiments demonstrate that the use of categories and the link structure of Wikipedia can significantly improve entity ranking effectiveness, and that topic difficulty prediction is a promising approach that could also be exploited to further improve the entity ranking performance.  相似文献   

19.
知识链接的发展阶段、发展动因和类型特征分析   总被引:1,自引:0,他引:1  
知识链接是根据知识体之间的关联关系将它们联系起来的过程、方法和技术。从知识链接可链接对象的范围来看,知识链接经历了大约五个发展阶段。导致知识链接新发展的动因主要在于人们对知识资源的互联互通和无缝链接的要求以及现实问题迫使人们开始探索新的知识传播和获取的途径与方法。知识链接按照链接对象的不同,可以分为三种:人与人之间的知识链接、人与知识体之间的链接、知识体与知识体之间的链接,每种知识链接形式都具有自己的特征。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号