自有知识增强下的学术全文本关系抽取研究 |
| |
引用本文: | 卓可秋,沈思,王东波.自有知识增强下的学术全文本关系抽取研究[J].图书情报工作,2022(7):120-131. |
| |
作者姓名: | 卓可秋 沈思 王东波 |
| |
作者单位: | 1. 南京农业大学信息管理学院;2. 南京理工大学经济管理学院 |
| |
基金项目: | 江苏省自然科学基金青年项目“基于深度学习的学术全文本时态语义知识标识及检索模型构建研究”(项目编号:BK20190450);;国家自然科学基金面上项目“基于深度学习的学术全文本知识图谱构建及检索研究”(项目编号:71974094)研究成果之一; |
| |
摘 要: | 目的/意义]学术全文本下的关系抽取是学术全文本知识图谱构建的关键技术,所构建的学术知识图谱能够实现文献的结构化、知识化,提高研究人员检索文献、分析文献和把握科研动态的效率,以及通过图谱的认知推理,有助于隐式知识发现。方法/过程]通过外部知识来增强关系抽取已在不少研究取得成果,但针对特定领域的关系抽取往往缺少可用的外部知识。研究发现,全文本中自有的高置信度的知识也可以用来辅助全文本关系抽取。受认知过程双系统理论(系统1为直觉认知,系统2为推理认知)启发,设计一个句子级模型来获取知识,并通过远程监督方式获取高置信度知识,然后将高置信度知识融入到全文本级深度学习模型最后分类的一层上。结果/结论]在生物医学学术全文本数据集(CDR-revised)上,比当前最先进的模型在F1上提高11.13%。
|
关 键 词: | 学术全文本 关系抽取 自有知识增强 知识图谱 |
|