基于Bootstrapping的家谱文本信息抽取方法研究 |
| |
引用本文: | 鲍宸洋,任明.基于Bootstrapping的家谱文本信息抽取方法研究[J].图书馆杂志,2022(2):93-102. |
| |
作者姓名: | 鲍宸洋 任明 |
| |
作者单位: | 中国人民大学信息资源管理学院 |
| |
基金项目: | 中央高校基本科研经费中国人民大学科研基金项目“领域知识图谱构建及其在数字人文中的应用”(项目编号:19XNA009)的研究成果之一; |
| |
摘 要: | 实现家谱文本信息的自动抽取是家谱资源深度开发利用的关键.目前深度学习在家谱文本信息抽取方面取得了良好的效果,但是对标注数据的依赖始终是其发展瓶颈之一.本文面向家谱的世系小传,研究基于小规模标注数据进行家谱人物和关系的抽取方法.具体来说:基于Bootstrapping的思想,以少量的标注数据作为初始种子集,使用深度学习B...
|
关 键 词: | 家谱文本 信息抽取 深度学习 Bootstrapping BiLSTM-CRF |
|
|