基于自然语言处理的产业链知识图谱构建 |
| |
引用本文: | 毛瑞彬,朱菁,李爱文,周倚文,潘斌强,岳琳.基于自然语言处理的产业链知识图谱构建[J].情报学报,2022(3):287-299. |
| |
作者姓名: | 毛瑞彬 朱菁 李爱文 周倚文 潘斌强 岳琳 |
| |
作者单位: | 1. 武汉大学信息资源研究中心;2. 深圳证券信息有限公司;3. 天津大学管理与经济学部 |
| |
基金项目: | 国家重点研发计划项目“亿级节点时序图谱实时智能分析关键技术与系统”课题五“金融时序知识图谱查询与分析平台及应用验证”(2020AAA0108505); |
| |
摘 要: | 产业链知识图谱在金融领域应用较为广泛,但目前多数研究是面向单一产业的知识图谱构建或面向产业竞争情报服务,并没有把产业链和知识图谱有机地结合起来。本文从产业链应用角度出发,对产业链知识图谱的构建方法进行研究。首先提出了产业链知识图谱的构建流程和本体库,再基于领域语言模型,实现知识分类、抽取、融合等金融领域文本处理方法,对海量的领域文本进行知识抽取和融合,最终成功构建产业链知识图谱。根据本文方法构建的产业链知识图谱系统,覆盖产业链78个,细分行业7629个,已经应用到投融资、监管和产业规划等多个重要场景中。
|
关 键 词: | 产业链 知识图谱 领域语言模型 实体和关系联合抽取 |
|
|