基于多源数据的科技文献作者同名消歧研究 |
| |
引用本文: | 昌 宁,窦永香,徐 薇.基于多源数据的科技文献作者同名消歧研究[J].情报科学,2021,39(6):108-116. |
| |
作者姓名: | 昌 宁 窦永香 徐 薇 |
| |
摘 要: | 【目的/意义】本文利用多源数据,通过对科技文献作者的名称进行消歧,使作者与科技文献呈一一对应的
关系。【方法/过程】本文提出首先将采集的多源数据进行预处理,形成了同一姓名作者文献组成的待消解的重名数
据集,通过合作关系构建学术圈以发现歧义,最后通过机构和领域进行消歧。【结果/结论】实验采集了各级教育、自
动化及计算机技术、信息与知识传播、数理科学和化学、无线电电子学、中国医学等6个不同的学科的文献题录数
据,本文提出的基于规则的消歧具有良好的消歧效果。通过多源数据融合、机构和领域多指标消歧,能够达到较高
的消歧效果。【创新/局限】解决了同机构同领域消歧的难题,并考虑了增量问题,构建了完整的消歧模型。
|
|
| 点击此处可从《情报科学》浏览原始摘要信息 |
| 点击此处可从《情报科学》下载免费的PDF全文 |
|