首页 | 本学科首页   官方微博 | 高级检索  
     检索      

学术文献引文上下文自动识别研究
引用本文:雷声伟,陈海华,黄永,陆伟.学术文献引文上下文自动识别研究[J].图书情报工作,2016,60(17):78-87.
作者姓名:雷声伟  陈海华  黄永  陆伟
作者单位:1. 武汉大学信息管理学院 武汉 430072; 2. 武汉大学信息检索与知识挖掘研究所 武汉 430072
基金项目:本文系国家自然科学基金面上项目"面向词汇功能的学术文本语义识别与知识图谱构建"(项目编号:71473183)研究成果之一。
摘    要:目的/意义] 引文内容分析能够帮助揭示文献引用关系的深层语义内涵,而引文上下文识别作为引文内容分析的基础显得尤为重要。方法/过程] 梳理已有引文上下文研究的现状,总结当前引文上下文识别的不足,在此基础上归纳引文上下文识别的5类特征,并采用文本分类和序列标注两种方法开展引文上下文自动识别实验。结果/结论] 实验结果表明,本文提出的特征能够很好地提升引文上下文识别效果,且基于文本分类的SVM分类效果要优于基于序列标注的CRF。

关 键 词:引文上下文  引文内容分析  支持向量机  条件随机场  隐式上下文  
收稿时间:2016-06-16

Research on Automatic Recognition of Academic Citation Context
Lei Shengwei,Chen Haihua,Huang Yong,Lu Wei.Research on Automatic Recognition of Academic Citation Context[J].Library and Information Service,2016,60(17):78-87.
Authors:Lei Shengwei  Chen Haihua  Huang Yong  Lu Wei
Institution:1. School of Information Management, Wuhan University, Wuhan 430072; 2. Institute for Information Retrieval and Knowledge Mining, Wuhan University, Wuhan 430072
Abstract:Purpose/significance] Citation content analysis can help to reveal the deep semantic influence of literature citation relations, and citation context identification as a basis for content analysis is particularly important. Method/process] This paper reviews the latest development of researches of citation context and summarizes the deficiencies in citation context identification. Based on which five categories of citation context identification features are proposed. Besides, this paper also conducts an automatic identification experiment by utilizing text classification and sequence labeling. Result/conclusion] A significant improvement over baseline method shows the effectiveness of our features. Besides, the text classification based SVM method performs better than the sequence labeling based CRF method.
Keywords:citation context  citation analysis  support vector machine  condition random field  no-explicit context  
点击此处可从《图书情报工作》浏览原始摘要信息
点击此处可从《图书情报工作》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号