首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于度量级融合的论文元数据提取方法
引用本文:张付志,刘华中.基于度量级融合的论文元数据提取方法[J].情报学报,2013,32(3).
作者姓名:张付志  刘华中
作者单位:燕山大学,信息科学与工程学院,秦皇岛,066004;河北省计算机虚拟技术与系统集成重点实验室,秦皇岛,066004
基金项目:教育部科技发展中心网络时代的科技论文快速共享专项研究资助课题
摘    要:针对现有的元数据提取方法提取精度不高且适应能力较差的问题,本文提出一种基于度量级融合的论文元数据提取方法.首先,提取论文首部的特征,利用已标注的数据集对HMM、SVM和CRF三种统计学习方法进行训练,生成相应的元数据提取模型;然后,根据贝叶斯判决理论推导出和规则,并利用和规则对三种提取模型产生的后验概率进行融合决策,实现论文元数据的提取;最后,通过设定时间段和文档数阈值,采用基于时间段统计的方法动态更新三种提取模型,以确保模型的有效性.在不同的数据集上对各种提取方法的性能进行了实验对比,结果表明,本文提出的方法不仅提高了元数据提取精度,而且具有较强的适应能力.

关 键 词:元数据提取  统计学习  度量级融合  后验概率  和规则

Publication Metadata Extraction Approach Based on Measurement Fusion
Zhang Fu-Zhi , Liu Hua-Zhong.Publication Metadata Extraction Approach Based on Measurement Fusion[J].Journal of the China Society for Scientific andTechnical Information,2013,32(3).
Authors:Zhang Fu-Zhi  Liu Hua-Zhong
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号