首页 | 本学科首页   官方微博 | 高级检索  
     检索      

非相关文献知识发现的关键技术研究
引用本文:张云秋,冷伏海.非相关文献知识发现的关键技术研究[J].情报学报,2008,27(4).
作者姓名:张云秋  冷伏海
作者单位:1. 吉林大学公共卫生学院,长春,130021
2. 中国科学院文献情报中心,北京,100080
基金项目:教育部社科研究基金规划项目,吉林大学校科研和教改项目
摘    要:本文在对非相关文献知识发现中的关键技术进行界定的基础上,对11个国外主要的非相关文献知识发现研究中所涉及的关键技术,即初始文本集的构建、信息抽取及中间关联词的确定与排序等进行了比较研究,认为B集合质量低是非相关文献知识发现目前存在的主要问题.针对该问题,作者提出以提高B集合的质量为主要目标,从B集合形成的前过程,即初始文本集的质量以及B集合本身的质量,即B词的排序两个方面的改进策略.前者包括初始文本集的合理结构及综合过滤机制,后者包括双向词频法、基于MeSH加权和基于文献内聚力加权.并对部分改进策略进行了试验.

关 键 词:非相关文献知识发现  信息抽取  B集合  MeSH加权  文献内聚力

A Study on Key Techniques for Disjoint Literature-Based Discovery
Zhang Yunqiu,Leng Fuhai.A Study on Key Techniques for Disjoint Literature-Based Discovery[J].Journal of the China Society for Scientific andTechnical Information,2008,27(4).
Authors:Zhang Yunqiu  Leng Fuhai
Institution:Zhang Yunqiu~1 Leng Fuhai~2 (1.School of Public Health,Jilin University,Changchun 130021,2.(Library of Chinese Academy of Sciences,Beijing 100080)
Abstract:On the base of the definition of the key techniques of disjoint literature-based discovery.The paper analyzes and compares the key techniques of the eleven disjoint literature-based discovery systems,including the constructing the original literature collection,information extraction and determining and ranking the B-terms.Then the author analyzes the existing problems of these key techniques.The main problem is the low quality of B collection.Aiming at solving the problem,the author proposes the frame of p...
Keywords:disjoint literature-based discovery  information extraction  B collection  MeSH-based weighting  literature cohesiveness  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号