首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于TF/IDF多因素改进算法的知识单元抽取研究
引用本文:刘盛博,丁堃,王贤文,刘则渊.基于TF/IDF多因素改进算法的知识单元抽取研究[J].情报学报,2011,10(10).
作者姓名:刘盛博  丁堃  王贤文  刘则渊
作者单位:大连理工大学知识可视化与科学发现联合研究所,大连,116023
摘    要:深入分析知识研究的基本知识单元,对知识单元的概念、特性、载体及抽取过程做详细阐述,提出知识计量研究中的知识单元的定义与特性,对知识单元的独立性、组合性、链接性、多维性、外显性、可测性进行详细说明.根据知识单元特性以及中文文献特点,提出一种基于词长和位置考虑的TF/IDF多因素改进算法,以<半导体光电>期刊1999~2006年数据为实例,对比分析了传统TF/IDF特征词抽取方法与改进后特征词抽取算法,分析结果表明,基于词长和位置的TF/IDF多因素改进算法显著提高了知识单元抽取效率和准确性.

关 键 词:知识计量  知识单元  知识单元抽取  TF/IDF

Knowledge Unit Extracting Research Based on Improved TF/IDF Multi-Factor Algorithm
Liu Shengbo,Ding Kun,Wang Xianwen,Liu Zeyuan.Knowledge Unit Extracting Research Based on Improved TF/IDF Multi-Factor Algorithm[J].Journal of the China Society for Scientific andTechnical Information,2011,10(10).
Authors:Liu Shengbo  Ding Kun  Wang Xianwen  Liu Zeyuan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号