首页 | 本学科首页   官方微博 | 高级检索  
     检索      

词形还原方法及实现工具比较分析
引用本文:吴思竹,钱庆,胡铁军,李丹亚,李军莲,洪娜.词形还原方法及实现工具比较分析[J].现代图书情报技术,2012(3):27-34.
作者姓名:吴思竹  钱庆  胡铁军  李丹亚  李军莲  洪娜
作者单位:中国医学科学院医学信息研究所
基金项目:国家“十二五”科技支撑计划基金项目“科技知识组织体系的协同工作系统和辅助工具开发”(项目编号:2011BAH10B02);中国医学科学院医学信息研究所中央级公益性科研院所基本科研业务费课题“基于语言网络的医学文本表示模型构建方法研究”(项目编号:11R0209)的研究成果之一
摘    要:结合理论和实验比较分析用于词形规范的词形还原方法和工具。归纳现有词形还原方法的主要分类,分析各类方法的特点和不足。介绍7种词形还原实现工具,并从其实现原理、使用的词性标注器、词典、开发语言、处理的语种、是否具有拼写检查功能等方面比较分析各工具的特点。选取其中5种工具,利用WordSimith Tools的标准数据进行词形还原实验。结合实验结果分析各工具的优劣,发现Specialist NLP Tools的词形还原工具具有较好的词形还原处理效果,为研究者选择适当的词形还原方法和工具提供参考。

关 键 词:词形规范化  词干提取  词形还原  词元

Contrast Analysis of Methods and Tools for Lemmatization
Wu Sizhu Qian Qing Hu Tiejun Li Danya Li Junlian Hong Na.Contrast Analysis of Methods and Tools for Lemmatization[J].New Technology of Library and Information Service,2012(3):27-34.
Authors:Wu Sizhu Qian Qing Hu Tiejun Li Danya Li Junlian Hong Na
Institution:Wu Sizhu Qian Qing Hu Tiejun Li Danya Li Junlian Hong Na(Institute of Medical Information,Chinese Academy of Medical Sciences,Beijing 100020,China)
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号