首页 | 本学科首页   官方微博 | 高级检索  
     检索      

全文检索中的汉语自动分词及其歧义处理
引用本文:熊回香.全文检索中的汉语自动分词及其歧义处理[J].中国图书馆学报,2005,31(5).
作者姓名:熊回香
作者单位:华中师范大学信息管理系
基金项目:本文是国家社会科学基金项目“基于中文XML文档的全文检索研究”(编号:04CTQ005)的研究成果。
摘    要:歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题。目前有基于词典的分词方法、基于统计的分词方法、基于语义的分词方法和基于人工智能的分词方法。自动分词的歧义处理,目前主要有:利用“长词优先”排歧,利用特征词消歧,利用“互信息”和“t-信息差”消歧,利用专家系统分词消歧。参考文献15。

关 键 词:全文检索  汉语自动分词  歧义处理  t-信息差  专家系统

Automatic Segmentation of Chinese Words and Processing of Their Ambiguities in Full-Text Search
Xiong Huixiang.Automatic Segmentation of Chinese Words and Processing of Their Ambiguities in Full-Text Search[J].Journal of Library Science In China,2005,31(5).
Authors:Xiong Huixiang
Institution:Xiong Huixiang
Abstract:Processing of ambiguities is the key problem in the automatic segmentation of Chinese words, which is a basic issue in Chinese information retrieval. There are segmentation methods respectively based on dictionaries, statistics, semantics and artificial intelligence. In this paper, the author also introduces various kinds of methods for the processing of ambiguities. 15 refs.
Keywords:Full-text search  Automatic segmentation of Chinese words  Porcessing of ambiguities  Expert system    
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中国图书馆学报》浏览原始摘要信息
点击此处可从《中国图书馆学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号