首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于哈希算法的中文分词算法的改进
引用本文:姚兴山.基于哈希算法的中文分词算法的改进[J].图书情报工作,2008,52(6):60-60.
作者姓名:姚兴山
作者单位:南京大学信息管理系
摘    要:中文分词是中文信息处理一个重要的部分,一些应用不仅要准确率,速度也很重要,通过对已有算法的分析,特别是对快速分词算法的分析,本文提出了一种新的词典结构,并根据新的词典给出了新的分词算法,该算法不仅对词首字实现了哈希查找,对词余下的字也实现哈希查找。理论分析和实验结果表明,算法在速度和效率比现有的几种分词算法上有所提高。

关 键 词:中文分词  中文信息处理  数据结构  哈希  
收稿时间:2007-12-25
修稿时间:2007年12月23

The Improvement in a Chinese Word Segmentation Based on Hash Algorism
Yao Xingshan.The Improvement in a Chinese Word Segmentation Based on Hash Algorism[J].Library and Information Service,2008,52(6):60-60.
Authors:Yao Xingshan
Institution:Department of Information Management,Nanjing University
Abstract:Chinese word segmentation is a very important component of Chinese information process. In a lot of application,the precision of word segmentation is paramount,at the same time the velocity is also needed.Through the analysis of the exiting algorithms of Chinese word segmentation, especially the fast algorithms. A new algorithm for Chinese word segmentation is introduced in this paper, which is based on the new data structure for Chinese dictionary. It not only supports hashing operation on the first Chinese character,but also on the other character . In theory, the above data structure achieve much more efficiency than other methods.
Keywords:Chinese word segmentation Chinese information processing Data Structure Hash
本文献已被 万方数据 等数据库收录!
点击此处可从《图书情报工作》浏览原始摘要信息
点击此处可从《图书情报工作》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号