首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于互信息的串扫描中文文本分词方法
引用本文:赵秦怡,王丽珍.一种基于互信息的串扫描中文文本分词方法[J].情报杂志,2010,29(7).
作者姓名:赵秦怡  王丽珍
作者单位:1. 大理学院数学与计算机学院,昆明,671000
2. 云南大学信息学院,昆明,650091
摘    要:中文分词技术是中文信息处理的基础环节,在互信息原理的基础上提出了一个基于统计的中文文本分词方法.该方法对经过预处理之后每一个串中的任意可能长度串均判断其成词的可能性,实验结果说明该算法简单且具有良好的精度及查全率.

关 键 词:中文分词  词频  互信息

A Method of String-Scanning Chinese Word Segmentation Based on Mutual Information
Zhao Qinyi,Wang Lizhen.A Method of String-Scanning Chinese Word Segmentation Based on Mutual Information[J].Journal of Information,2010,29(7).
Authors:Zhao Qinyi  Wang Lizhen
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号