首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于统计的中文地址位置语义解析方法研究
引用本文:谢婷婷,严柯.基于统计的中文地址位置语义解析方法研究[J].教育技术导刊,2017,16(10):19-21.
作者姓名:谢婷婷  严柯
作者单位:1.智能机器人湖北省重点实验室,2.武汉工程大学 计算机科学与工程学院,湖北 武汉 430205
摘    要:为获取中文自然地址描述语句中的位置信息,提出一种不依赖于词典的中文地址分词方法。首先根据地址语料库中字串共现的统计规律统计词频,然后对地名地址串进行正则表达式预处理,再对地址串进行全切分处理。通过互信息和信息熵得到最优粗分结果,通过置信度对粗分结果进行过滤得到最优分词结果。实验结果表明,该方法在不依赖词典的情况下能有效实现对地名地址串的拆分,正确率和召回率分别达到了80.03%和89.28%。

关 键 词:中文分词  地名地址分词  互信息  信息熵  
点击此处可从《教育技术导刊》浏览原始摘要信息
点击此处可从《教育技术导刊》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号