基于统计的中文地址位置语义解析方法研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于统计的中文地址位置语义解析方法研究

引用本文：	谢婷婷,严柯.基于统计的中文地址位置语义解析方法研究[J].教育技术导刊,2017,16(10):19-21.

作者姓名：	谢婷婷严柯

作者单位：	1.智能机器人湖北省重点实验室,2.武汉工程大学计算机科学与工程学院，湖北武汉 430205

摘要：	为获取中文自然地址描述语句中的位置信息，提出一种不依赖于词典的中文地址分词方法。首先根据地址语料库中字串共现的统计规律统计词频，然后对地名地址串进行正则表达式预处理，再对地址串进行全切分处理。通过互信息和信息熵得到最优粗分结果，通过置信度对粗分结果进行过滤得到最优分词结果。实验结果表明，该方法在不依赖词典的情况下能有效实现对地名地址串的拆分，正确率和召回率分别达到了80.03%和89.28%。
关键词：	中文分词地名地址分词互信息信息熵

	点击此处可从《教育技术导刊》浏览原始摘要信息
	点击此处可从《教育技术导刊》下载免费的PDF全文