基于Tri-training的柬埔寨语组织机构名识别 |
| |
引用本文: | 谢俊,严馨,王若兰,周枫,李思远.基于Tri-training的柬埔寨语组织机构名识别[J].教育技术导刊,2018,17(5):127-131. |
| |
作者姓名: | 谢俊 严馨 王若兰 周枫 李思远 |
| |
作者单位: | 昆明理工大学 智能信息处理重点实验室,云南 昆明 650500 |
| |
摘 要: | 随着我国与柬埔寨的交流合作日益频繁,柬埔寨语的自然语言处理工作变得更为重要,针对柬埔寨语语料库资源有限、柬埔寨语组织机构名标注语料稀缺的问题,提出了一种基于半监督Tri-training的柬埔寨语组织机构名识别方法。该方法利用改进的Tri-training算法,结合柬埔寨语的语言特点进行实验。实验结果显示,准确率和召回率分别达到了65.68%、67.83%,表明该方法能有效利用大量未标注语料得到准确率较高的标注语料。
|
关 键 词: | 半监督学习 三体训练法 标注语料 特征选择 |
|
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|