蒙古文词根、词干、词尾的自动切分系统 |
| |
引用本文: | 那顺乌日图.蒙古文词根、词干、词尾的自动切分系统[J].内蒙古大学学报(人文社会科学版),1997(2). |
| |
作者姓名: | 那顺乌日图 |
| |
作者单位: | 内蒙古大学蒙古语文研究所 |
| |
摘 要: | 在蒙文信息处理工作的词处理阶段,自动切分构形词尾和词根、词干是多项后续工作的基础。如,词汇和词尾的统计,各种词典的编制,进行句处理,篇章处理等都需要以正确的“切分”为基础。词根、词干和词尾的切分迄今为止都是人工完成的,所以存在着速度慢、人力投入大以及出现因人而异,前后不一致等问题。本系统从计算机自动切分的角度对蒙古语构形词尾进行了分类,在具有两万多词条的《蒙汉辞典》和一百万词级的《现代蒙古语数据库》语料的基础上考察和比较了蒙古语的词根、词干和构形词尾,在传统语法的研究成果和计算语言学方法相结合的基础上把蒙古文近200种词尾分成三大类,并根据各类词尾的不同特点编制了几种词典,设计,提出了二十多组语法条件和若干个生成规则,在计算机上实现了自动切分。据测试,使用该系统可以覆,盖现代蒙古语各类文本的95%以上。
|
关 键 词: | 蒙古文 词根 词干 词尾 自动切分 系统 |
本文献已被 CNKI 等数据库收录! |
|