带标注语料库的分词不一致研究综述 |
| |
引用本文: | 董宇.带标注语料库的分词不一致研究综述[J].现代语文,2008(8). |
| |
作者姓名: | 董宇 |
| |
作者单位: | 金陵科技学院 |
| |
摘 要: | 目前,带标注语料库因为标注质量等原因严重影响了汉语的自动分词和测评,而其中影响较大的就是语料库中分词的不一致。本文总结并分析了前人对于分词不一致的各种研究,廓清了分词不一致的概念,提出分词不一致最好按照所属类别统一处理,同一类型的词应该处理成相同的切分形式。
|
关 键 词: | 分词不一致 语料库 综述 |
本文献已被 维普 万方数据 等数据库收录! |
|