基于NLP的OCR后处理方法 |
| |
引用本文: | 李文华,罗改龙.基于NLP的OCR后处理方法[J].人天科学研究,2010(10):35-36. |
| |
作者姓名: | 李文华 罗改龙 |
| |
作者单位: | 仙桃职业学院,湖北仙桃433000 |
| |
摘 要: | 针对目前OCR技术在后处理阶段多采用基于词的匹配技术而无法识别单字词的问题,提出了一种基于NLP的后处理技术。该技术通过采用词法切分法和语法匹配法,能够有效地利用上下文的语法语义信息。其中词法切分法采用的是中科院计算所提供的汉语分词技术,语法切分法以北大的《现代汉语语法信息词典》为基础。实验结果表明,采用该技术能大大提高句子中的单字词识别率,从而提高全文的整体识别率。
|
关 键 词: | OCR NLP 后处理 语法匹配 |
本文献已被 维普 等数据库收录! |
|