首页 | 本学科首页   官方微博 | 高级检索  
     检索      

中小学汉语阅读文本自动分级技术研究报告
作者姓名:吴边  肖敏
作者单位:上海中文在线文化发展有限公司 201203;上海中文在线文化发展有限公司 201203
摘    要:为实现文本的自动化分级,引入当前自然语言处理领域中流行的神经网络语言模型进行文本难易度指标研究。通过采用长短期记忆单元所组成的循环神经网络和语文教材文本训练集构建语言模型,得到测试集的平均语句复杂度指标。最终对所得到的指标与文本难度等级进行相关性分析,以研究其对文本难易度的描述能力。实验结果表明:该指标与文本难度等级存在着很强的相关性,语句复杂度对于文本难度等级有着很强的指导性价值,同时语句复杂度对于文本可读性评估任务来说是一个拥有良好指向性的指标。

关 键 词:汉语文本自动分级  文本难易度标定  深度学习  语句复杂度评估
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号