首页 | 本学科首页   官方微博 | 高级检索  
     检索      

中文词义消歧上下文最优边界问题研究
引用本文:李纲,寇广增,夏展曦,全吉,张东赫.中文词义消歧上下文最优边界问题研究[J].现代图书情报技术,2009(7).
作者姓名:李纲  寇广增  夏展曦  全吉  张东赫
作者单位:1. 武汉大学信息管理学院,武汉,430072
2. 北京市科学技术情报研究所,北京,100048
3. 武汉大学系统工程研究所,武汉,430072
4. 郑准泽远山经济大学,远山,朝鲜
基金项目:国家自然科学基金项目"文本集特征提取方法及应用研究"(项目 
摘    要:为了选择最优的边界,采用交叉验证方法,将取得错误率最低的上下文边界确定为上下文最优边界,并应用此方法对SemEval-2007中文数据集进行处理,得出此数据集的上下文最优边界为-2,+2].为了验证其结果的有效性,进一步采用SemEval-2007测试集进行消歧测试,结果表明采用交叉验证法确定的最优边界对词义消歧准确率有一定提升.同时对不同词性歧义词的最优边界也进行讨论.

关 键 词:词义消歧  上下文边界  特征选择  中文

Optimal Context Window for Chinese Word Sense Disambiguation
Li Gang,Kou Guangzeng,Xia Chenxi,Quan Ji,Jang Donghyok.Optimal Context Window for Chinese Word Sense Disambiguation[J].New Technology of Library and Information Service,2009(7).
Authors:Li Gang  Kou Guangzeng  Xia Chenxi  Quan Ji  Jang Donghyok
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号