首页 | 本学科首页   官方微博 | 高级检索  
     检索      

对称与非对称:中文词义消歧中局部上下文窗口问题研究
引用本文:李纲,寇广增,夏晨曦.对称与非对称:中文词义消歧中局部上下文窗口问题研究[J].情报学报,2010,29(2).
作者姓名:李纲  寇广增  夏晨曦
作者单位:1. 武汉大学信息管理学院,武汉,430072
2. 北京市科学技术情报研究所,北京,100048
基金项目:国家自然科学基金项目,教育部"新世纪优秀人才支持计划"资助 
摘    要:词义消歧是一个分类过程,局部上下文是主要的分类特征.对称窗口指上下文边界与歧义词的左右距离相等,大部分消歧系统凭经验将其作为最优的局部上下文窗口,很少选择非对称窗口.对称窗口是否优于非对称窗口?本文以Senseval-3中文数据集为例对这一问题展开研究.首先,对训练集采用交叉验证法确定最优窗口,它是非对称的.并采用此非对称窗口与多组经典的对称窗口进行了对比消歧测试,结果表明非对称窗口的表现优于对称窗口.进一步在独立采用词或词性作为特征的情况下进行交叉验证评估,发现趋于对称的窗口总体上表现是优秀的.在不进行辅助计算的情况下,可以选择对称窗口作为局部上下文窗口,但它并不是最优的.

关 键 词:词义消歧  中文  局部上下文  上下文窗口

Symmetric and Asymmetric:Local Context Window in Chinese Word Sense Disambiguation
Li Gang,Kou Guangzeng , Xia Chenxi.Symmetric and Asymmetric:Local Context Window in Chinese Word Sense Disambiguation[J].Journal of the China Society for Scientific andTechnical Information,2010,29(2).
Authors:Li Gang  Kou Guangzeng  Xia Chenxi
Institution:1.School of Information Management/a>;Wuhan University/a>;Wuhan 430072/a>;2.Beijing Institute of Science and Technology Information/a>;Beijing 100048
Abstract:Word Sense Disambiguation(WSD) is a task of classification,where the local context is the basic features to identify the sense of ambiguous word.Most systems choose optimal local context window on empirical grounds,which is usually symmetric,the same distance from the ambiguous word to both sides of the window.Is symmetric window better than asymmetric window? In this paper,we take Senseval-3 Chinese data set as example.First find the optimal window estimated by cross-validation using only the training set,...
Keywords:word sense disambiguation  Chinese  local context  context window  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号