首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于HNC理论的汉语词义消歧策略   总被引:1,自引:0,他引:1  
基于HNC理论的汉语词义消歧策略,是从语义角度出发,利用HNC理论体系的HNC符号和HNC字词库,尤其是HNC符号的词语搭配信息和HNC字词库的语法语义信息,对汉语文本的多义词进行消歧。实验结果表明,该方法对于处理汉语词义消歧是有效的。  相似文献   

2.
词义消歧在多个领域有重要应用。基于Lesk及其改进算法是无监督词义消歧研究的典型代表,但现有算法多基于上下文与义项词覆盖,通常未考虑上下文中词与歧义词的距离影响。为此提出一种基于词向量的词义消歧方法,利用向量表示上下文以及义项,并考虑融合上下文与义项的语义相似度及义项分布频率进行词义消歧。在Senseval-3数据集上测试,结果表明,该方法能有效实现词义消歧。  相似文献   

3.
多义动词的歧义消解在词义消歧研究中占有重要的地位。本文在语料库词义人工标注工作的经验基础上,在从可利用的词汇知识资源、消歧策略的内部构成和原理层次、机用词典中动词义项分立等几个方面分析了动词词义消歧问题。提出了一个由动词词义知识库、语料信息、综合处理器三大部分,以及语法功能、语义关系、使用经验三个层面构成的动词词义消歧策略,并从这个角度对用于机器自动消歧的动词义项分立规则提出改进意见。  相似文献   

4.
文献著者消歧是人名消歧的一种,近年来引起了学术界的广泛关注。其中,文献聚类方法是文献著者消歧的重要方法,但其实验效果往往不佳。基于此,对文本聚类K-means方法进行改进,并在此基础上来实现文献著者消歧。实验结果表明,改进的K-means算法能有效提高文献著者消歧的实验效果。  相似文献   

5.
蒋平 《文教资料》2007,(4):138-139
本文在简要评述了现阶段机器翻译的种种不足之处后,认为词义歧义是阻碍机译系统提高翻译质量的重要因素。之后,文章概括评价了现阶段机器翻译系统所采用的词义消歧方法,如基于语言学规则的词义消歧方法,基于大规模语料库中多义词与其他关键语境词同现关系的统计的消歧方法和基于不倚赖于语言学知识的翻译实例的消歧方法,并提出了尚存问题。  相似文献   

6.
在文本的自动句法分析中,歧义的消解是一个关键而又尚未完全解决的问题。本文尝试提出采用蒙太格语法对汉语短语的结构歧义进行语义排歧的一种筛选模型。该模型以机器可读词典《现代汉语语法信息词典》和《现代汉语语义词典》为主要语法和语义知识源,从"约束"排歧和"优选"排歧角度出发进行语义排歧。  相似文献   

7.
英语情态动词的一词多义给自然语言处理带来了很大困难。情态动词语义对语境很敏感,发现影响情态动词语义的主要语境因素对情态动词特征选择、机器翻译等都十分重要。因此,采用神经网络技术对英语情态动词进行语义排歧,并确定不同语境特征对语义排歧结果的影响。基于一个 100 万字的语料库,以英语情态动词 must 为例,从语境中提取影响 must 语义的语义特征和句法特征,计算并确定这些特征向量值,建立可区分根情态与认识情态语义的 BP 神经网络,排歧正确率达到 94%。在此基础上,通过实验研究确定不同语境特征对情态动词 must 语义排歧的影响程度等级。该研究结果为情态动词语义排歧及情态动词语义人工识别提供了重要依据。  相似文献   

8.
词义消歧与框架-脚本理论   总被引:1,自引:0,他引:1  
对词义消歧(WSD)的研究,是人工智能科学、认知心理学、心理语言学等多种学科的热点课题.在过去的几十年里,各种各样的消歧理论体系不断被提出.文章对具有代表性的消歧体系进行简要介绍,并着重对框架-脚本理论运用于词义消歧的操作与意义进行了探讨.  相似文献   

9.
动词源致歧     
动词是致歧能力最强的词类,在各类歧义源中,动词源引发歧义的比重较大,因而影响也较大。多义动词项的致歧过程比较复杂,动词项也会在语义特征上显示出多重性特征;单义动词项致歧可称为语义特征致歧,其多个语义特征在句法结构中共现便可能引发歧义。  相似文献   

10.
语义相似度计算在信息检索、文本聚类、语义消歧等方面有着广泛的应用。为提高信息检索的查全率与查准率,提出一种本体概念综合语义相似度计算方法。该方法在本体概念语义距离的计算中引入了多种权重因子,并且综合考虑了本体概念语义重合度、本体概念属性对相似度的影响。实验分析发现,该方法比传统计算方法更加准确、有效,具有一定的理论及实用价值。  相似文献   

11.
词义消歧解决自然语言中同形异义词语在不同上下文环境中的义项标注问题,是自然语言处理领域的基础性关键问题.核方法是机器学习中一类强有力的统计学习技术,被广泛应用于分类、回归、聚类等诸多领域.基于核方法的词义消歧的关键是如何构造一个能够充分表达待消歧词上下文信息的核函数.在介绍基于核方法的词义消歧系统的一般框架之后,系统阐述了国内外面向统计词义消歧的核函数构造与选择的研究现状及进展,重点分析了研究中存在的问题及解决方法,最后探讨了未来研究的重点与可能的发展方向.  相似文献   

12.
首先介绍了目前一些常用词义消歧方法及其研究进展,并在此基础上探讨了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,最后详细讲解了BP神经网络原理,还对使用这种混合人工智能的消歧模型的可能性和优越性进行了讨论。  相似文献   

13.
词义排歧在机器翻译、信息检索、句子分析和语言识别等自然语言处理的许多领域都有十分重要的用途.因此词义排歧方法的研究在自然语言处理领域具有重要的理论和实践意义。本的主要工作是研究从知口网知识源中获取词义排歧知识的方法以及研究在语料库支持下的语义剪枝(sense pruning)算法。  相似文献   

14.
鉴于自然语言语序的灵活性,使得自然语言知识的自动消歧很困难。提出一种机器翻译中多义词词义消歧的新方法,从语境相关素的角度着手,把人类消歧时进行的逻辑推理归结为一种便于机器操作的机械的集合运算,提高了消歧的准确率。  相似文献   

15.
无论在自然语言处理还是在机器翻译中 ,自动分词都是一个重要的环节。本文讨论传统的切词方法中 ,歧义的形式 ,以及消歧处理方法  相似文献   

16.
生物医学文本语义消歧研究中,上下文语义表示存在精度不高、忽略语言特性等问题,对此提出一种基于Bi-LSTM的新型语言模型。该模型通过考虑上下文词序将整个句义信息以无监督学习方式嵌入低维连续空间,并以此生成高质量的上下文表示,然后利用该方法构建歧义向量,最终计算cosine相似度,完成对歧义词的分类。实验表明,相比传统线性语言模型,基于Bi-LSTM生成的语义向量能更好地表示歧义词的语义信息,并在不同生物医学文本数据集中达到高准确度(95.01/91.27)。  相似文献   

17.
计算机理解自然语言的瓶颈之一是词义的歧义性问题。词义消歧方法大体上可以分为两大类:基于定性的方法和基于定量的方法.要取得较好的词义消歧效果,将两结合是一条可行之道。本就这两的结合作了初步的研究和探讨.  相似文献   

18.
文章对组合歧义消歧方法进行了深入的分析与研究,先概述了组合歧义的分布和特点,然后对现有的方法进行了分析,最后借鉴各种方法,提出决策表加学习的消歧算法。  相似文献   

19.
语义排歧的质量是决定机器翻译优劣的重要标准,本文以六个较为常见的在线翻译网站为研究对象进行比较,从而了解我国大众网络翻译的现状及存在问题.  相似文献   

20.
屠明萍 《文教资料》2011,(36):121-123
本文采用贝叶斯分类器和条件随机场模型分别在同等规模的训练集和测试集上进行了词义消歧的对比实验。实验结果证明条件随机场模型能从上下文中任意地选择所需要的特征,而且有很强的特征组合能力,而不像贝叶斯分类器那样只对上下文的词形做训练.所以消歧结果是条件随机场模型优于贝叶斯分类器.但是在训练复杂度上.条件随机场要比贝叶斯分类器更为复杂一些。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号