首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 878 毫秒
1.
词性自动标注是对语料在高层次上进行分析的一个重要组成部分,其结果可以用于很多自然语言处理应用程序当中。而维吾尔语和其它语言一样也存在词兼类现象。本文介绍了维吾尔语词性自动标注系统的设计思想和实现过程。该系统基于隐马尔科夫模型,采用Viterbi算法来进行词性自动标注。  相似文献   

2.
语文辞书标注词性是为了让用户明确认识词目的语法性质,因而词性标注必须充分显示词的语法功能,兼类词、罕用词的词性标注尤其需要注意这一点。不同词性的词目,释义用语应有区别,释义词语需要注意词性或释义短语的语法性质与词目相同。词目配例应体现一类词的典型功能,同时其所体现的功能应尽可能具有多样性。  相似文献   

3.
由于汉语词类问题的复杂性,辞书标注词性困难重重。《现代汉语词典》第5版在继承前版的基础上,增加了词性标注。但是,由于主客观因素的影响和制约,其词性标注难免还存在一些失当之处,主要有:一、词性标注不够准确;二、词性标注前后矛盾;三、兼类词词性标注不全面;四、同类词词性标注不一致。笔者抽取一些具体的词,对上述问题进行分析探讨,并提出自己的看法。  相似文献   

4.
本文通过对十部对外汉语教材中生词词性标注现状展开分析考察,分析了现行教材进行词性标注的特点和做法,指出教材在词性标注方面存在的问题,如词性标注存在错误、词性标注的依据不明确等问题,讨论了特殊类别词汇的词性标注问题,如离合词、兼类词、属性词等如何标注词性以及词语和语言构式是否需要标注词性.最后提出了建立词性标注体系、优选标注语言符号等词性标注的原则和建议.  相似文献   

5.
词性标注问题一直是计算语言学中的一个难点问题,对于一些词类的标注标准和方法,至今仍未统一,如兼类词、区别词,这给进一步的句法分析和语料库的共享带来了很大困难,甚至有时候会造成资源的浪费。本着实用的目的,在参考各家标注策略的基础上,本文对兼类词、区别词和状态词的标注给出了统一的标注策略。  相似文献   

6.
对机器自动词性标注技术领域的三类主要理论方法(基于规则的方法、基于统计的方法和规则与统计相结合的方法)进行了研究分析和优缺点的对比,并在描述方式、标注依据、机器效率、鲁棒性、标注正确率和实用性等方面,对这三类方法进行认真的比较。比较结果显示规则与统计相结合的方法在各方面都占有较明显的优势,是目前最理想的标注方法。基于此类方法的自动词性标注技术可以较好地满足实际应用的要求。此外,本文还指出这类方法有待解决的三大难题。  相似文献   

7.
给语文词典标注词性应根据词典的规模、义项归并的粗细确立相应的词类系统,标准要具体简单具有操作性,词性与释义、配例尽量协调一致,妥善处理兼类词及照顾不同层面。  相似文献   

8.
汉语以字为基本书写单位,且缺乏形态变化,词的兼类现象相当普遍.因此,有效对汉语进行词性标注对利用计算机来理解和生成汉语自然语言具有基础性意义.通过实例分析介绍了四种主要的标注方法并对其优劣进行了比较.  相似文献   

9.
汉语以字为基本书写单位,且缺乏形态变化,词的兼类现象相当普遍.因此,有效对汉语进行词性标注对利用计算机来理解和生成汉语自然语言具有基础性意义.通过实例分析介绍了四种主要的标注方法并对其优劣进行了比较.  相似文献   

10.
王专 《语文知识》2012,(3):109-111
本文主要从部分属性词词目失收、属性词词性标注存在失误、个别词的义项遗漏了属性词标注、属性词兼类的标注问题四个方面对《现代汉语词典》(第五版)属性词标注失误进行了分析归纳,并据此进一步思考辞书编纂时应遵循的系统性原则。  相似文献   

11.
在现代汉语语法和词典研究中,概括词的兼类问题最为棘手,其中具有自指用法的概括词兼类问题尤甚。主流观点坚持兼类要尽可能少的“简约原则”,把分析语普遍存在的概括词语法多功能现象视为汉语特有的词类多功能现象,从而造成汉语词类“类无定职”的困境。从双层词类范畴化理论视角分析,发现上述观点已对现代汉语词典的词类标注和现代汉语语料库的词性标注产生消极影响:现代汉语词典中兼类词条的数量被人为减少,造成现代汉语兼类现象远远少于现代英语的假象;对于规约化自指用法的表征,具有对称语义关系的词条在同一部词典中的词类标注自相矛盾、在不同词典之间相互矛盾的现象突出。因此,取消自指词项兼类禁令是解决汉语词类问题的重要出路。  相似文献   

12.
随着现代汉语语法理论研究的深入和词典编纂理论的发展,词性的标注问题得到了普遍的关注,不少词典开始标注词性。其中,对于词典词性标注问题,争议多存在于动词、形容词、名词之间的兼类与转类问题上。本文首先回顾词典词性标注的历史,然后从语言事实与外语教学等角度说明动转名的词性标注的必要性。  相似文献   

13.
概括词的兼类现象一直是语法研究和词典编纂的难点,作为黏着语的韩国语也不例外。本文以双层词类范畴化理论为指导,基于自建的"《新国语词典》(第5版)词类标注数据库",对现代韩国语中的兼类词表征情况作了详尽调查。结果发现,现代韩国语中的兼类现象不如现代汉语和现代英语那般丰富,兼类数量相对较少,兼类类型相对单一。尽管如此,词的兼类现象还是具有一定跨语言的普遍性。  相似文献   

14.
词类标注在汉英词典编纂中是一件牵一发而动全身的大事,其中兼类处理尤甚。《新世纪汉英大词典》被誉为第四代汉英词典的开山之作,但至今缺乏对其词类标注进行系统研究。从双层词类范畴化理论视角,基于自建的"《新世纪》(第二版)词类标注数据库"和语料库使用模式调查,对其兼类词表征策略进行系统研究。研究发现,该词典在词类标注方面成绩与问题并存:总体而言,兼类词数量显著增加,微观结构更趋合理,但仍未能全面反映现代汉语中概括词的兼类现状;具有对称语义关系的词条在词类标注中尚存一定问题。《新世纪汉英大词典》(第二版)在词类标注上的困惑在很大程度上仍然是现代汉语等分析语词类研究困境的真实写照。  相似文献   

15.
Homonyms (同音同形异义词、同音异义词、同形异义词)是英语学习中的一大障碍,尤其是兼类问题(一词多词性).文中说明了Homonyms的概念、分类,进而探讨了Perfect homonyms(同音同形异义词)的几种兼类情形以及相关问题.  相似文献   

16.
频率统计是研究词性标注的方法之一,而且也是新近比较流行的一种方法。文章在现有研究的基础上,对四部辞典中有三部一致标注为形容词的17个分歧词进行了考察研究,对出现在例句语料中的分歧词做了语法标注,并运用计算机处理软件分析统计分歧词的词性,测算出比率值,以达到化解词性标注分歧的目的。  相似文献   

17.
兼类词的判断标准可以分为"单类""倾向兼类""兼类"三个阶段,"倾向兼类"是从临时活用的动态状态向具有新意义且独立使用的静态状态过渡的阶段。在确定是否兼类的问题上,应适当使用溯源法,即语义探源,因为不考察词的最初词性,就无法确定是否转类、兼类。而判断是否兼类主要是依靠频率统计法,当两种词性的分布比例在频率统计的边缘时,可以考虑意义是否发生变化,如意义已经分化,则为兼类。根据以上原则可分析,"腐败"是名、动、形兼类,并且趋向转类;"衰败"是形容词倾向兼名词类。  相似文献   

18.
Homonyms(同音同形异义词、同音异义词、同形异义词)是英语学习中的一大障碍,尤其是兼类问题(一词多词性)。文中说明了Homonyms的概念、分类,进而探讨了Perfect homonyms(同音同形异义词)的几种兼类情形以及相关问题。  相似文献   

19.
本文提出了一种基于条件随机场模型的汉语词性标注方法。该方法能够充分利用词的上下文信息作为特征。实验表明,该方法的标注效果明显优于基于隐马尔可夫模型和最大熵马尔科夫模型的方法。  相似文献   

20.
本文介绍了“计算机用现代汉语词类研究”项目的技术方案,即:先参考词库和词类词典对语料进行自动分词自动标注词性处理人工校对和调整后,再利用分词条程序将语料收入数据库,最后进行各种统计分析的方案。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号