首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
目前,带标注语料库因为标注质量等原因严重影响了汉语的自动分词和测评,而其中影响较大的就是语料库中分词的不一致。本文总结并分析了前人对于分词不一致的各种研究,廓清了分词不一致的概念,提出分词不一致最好按照所属类别统一处理,同一类型的词应该处理成相同的切分形式。  相似文献   

2.
本文区别汉语自动分词中的“切分变异”、“组合型歧义”和“分词不一致”这三个概念,着重就“切分变异”这一分词现象的产生原因进行考证,并在真实语料调查的基础上统计切分变异字串在观察语料库中出现次数。探讨切分变异消解的原则。同时,本文还就“金本位”高质量分词语料库的建设提出设想和一种基于机器学习和错误驱动的算法。  相似文献   

3.
陈丽江 《文教资料》2006,18(23):99-100
在汉语的自动分词过程中,组合型歧义和分词不一致常常交织在一起,严重影响了切分结果的质量。本文试通过对熟语料库中“v a”和“m q”结构类型的二字词进行分类,每一类确定不同的方法来消解组合型歧义,以保证分词过程中的一致性。  相似文献   

4.
根据中古汉语的基本特点,结合现有语料库的建设经验,阐述中古汉语语料库选取语料的若干原则:语料样本的代表性、文本类型的平衡性、语料之间的关联性与区别度、入库文献的特色性;讨论建立中古汉语语料库分词规范、分词词表的可行性,初步构建“信息处理用中古汉语分词规范”的整体框架。  相似文献   

5.
在真实语料中提取词表面临着许多技术与理论上的难点与困难,但它又有着特殊的价值。“通用语料库”是国家语委组织研制的大型语料库,基本反映了现代汉语的语言面貌,完成对它的词表提取,其过程、做法及词表结果,都有着重要意义。机器分词时会遇到分词的正确性、加工精度的可容性、机器分词的强制性、机器分词的局限性等问题。源于真实语料的词表清楚反映出断代词汇由语言词和言语词两个层面构成,两个层面的词语之间有着互渗作用。源于真实语料的词表存在着书面语与口语的差异,不规范现象也较普遍存在,在词语的普遍性上与断代词汇有着相当的距离。  相似文献   

6.
近年来基于字的词位标注的方法极大地提高了汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,基于字的词位标注汉语分词方法逐渐成为分词的主要技术路线。本文简要介绍了词位标注汉语分词的基本思想,探析了基于条件随机场实现词位标注汉语分词的机理,并对采用四词位标注集,使用CRF++0.53工具包实现字串序列词位标注进行了详解。最后在Bakeoff2006的评测语料上进行了封闭测试。  相似文献   

7.
《文山学院学报》2016,(5):92-96
当前,中国学习者面临中国文化失语和中国文化身份焦虑的现实,建立小型专用语料库,将语料库技术和资源引入到中国文化教学与研究中可以切实从教学实践方面改善这一现状。本文主要从建库原则、双语语料对齐和标注等方面介绍了建库方案和相关知识。建成后的平行语料库对中国传统文化教学、跨文化教学、中国文化翻译教学以及制定中国文化词表等都具有很好的辅助作用。  相似文献   

8.
本文在语料库的基础上,通过考察、分析和统计人工分词和词性标注语料,采用语言学成果和计算机技术,对量名短语在语料库中的自动识别工作做了初步探讨。实验结果证明,利用匹配搭配词典和参考通过训练得出的搭配概率的方法,能够较好地在分词及词性标注文本上自动识别量名短语。  相似文献   

9.
分词连写能力影响盲文书写能力,事关盲生的语言文字运用能力。采用听写的方式,使用汉语盲文语料库中的语段对129名盲生的汉语盲文分词连写能力进行测验,结果发现:盲生盲文分词连写错误较多,分词连写能力偏低;小学高年级段、初中段和高中段三个学段的盲生之间没有显著差异;不同性别盲生之间没有显著差异。盲生分词连写错误集中于大类上的词组分词连写错误;集中在小类上的“结构助词”“副词+动词”等8小类错误。未来,应重视盲生的分词连写能力,加强盲校分词连写教学,完善分词连写规则。  相似文献   

10.
李海波 《现代语文》2010,(7):117-118
本文在对《老屋窗口》一文进行手工分词和词性标注的基础上,归纳总结了手工分词和词性标注存在的问题,为中文信息处理中的分词与词性标注提供一定的参考价值。  相似文献   

11.
新立话是钦州市的一种重要方言。新立话的助词特点饶有特色,结构助词有:箇[ko42]、堵[tu24/tu33]、咁[kum24]、得[t□k4],主要对应普通话的结构助词"的、地、得";动态助词有"紧[k□n24]、住[t□hui42]、了[liu22]、齐[t□h□i33]、过[ku42]、□[h□24]"等,主要对应普通话的动态助词"着、了、过";语气助词按语气分,句式的特点与普通话一致,但使用的语气形式有差别;典型的复数助词的标志是"队[thui42/th口i42]"。  相似文献   

12.
汉语“你想死我了”和“我想死你了”主宾位置相反却表达相同的意思,都是“我非常想你”之义.能进入“X+死+了”句式的词语还有不少,但只有“想类动词”有这种特殊现象.本文试从心理认知的角度探求产生这种现象的原因,认为这与“会话礼貌原则”有关.  相似文献   

13.
古汉沿“×之谓”式和“×之谓×”式,是不同的句法结构,前者是“宾+之+动”,后者是“主+之+动-宾”。确定主语或宾语,庖区分句法、语义、语用不同平面,不能认为凡施事就一定是主语,凡受事就一定是宾语。两式的“之”字,均为指示代词,起复指作用,作被复指词语的同位语;被复指的词语是宾语,“之”就是宾语;被复指的词语足主语,“之”就是主语;以前所说“之”是宾语前置标志的说法应当修正。  相似文献   

14.
董淑慧 《沧州师专学报》2013,29(3):11-13,42
河北孟村方言中的“活Adj/V死”结构表示“程度达到极致”,进入该结构的多为性质形容词、心理动词和少量动宾结构.从历时角度考察,该结构经历了从“生生/活活V”到“生生/活活V死”,再到“生生/活活Adj/V死”的形式转变,其中“活”和“死”也逐步虚化为程度副词,以“活Adj/V死”结构保存在少数方言中.  相似文献   

15.
各种语料中的大量的例证说明,读音为huo等的“和”、“活”、“火”、“豁”、“霍”、“合”等语素的词汇意义在部分词语里已经虚化;在A+huo和V+huo式言语结构中,huo等主要承担语法意义,具有明显的后缀性质。  相似文献   

16.
近现代汉语中存在着一种“往十回3+(X)V”结构中的“回3”.它的用法,是“回”业已概括诸用法之外的一种未予概括的用法,一种具有一定稳定性的用法.基于语义、语法特征,该用法的“回3”的词类性质确认为兼含有一定趋向动词性质的方位名词.  相似文献   

17.
“X+透”结构是比较特殊的述补短语。文章主要研究“X+透”中“透”做补语的词性和意义、能带“透”做补语的词、带有“透”做补语的句子结构的特点、“透”做补语的语义指向等。  相似文献   

18.
彝语东部方言八堡话中的是非疑问句共有助词式、选择式、反复式和重叠式四种形式.是非疑问句演变的路径:一是正反选择问“V+ conject+ neg+V”→反复问“V+neg+V”→反复问的缩略形式“V+neg”→助词式“V+助词”;二是正反选择问“V+conject+ neg+V”→反复问“V+neg +V”→VV式.前一种演变路径在汉语研究中得到了证明,后一种演变路径,彝语方言八堡话是有力的证明.  相似文献   

19.
在对英语的形容词性过去分词和现在分词的类型、结构、语义、特征进行综合分析和较为详细的论述的基础上,就其理解和如何进行忠实、通顺的翻译问题进行探讨,旨在提高我们的翻译理论、翻译能力、教学质量和实际运用英语的能力。  相似文献   

20.
采用定量统计法、描写法、实证法、归纳法等研究方法,从形式结构和意义结构两部分对偏正式双音复合词的构词进行探析。从形式结构看,常见的构词类型有"名素+x""动素+x""形素+x"三类,且构词类型相同的词所属词性不一定相同;从意义结构看,语素义与结构义存在对应关系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号