首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 839 毫秒
1.
面向专利领域的机器翻译近年来已成为机器翻译的重要应用领域之一。本文提出了一个汉英专利文本机器翻译融合系统,该系统以规则系统为主导搭建,并把规则翻译方法和基于短语的统计翻译系统相结合。在融合系统中,规则系统主要负责源语言的分析和转换阶段的处理,生成相应的源语言句法分析树与转换树,并确定目标语言的基本句法框架。统计翻译系统则在目标语生成阶段根据生成的目标语句法结构寻找合适的对译词形,并产生最终的候选译文。通过利用自动评测指标对融合系统进行测试,融合系统的结果均优于单个规则系统和统计系统的结果,表明了融合方法的有效性和可行性,可以改善系统的翻译性能,提高翻译质量。  相似文献   

2.
汉英词典作为沟通中文与英语两种不同语言的桥梁,是中国与世界交流的工具。在信息时代飞速发展的今天,双语词典的自动构建技术在机器翻译和跨语言检索领域起着重要的作用,本文对双语词典的自动构建方法和其中的关键技术进行了比较全面的分析和总结,并提出一种从汉英平行语料库中抽取双语词语,自动构建双语词典的方法,在实现汉英句子级对齐后,对双语语料分别进行分词和词性标注处理,通过抽取汉英词语单元并计算其关联概率来实现汉英的词语对齐,最终生成双语词典。该方法在对真实语料的双语词典构建实验中取得了较好的结果,词对齐效果优于传统的IBM模型方法。  相似文献   

3.
汉英双语标注集的研究与实现   总被引:1,自引:0,他引:1  
标注集是任何自然语言处理研究中的知识表达基础。本文结合汉英双向机器翻译开发和双语语料库加工的实践,提出了建立标准的汉英双语标注集的必要性,探讨了该标注集设计过程中遇到的几个关键问题并给出了一个比较完备的汉英双语标注集解决方案。实践证明,该方案具有良好的开放性和兼容性,对于汉英双向机器翻译系统和汉英双语语料库研究都具有适用性。  相似文献   

4.
本文论述了CEMT-Ⅲ型汉英机器翻译系统的理论设计和实现情况,主要阐述了系统的语言模型、总体结构和设计思想,以及系统在开发实践过程中所遇到的语言学工程和计算机知识处理等方面的问题及其解决办法,并对系统的各个组成部分的设计原理和技术特点做了详细描述。  相似文献   

5.
机器翻译研究用计算机实现不同自然语言之间的翻译。自第一台计算机诞生开始,人们一直在研究和探索高质量高效率的机器翻译技术。近年来,基于规则的机器翻译、基于实例的机器翻译和基于统计的机器翻译这几种主要的翻译模式共同存在且相互补充,并有不断融合之势。随着中国和日本在科技、经济和文化交流的不断深入,机器翻译研究对于打破汉语和日语之间的语言壁垒进而推进中日两国各个领域的交流与合作具有重要的应用价值。中国和日本两国机器翻译研究人员已经开展了大量的汉日/日汉机器翻译的理论研究与系统研制,已取得了有效的成果,但距离大规模实际应用和高标准的翻译质量的要求尚有差距。为此,中日两国机器翻译人员有必要在汉日/日汉机器翻译技术与系统研制方面展开合作,特别是在对齐平行文本、实例词典、专业术语词典以及句法分析等共同课题方面展开合作。文章介绍了中日两国机器翻译研究的进展并加以比较,对中日两国在机器翻译领域的合作做了分析与展望。  相似文献   

6.
本文以多语言科技信息服务为立足点,结合中日两国面向科技文献的机器翻译研究现状,介绍了两国近几年开展的机器翻译合作项目的情况,包括合作背景与基础、知识产权、具体合作内容与成果,以及在机器翻译实用化方面的一些思考。  相似文献   

7.
介绍本体作为知识工程领域的一种新方法被引入到汉英机器翻译的研究中,用来协助机器翻译中对自然语言语义的理解和计算;指出本体为源语言与目标语言的词汇提供中性化、形式化的表达,其概念语义网络为自然语言的歧义消除提供世界知识、语义空间,本体工具本身所具有的推理功能也使机器翻译的语义处理更为便捷,本体已逐渐成为语义处理的新的理论基础及工具。  相似文献   

8.
多机器翻译系统融合技术能够对不同机器翻译系统的输出结果有效地进行融合产生更好的翻译性能,因此该技术成为机器翻译研究领域的一个热点问题.常用的多机器翻译系统融合技术可以分为句子级、短语级和词级融合.在对不同级别的系统融合技术进行分析的基础上,本文提出基于词和短语的多机器翻译系统融合方法.首先,采用词级的系统融合技术构建混淆网络,将混淆网络转化为短语表.然后,基于该短语表利用短语级的系统融合技术中的再解码方法进行混淆网络解码生成融合结果.该方法既保证了融合系统所构建的混淆网络的最大可能性,又可以利用更多的特征进行混淆网络解码.我们将基于词和短语的多机器翻译系统融合方法在两个测试集上分别实验并进行比较,获得了较为满意的翻译效果.  相似文献   

9.
双语语料库在机器翻译、跨语言信息检索以及翻译词典编纂等自然语言处理领域有着越来越重要的用途。该研究利用同族专利文献信息作为双语语料的来源,探讨了基于同族专利获取双语语料的可行性,以获取汉英双语语料为实例提出了双语语料的获取流程,同时进行双语对译部分的对齐规则的研究,从而构建出科技领域的平行双语语料库。最后,还阐述了该方法的相关注意事项以及应用前景。  相似文献   

10.
跨语言检索中机器翻译技术的应用和进展   总被引:2,自引:0,他引:2  
本文以跨语言检索为背景,主要介绍了机器翻译技术的应用和进展.文章介绍了跨语言检索中机器翻译技术的应用形式,简单回顾了机器翻译技术发展历史中出现的各种方法及其基本思想和优缺点,特别是近年来统计机器翻译的发展.本文通过一个实例较为详细地介绍了目前主流的基于短语的统计机器翻译原理,然后通过一个实际的新闻长句子对几个典型的基于规则的和基于统计的机器翻译系统的翻译结果给出了细致的比较和分析.最后对机器翻译在跨语言检索中的应用前景做出了展望.  相似文献   

11.
本文比较各种机器翻译方法的特点,借鉴短语结构、GPSG、HPSG和语料库等计算语言学理论,采用以单词为核心的方法,建立一组以1000单词为背景的英汉翻译规则,并实现以单词规则、通用规则为准,进行英汉翻译的机译系统。本文还对机译系统构成、设计、词典结构等技术问题进行了探讨,并提出一套规则和结点的评价方法,为消除机器翻译中的句法歧义做了有益的尝试。  相似文献   

12.
基于汉英双语语料库的汉英词典编撰研究   总被引:5,自引:0,他引:5  
杨沐昀  刘晓月  李生 《情报学报》2003,22(3):310-314
汉英词典对于跨语言信息检索、计算机翻译等许多领域具有重要意义。为了利用双语语料库获取汉英词典 ,本文在对四种常见的基于共现信息的词汇对译计算模型进行研究之后 ,以对数相似性模型为基础 ,采用迭代策略实现了翻译词典获取。实验表明 ,该方法能够有效地提高词典获取的正确率 ,提高词典编撰效率  相似文献   

13.
汉语句法分析是汉语研究和中文信息化处理中的一个关键环节,同时也是难点之一,面向汉语句法分析的辅助系统能为这个领域的研究与实践带来便利。本文概述了句法分析辅助系统的体系结构和基本功能,详细分析了系统实现中的两个关键算法,即括号匹配算法和句法解析算法,初步实验结果表明辅助系统效果良好,达到设计目的。  相似文献   

14.
路高飞  韩普  沈思 《图书情报工作》2012,56(24):71-76,126
采用普通最小二乘法和最大似然估计两种方法分别对Zipf定律的分布进行拟合比较研究。普通最小二乘法是目前曲线拟合中普遍采用的方法,而最大似然估计是曲线拟合更为合理的方法。分别利用三组中文和三组英文语料,对两种方法进行对比实证研究,结果发现最大似然估计方法的拟合更合理,对Zipf定律的拟合比普通最小二乘法好,同时发现英文词汇比中文更好地符合Zipf定律分布,即中文语料不严格符合经典的Zipf定律分布。本研究可以为幂律拟合的研究提供一些参考。  相似文献   

15.
张晶 《编辑学报》2023,(2):183-186
母语和英语的双语出版形式是新发展格局形势下的新需求,也是中文科技期刊实现稳定发展的有效路径。中文科技期刊应树立双语出版理念,积极探索适合自身发展的双语出版模式。《中华消化杂志》在实际探索中,坚持内容为王,积极与同行期刊合作,兼顾国内外读者需求,不仅注重原创论文的双语出版,还以中文全文或长摘要译文形式刊登我国学者在国外期刊发表的英文全文,并关注共识与指南的编译工作。建议在具体实践过程中,以英文全文来稿为主,中文稿翻译英文为辅,日常出版中重视英文长摘要撰写,围绕我国科研成果开展约稿和出版工作,借助多方平台发布,借力双语,强劲发展我国中文科技期刊,为实现汉语学术国际化不懈努力。  相似文献   

16.
姜韶华  党延忠 《情报学报》2006,25(3):301-305
中英文混合术语可作为未登录词处理、加权处理和歧义消解等的辅助信息,并有助于提高中文信息处理的质量。依据长度递减与串频统计思想,本文提出了一种中英文混合术语的抽取方法。该方法不需要词典,不需要事先进行语料库的学习,不需要建立字索引,而是依靠统计信息,抽取出支持度大于等于阈值的中英文混合术语。该算法能够有效地抽取出文本中新涌现的通用词、专业术语及专有名词。实验显示该方法不受语料限制,能够快速、准确地进行中英文混合术语的抽取。  相似文献   

17.
[目的/意义]归纳分析知识科学视角下国际知识融合研究主题和内容,探索其研究趋势,以期为图书情报领域开展知识融合研究,进而促进知识服务和情报研究提供参考和借鉴。[方法/过程]系统梳理Web of Science中1990-2015年的相关文献,通过逐篇阅读、提炼和总结,从实现路径、评价、系统和应用研究4个方面进行主题分析。[结果/结论]知识融合的实现路径方面主要包括基于语义规则、基于贝叶斯网络、基于D-S理论和基于知识挖掘的知识融合;知识融合评价研究方面开发了具备属性值的融合知识测度和自适应评价机制;知识融合系统研究方面,在经典的KRAFT知识融合系统基础上,开发了KnoFuss等知识融合系统;知识融合应用研究方面,主要有面向网格环境、面向近似知识、面向网络文本和面向企业知识的知识融合。未来几年知识融合的研究趋势有:知识体系结构的优化,融合算法的改进,与相关学科的交叉以及结合大数据环境等社会背景和面向多层次、个性化、创新型知识服务方面的研究。  相似文献   

18.
分类搜索引擎类目体系研究   总被引:49,自引:0,他引:49  
论述分类搜索引擎类目结构的编制依据、大类结构、类目体系的特点等;对存在的问题展开讨论。  相似文献   

19.
曹雁  肖忠华 《编辑学报》2015,27(2):130-133
基于涵盖12个理工科学科的科技期刊英文摘要语料库,利用语料库方法对163个语言特征的频率进行因子分析,系统比较了中外科技期刊英文摘要的差异.结果显示,2类摘要在副词、第一人称代词、前置性修饰语以及被动语态的使用上存在显著的功能性差异.国内英文摘要多数不善于使用副词加强语气,有意规避第一人称代词,缺少与读者的交互,而过多的前置性修饰语和被动语态无形中增加了阅读困难,与国际学术界提倡的直接简洁的写作风格仍有偏差.我们分析了造成这些差异的可能原因,并对国内科技期刊英文摘要写作提出建议.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号