首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 450 毫秒
1.
文章介绍了“中日两国机器翻译技术合作研讨会”的召开背景和会议概要。其中,重点介绍与会议相关的日本“日中·中日语言处理技术的开发研究”项目,以及在本次会议中基于实例的机器翻译技术创始人长尾真先生的主旨发言内容。最后,对会议取得的成果予以总结。  相似文献   

2.
面向甲骨文的实例机器翻译技术研究   总被引:1,自引:0,他引:1  
提出基于实例的甲骨文释文机器翻译方案,研究实例库的构建流程、实例句相似度算法和实例检索算法等关键技术,并通过实现一个机器翻译系统,验证所提出方法的有效性。实验结果表明,该方法得到的翻译结果能够满足甲骨文学习者的阅读要求。  相似文献   

3.
平行语料库的规模对于统计机器翻译性能的提高具有重要作用,但是平行语料库的人工构建成本很高。针对这个问题,本文提出了一种低成本高效率的平行语料构建方法,利用枢轴语言作为桥梁,借助已有的机器翻译技术并融合主动学习方法构建目标语言对的大规模高质量平行语料库。本文通过以英语作为枢轴语言构建日汉平行语料库的实例研究,利用成熟的基于短语的统计机器翻译技术,描述了基于译文自动评测的良好译文选择方法、基于主动学习的语料选取方法、以及翻译系统的更新迭代和评价实验。实验结果表明,本文提出的方法能够快速构建日汉平行语料,并有效提高日汉翻译系统的性能。  相似文献   

4.
本文以多语言科技信息服务为立足点,结合中日两国面向科技文献的机器翻译研究现状,介绍了两国近几年开展的机器翻译合作项目的情况,包括合作背景与基础、知识产权、具体合作内容与成果,以及在机器翻译实用化方面的一些思考。  相似文献   

5.
张家俊  宗成庆 《情报工程》2017,3(3):021-028
近两年来,神经机器翻译(Neural Machine Translation, NMT)模型主导了机器翻译的研究,但是统计机器翻译(Statistical Machine Translation, SMT)在很多应用场合(尤其是专业领域)仍有较强的竞争力。如何利用深度学习技术提升现有统计机器翻译的水平成为研究者们关注的主要问题。由于语言模型是统计机器翻译中最核心的模块之一,本文主要从语言模型的角度入手,探索神经网络语言模型在统计机器翻译中的应用。本文分别探讨了基于词和基于短语的神经网络语言模型,在汉语到英语和汉语到日语的翻译实验表明神经网络语言模型能够显著改善统计机器翻译的译文质量。  相似文献   

6.
高影繁  李辉  徐红姣  崔笛 《情报工程》2017,3(3):086-096
本文提出了一种采用众包工作模式的科技领域日汉机器翻译辅助平台的构建方法。在充分调研众包生产模式、质量控制等研究和实践的基础上,设计了集用户管理、团队管理、语料管理、机器辅助翻译、术语辅助翻译等功能为一体的双语句对生产平台,针对不同角色和不同技术类别分别构建出相应的功能模块。该平台在众包工作模式的基础上结合了多源信息辅助译者完成翻译,翻译效率高且翻译成本低,平台的开发和运行为科技领域实用型日汉机器翻译系统的建设提供了有力支撑。  相似文献   

7.
近年,中文信息在日本受到高度瞩目,为满足日文用户无障碍地检索中文信息的需求,以跨语言信息检索为重要目的之一的日中·中日翻译系统在日本受到了从政府到企业的高度重视,该领域的研究极其活跃.文章在重申跨语言信息检索概念、介绍日本机器翻译研究历史基础之上,论述了日本日中·中日机器翻译系统国家项目、大学研究项目和企业研究项目的整体状况.最后,给出了在跟踪、借鉴日本经验同时需要注意的相关问题.  相似文献   

8.
跨语言检索中机器翻译技术的应用和进展   总被引:2,自引:0,他引:2  
本文以跨语言检索为背景,主要介绍了机器翻译技术的应用和进展.文章介绍了跨语言检索中机器翻译技术的应用形式,简单回顾了机器翻译技术发展历史中出现的各种方法及其基本思想和优缺点,特别是近年来统计机器翻译的发展.本文通过一个实例较为详细地介绍了目前主流的基于短语的统计机器翻译原理,然后通过一个实际的新闻长句子对几个典型的基于规则的和基于统计的机器翻译系统的翻译结果给出了细致的比较和分析.最后对机器翻译在跨语言检索中的应用前景做出了展望.  相似文献   

9.
刘凯  王永成  毛军 《情报学报》2005,24(3):294-298
本文提出了一种适合机器翻译的标记语言MTML(MachineTranslationMarkupLanguage)。针对机器翻译研究中对混合策略处理的需求,我们将传统的机器翻译方法与模式匹配及XML等技术相结合,形成了一套灵活的、可扩展的处理机制,方便了基于规则的翻译与数据驱动的翻译之间的交互。目前已经将该标记语言应用到翻译试验系统之中,获得了较好的效果  相似文献   

10.
本文介绍了基于实例的机器翻译引擎KyotoEBMT 的框架。为了保留语句的非局部结构,我们的系统运用“树到树”的方法对源语言和目标语言都进行了依存句法分析。我们的系统凭借在线的实例匹配和灵活的解码装置确保其最优的翻译效果。实验表明:该系统与当前流行的基于短语的统计机器翻译系统的BLEU 得分相当。该系统已开源可得。  相似文献   

11.
多机器翻译系统融合技术能够对不同机器翻译系统的输出结果有效地进行融合产生更好的翻译性能,因此该技术成为机器翻译研究领域的一个热点问题.常用的多机器翻译系统融合技术可以分为句子级、短语级和词级融合.在对不同级别的系统融合技术进行分析的基础上,本文提出基于词和短语的多机器翻译系统融合方法.首先,采用词级的系统融合技术构建混淆网络,将混淆网络转化为短语表.然后,基于该短语表利用短语级的系统融合技术中的再解码方法进行混淆网络解码生成融合结果.该方法既保证了融合系统所构建的混淆网络的最大可能性,又可以利用更多的特征进行混淆网络解码.我们将基于词和短语的多机器翻译系统融合方法在两个测试集上分别实验并进行比较,获得了较为满意的翻译效果.  相似文献   

12.
利用计算机编制辞典索引北京文献处王懋江吴振益新时代出版社与日本工业(株)调查联合会合作编辑的《英日汉工业技术大辞典》历经数载已于1993年9月正式出版发行。此词典收词23万余词条,经过中日两国技术专家筛选审校,辞义准确。词典正文3200多页(16开)...  相似文献   

13.
资讯     
《青年记者》2004,(11):70-73
观点《中国青年报》:警惕“西化”的中国主流出版媒体10月15日,该报发表署名为读者的评论指出,由中国人编著的大型汉日双语词典《新汉日词典》,在商务印书馆与日本出版社协议合作出版后,被日本人进行了多处肆意篡改增加。可是这样一本中国人编纂并由商务印书馆拥有版权的辞典,为什么如此轻易地就让日方肆意篡改和糟蹋?为什么编者和中国出版方商务印书馆能够容忍日方随意更改词条释义?如此严重的肆意篡改,是否经过商务印书馆  相似文献   

14.
机器翻译(MT ) 和机器辅助翻译(CAT ) 是两个既有联系又有着本质区别的概念。本文回顾了机器翻译的历史, 比较了机器翻译和机器辅助翻译各自的特点, 着重论述了翻译记忆软件的工作原理、特点及其应用。  相似文献   

15.
鉴于专利术语的翻译要求高度的准确性和专业性,而专利术语的自动获取翻译对于机器翻译、词典自动编纂、跨语言信息检索等自然语言处理具有重要的实用价值,从双语的专利摘要中分别抽取术语,之后融合多术语识别方法,采用规则翻译和统计机器翻译来动态地辅助词汇化方法进行术语对齐,以期尽可能多地在双语的专利文献中获取准确的专利术语翻译对。在专利文摘中进行实验验证的结果是:专利术语翻译对的准确率达到80%。  相似文献   

16.
    
在科研全球化背景下,中日机器翻译的开发研究对促进中日科技信息的双向传播、促进中日科技战略合作、促进中日创新的可持续发展至关重要。同时,中日机器翻译的应用示范,对促进亚洲多语机器翻译、亚洲之间的信息交流和合作以及亚洲整体的科技发展都将作出积极的贡献。  相似文献   

17.
[目的/意义]文章旨在探究将不同语义知识融入机器翻译模型能否增强机器翻译的效果以及何种语义知识的作用更为显著,以助力机器翻译研究与中华优秀传统文化的传承与传播。[方法/过程]研究选取了30万对精加工的《二十四史》“古代汉语-现代汉语”平行语料作为实验数据,基于神经机器翻译OpenNMT模型,通过三种不同的特征融合方法,将词边界知识、词性知识、实体知识和依存句法知识分别融入机器翻译模型的训练过程中。[结果/结论]不同语义知识与模型的融合对典籍翻译效果有不同的影响,词边界知识、词性知识、实体知识对机器翻译任务有一定的贡献且实体知识的贡献最大,依存句法知识无明显作用。  相似文献   

18.
汉英双向机器翻译系统BT863的研究与实现   总被引:3,自引:2,他引:1  
本文将经验主义方法与传统的基于规则的理性主义体系结合起来,提出了一种面向实例、基于模式的机器翻译路线,并在这一翻译路线的指导下,以分析与生成一体、面向生成为基本实现策略,实现了一个面向汉英日常用语的汉英双向机器翻译系统BT863。  相似文献   

19.
丁亮  姚长青  何彦青  李辉 《情报工程》2017,3(3):064-076
统计机器翻译往往存在待翻译文本来源多样和领域不一致的问题。为了提升面向不同领域的文本的翻译质量,需要根据待翻译文本对训练语料进行筛选以达到领域自适应的目的。目前统计机器翻译的领域自适应方法以目标数据为基准,着重利用统计技术对训练数据或者翻译模型进行领域的适应调整,缺乏明确的领域标签。本研究在本组之前研究基础上利用深度学习中卷积神经网络 (Convolutional neural network, CNN)对短文本进行建模,构建合适的网络结构进行有监督学习,获取完整的句子语义信息,按照待翻译文本的领域信息对训练语料进行归类筛选,获取与待翻译文本领域一致的训练数据,并将其应用到统计机器翻译中。本文采用万方英文摘要在统计机器翻译系统上进行测试,仅利用部分训练数据就得到了超越原始训练数据BLEU 打分的翻译结果,证明了本研究的有效性和可行性。  相似文献   

20.
面向专利领域的机器翻译近年来已成为机器翻译的重要应用领域之一。本文提出了一个汉英专利文本机器翻译融合系统,该系统以规则系统为主导搭建,并把规则翻译方法和基于短语的统计翻译系统相结合。在融合系统中,规则系统主要负责源语言的分析和转换阶段的处理,生成相应的源语言句法分析树与转换树,并确定目标语言的基本句法框架。统计翻译系统则在目标语生成阶段根据生成的目标语句法结构寻找合适的对译词形,并产生最终的候选译文。通过利用自动评测指标对融合系统进行测试,融合系统的结果均优于单个规则系统和统计系统的结果,表明了融合方法的有效性和可行性,可以改善系统的翻译性能,提高翻译质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号