融合不同语义知识的中国古代典籍机器翻译研究 |
| |
引用本文: | 吴梦成,林立涛,吴娜,许乾坤,王东波.融合不同语义知识的中国古代典籍机器翻译研究[J].情报资料工作,2024(2):97-104. |
| |
作者姓名: | 吴梦成 林立涛 吴娜 许乾坤 王东波 |
| |
作者单位: | 1. 南京农业大学信息管理学院;2. 南京农业大学人文与社会计算研究中心;3. 南京农业大学领域知识关联研究中心;4. 南京大学信息管理学院 |
| |
基金项目: | 国家社会科学基金重大项目“中国古代典籍跨语言知识库构建及应用研究”(批准号:21&ZD331)的研究成果之一; |
| |
摘 要: | 目的/意义]文章旨在探究将不同语义知识融入机器翻译模型能否增强机器翻译的效果以及何种语义知识的作用更为显著,以助力机器翻译研究与中华优秀传统文化的传承与传播。方法/过程]研究选取了30万对精加工的《二十四史》“古代汉语-现代汉语”平行语料作为实验数据,基于神经机器翻译OpenNMT模型,通过三种不同的特征融合方法,将词边界知识、词性知识、实体知识和依存句法知识分别融入机器翻译模型的训练过程中。结果/结论]不同语义知识与模型的融合对典籍翻译效果有不同的影响,词边界知识、词性知识、实体知识对机器翻译任务有一定的贡献且实体知识的贡献最大,依存句法知识无明显作用。
|
关 键 词: | 古籍文献 语义知识 《二十四史》 机器翻译 |
|
|