首页 | 本学科首页   官方微博 | 高级检索  
     检索      

双语潜在语义对应分析及在跨语言文本分类中的应用研究
引用本文:罗远胜,王明文,勒中坚,陆旭.双语潜在语义对应分析及在跨语言文本分类中的应用研究[J].情报学报,2013,32(1).
作者姓名:罗远胜  王明文  勒中坚  陆旭
作者单位:1. 江西财经大学现代教育技术中心,南昌,330013;江西财经大学信息管理学院,南昌,330013
2. 江西师范大学计算机信息工程学院,南昌,330022
3. 江西财经大学信息管理学院,南昌,330013
4. 江西财经大学现代教育技术中心,南昌,330013
基金项目:国家自然科学基金项目,江西省教育厅科技项目
摘    要:双语文本对应分析在处理多语言文本数据、克服语言障碍等方面有着重要的作用,基于语料库技术的跨语言潜在语义索引方法没有充分考虑双语的语义相关性.本文将双语平行文档看作同一语义内容的两种语言表达,运用偏最小二乘方法构建双语文本的语义相关性,为每种语言建立单独的潜在语义空间,并在这两个空间上实现跨语言的分类任务.在香港政府网中英双语新闻的实验结果显示,本文方法构造的双语潜在语义空间上完成的跨语言和单语言文本分类性能接近或优于原始特征空间的单语言分类,并具有良好的稳健性.

关 键 词:双语文本对应分析  双语潜在语义空间  偏最小二乘  跨语言文本分类

Bilingual Latent Semantic Corresponding Analysis and Its Application to Cross-lingual Text Categorization
Luo Yuansheng , Wang Mingwen , Le Zhongjian , Lu Xu.Bilingual Latent Semantic Corresponding Analysis and Its Application to Cross-lingual Text Categorization[J].Journal of the China Society for Scientific andTechnical Information,2013,32(1).
Authors:Luo Yuansheng  Wang Mingwen  Le Zhongjian  Lu Xu
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号