首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于跨语言文本分类的跨语言特征提取方法研究
引用本文:高影繁,王惠临,徐红姣.基于跨语言文本分类的跨语言特征提取方法研究[J].情报学报,2011,30(12).
作者姓名:高影繁  王惠临  徐红姣
作者单位:中国科学技术信息研究所,北京,100038
基金项目:"十一五"国家科技支撑计划项目,中国博士后科学基金,中国科学技术信息研究所2010重点项目,中国科学技术信息研究所2010学科建设
摘    要:随着文本分类算法的实用化和多语种信息的日益丰富,当机构或组织的文档管理部门日益依赖自动文本分类时,如何解决多语种文档的归类问题成为新的研究热点,跨语言文本分类技术就是在这样的背景下提出的.本文以国家图书文献中心(NSTL)的多语种语料为研究对象,以一部科技类的汉英科技词典为资源工具,提出了一种基于跨语言文本分类的跨语言特征提取方法,实验结果验证了在简单翻译资源条件下对科技文献进行跨语言分类的可行性,也为下一阶段建立实用跨语言文类系统奠定了基础.

关 键 词:最长短语识别  类别信息消歧  特征提取

Research on Cross-Language Feature Extraction for Cross-Language Text Categorization
Gao Yingfan,Wang Huilin,Xu Hongjiao.Research on Cross-Language Feature Extraction for Cross-Language Text Categorization[J].Journal of the China Society for Scientific andTechnical Information,2011,30(12).
Authors:Gao Yingfan  Wang Huilin  Xu Hongjiao
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号