首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于维基百科的中文短文本分类研究
引用本文:范云杰,刘怀亮.基于维基百科的中文短文本分类研究[J].现代图书情报技术,2012(3):47-52.
作者姓名:范云杰  刘怀亮
作者单位:西安电子科技大学经济管理学院
摘    要:针对中文短文本自身词汇个数少、描述信息弱的缺陷,引入特征扩展的方法辅助分类。借助网络知识库维基百科抽取相关概念,并采用统计规律与类别信息相结合的方式计算概念间相关度,建立语义相关概念集合,对短文本的特征向量进行扩展,从而有效补充短文本的语义特征。对比实验表明,基于维基百科的短文本分类方法能够提高短文本分类的效果。

关 键 词:短文本  维基百科  文本分类  特征扩展

Research on Chinese Short Text Classification Based on Wikipedia
Fan Yunjie Liu Huailiang.Research on Chinese Short Text Classification Based on Wikipedia[J].New Technology of Library and Information Service,2012(3):47-52.
Authors:Fan Yunjie Liu Huailiang
Institution:Fan Yunjie Liu Huailiang(School of Economics and Management,Xidian University,Xi’an 710071,China)
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号