面向社区问答的中文短文本分类算法研究 |
| |
引用本文: | 赵辉,刘怀亮.面向社区问答的中文短文本分类算法研究[J].现代情报,2013,33(10):70-74. |
| |
作者姓名: | 赵辉 刘怀亮 |
| |
作者单位: | 西安电子科技大学经济与管理学院, 陕西 西安710071 |
| |
摘 要: | 为解决社区问答系统中的问题短文本特征词少、描述信息弱的问题,本文利用维基百科进行特征扩展以辅助中文问题短文本分类。首先通过维基百科概念及链接等信息进行词语相关概念集合抽取,并综合利用链接结构和类别体系信息进行概念间相关度计算。然后以相关概念集合为基础进行特征扩展以补充文本特征语义信息。实验结果表明,本文提出的基于特征扩展的短文本分类算法能有效提高问题短文本分类效果。
|
关 键 词: | 社区问答 维基百科 特征扩展 短文本分类 |
本文献已被 维普 等数据库收录! |
| 点击此处可从《现代情报》浏览原始摘要信息 |
| 点击此处可从《现代情报》下载免费的PDF全文 |
|