基于机器学习的文本聚类描述算法研究 |
| |
引用本文: | 章成志.基于机器学习的文本聚类描述算法研究[J].情报学报,2009,28(2). |
| |
作者姓名: | 章成志 |
| |
作者单位: | 南京理工大学经济管理学院信息管理系,南京,210094;中国科学技术信息研究所,北京,100038 |
| |
基金项目: | 国家科技支撑计划重点项目,南京理工大学青年科研扶持基金,南京理工大学科研启动基金,江苏省研究生培养创新工程项目 |
| |
摘 要: | 传统的聚类算法直接用于文本聚类这一应用上,存在的突出问题就是传统的聚类算法只负责将对象进行聚类,不负责对聚类后生成的类簇进行概念描述和解释.标注文本集合聚类后生成的类簇被称为聚类描述问题.聚类描述可以帮助用户迅速确认生成的文档类别与其需求是否相关,它是文本聚类应用中一项重要并富有挑战性的任务.针对文本聚类结果可读性较弱问题,本文提出了一种增强聚类结果的可理解性与可读性的算法,即基于支持向量机的文本聚类结果描述算法.实验结果表明基于支持向量机的聚类描述算法所取得的效果要优于常规的聚类结果描述方法.
|
关 键 词: | 聚类描述 文本聚类 支持向量机 机器学习 |
本文献已被 CNKI 万方数据 等数据库收录! |
|