基于机器学习的文本聚类描述算法研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于机器学习的文本聚类描述算法研究

引用本文：	章成志.基于机器学习的文本聚类描述算法研究[J].情报学报,2009,28(2).

作者姓名：	章成志

作者单位：	南京理工大学经济管理学院信息管理系,南京,210094;中国科学技术信息研究所,北京,100038

基金项目：	国家科技支撑计划重点项目，南京理工大学青年科研扶持基金，南京理工大学科研启动基金，江苏省研究生培养创新工程项目

摘要：	传统的聚类算法直接用于文本聚类这一应用上,存在的突出问题就是传统的聚类算法只负责将对象进行聚类,不负责对聚类后生成的类簇进行概念描述和解释.标注文本集合聚类后生成的类簇被称为聚类描述问题.聚类描述可以帮助用户迅速确认生成的文档类别与其需求是否相关,它是文本聚类应用中一项重要并富有挑战性的任务.针对文本聚类结果可读性较弱问题,本文提出了一种增强聚类结果的可理解性与可读性的算法,即基于支持向量机的文本聚类结果描述算法.实验结果表明基于支持向量机的聚类描述算法所取得的效果要优于常规的聚类结果描述方法.
关键词：	聚类描述文本聚类支持向量机机器学习
本文献已被 CNKI 万方数据等数据库收录！