基于《现代汉语语义分类词典》的文本聚类方法 |
| |
引用本文: | 刘金岭.基于《现代汉语语义分类词典》的文本聚类方法[J].情报杂志,2010,29(11). |
| |
作者姓名: | 刘金岭 |
| |
基金项目: | 淮安市科技局计划项目,淮阴工学院重点基金 |
| |
摘 要: | 给出了一种基于语义概念的高效中文文本聚类方法,该方法是从文本的本身出发,利用<现代汉语语义分类词典>的级类主题词,在高维的文本向量集中提取概念元组,形成表示聚类结果的高层概念,最后基于这些高层概念进行样本划分,从而完成整个文本的聚类过程.试验结果表明,该聚类算法有较好的聚类结果且有较高的执行效率.
|
关 键 词: | 中文文本 概念元组 聚类 |
Text Clustering Method Based on Thesaurus of Modern Chinese |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|