首页 | 本学科首页   官方微博 | 高级检索  
     检索      

K-均值文本聚类算法在智能答疑系统中应用
引用本文:程铃钫,何月顺.K-均值文本聚类算法在智能答疑系统中应用[J].科技广场,2009(1).
作者姓名:程铃钫  何月顺
作者单位:东华理工大学信息工程学院,江西,抚州,344000
摘    要:本文将数据挖掘算法应用干智能答疑系统中,提出了一套基于数据挖掘算法的答疑设计方案并加以改进,传统的K-均值算法聚类虽然速度快,在文本聚类中易于实现,但其同样依赖于所有变量,聚类效果往往不尽如人意.为了克服这一缺点,提出一种改进的K-均值文本聚类算法.它在K-均值聚类过程中,向每一个聚类簇中的关键词自动计算添加一个权重,重要的关键词赋予较大的权重.经过实验测试.获得了一种基于子空闻变量自动加权的适合文本数据聚类分析的改进算法,它不仅可以在大规模、高维和稀疏的文本数据上有效地进行聚类.还能够生成质量较高的聚类结果.实验结果表明基于子空闻变量自动加权的K-均值文本聚类算法是有效的大规模文本数据聚类算法.

关 键 词:文本聚类  K-均值  变量加权  子空间

Application on K-means Text Clustering Algorithm in Intelligent Question Answering System
Cheng Lingfang,He Yueshun.Application on K-means Text Clustering Algorithm in Intelligent Question Answering System[J].Science Mosaic,2009(1).
Authors:Cheng Lingfang  He Yueshun
Institution:Information Engineering School;East China Institute of Technology;Jiangxi Fuzhou 344000
Abstract:The paper applies the data mining algorithm into the QA system,puts forward a set of scheme about question answering system based on data mining algorithm and improves it. K-means is one of the widely used text clustering techniques due to its rapidity, simplicity and high scalability. However, since tradi- tional K-means algorithm treats all variables equally as well as the sparse of text characteristicmatrix, it is not good enough in clustering effect. In this paper it proposes an improved K-means text cl...
Keywords:Text Clustering  K-means  Featuresweight  Subspace  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号