基于K-means和Label Propagation的半监督网页分类 |
| |
引用本文: | 贺松林,张晖.基于K-means和Label Propagation的半监督网页分类[J].人天科学研究,2011,10(2):49-51. |
| |
作者姓名: | 贺松林 张晖 |
| |
作者单位: | 西南科技大学计算机科学与技术学院,四川绵阳,621000 |
| |
摘 要: | 提出基于图的半监督学习算法,即类别传播算,结合K均值算法改进,用于网页分类。该K均值类别传播方法使用欧式距离的建立带权∈NN图。在这个图中,图节点表示已标记或未标记的网页,边上的权重表示节点的相似度,已标记节点的类别沿着边向邻居节点传播,从而将网页分类问题形式化为类别在图上的传播。结合K均值方法,提高了计算速度以及图方法的归纳能力,经UCI数据集测试,结果表明,此算法比类别传播算法有更好的性能,能够有效地用于半监督网页分类。
|
关 键 词: | 半监督学习 网页分类 图 类别传播 k均值 |
Semi-Supervised Web Classification Based on K-means and Label Propagation |
| |
Abstract: | This paper proposed a graph-based semi-supervised learning method,that is,label propagation algorithm.And improve it with K-means algorithm for web classification.This K-means Label Propagation method constructs a weighted ∈NN graph with Euclidian distanc |
| |
Keywords: | Semi-supervised Learning Web Classification Graph Label Propagation K-means |
本文献已被 维普 万方数据 等数据库收录! |
|