首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于邻近样本类别判断的不平衡数据分类算法
引用本文:胡艳.基于邻近样本类别判断的不平衡数据分类算法[J].科技通报,2013(10).
作者姓名:胡艳
作者单位:北京农业职业学院信息技术系,北京,102442
摘    要:数据类间分布不均衡是不平衡数据集分类效果不好的主要原因,为了克服类间分布的不均衡,本文提出了一种基于邻近样本类别判断的不平衡数据分类算法。首先,对待判定样本,计算它的k个最邻近样本,然后将待判定样本的类别指派到它的k个最邻近中的多数类。由于本文所提出的不平衡数据分类算法在类别决策时,只考虑少量的邻近样本的类别,而不是考虑所有的训练样本,因此可以较好地克服类间不平衡对少数类分类结果的影响。在客户流失数据集上的仿真实验充分证明了本文算法能较好地处理不平衡数据分类问题。

关 键 词:不平衡数据集  邻近样本  数据分类  少数类

An Imbalanced Data Classification Algorithm Based on Adjacent Samples Labels Judgment
Hu Yan.An Imbalanced Data Classification Algorithm Based on Adjacent Samples Labels Judgment[J].Bulletin of Science and Technology,2013(10).
Authors:Hu Yan
Abstract:
Keywords:imbalanced data sets  adjacent samples  data classification  the minority class
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号