首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 671 毫秒
1.
为了改善传统ID3算法在分类属性选择上存在多值偏向性的不足,提出基于PCA的决策树优化算法。在普通基于PCA 的决策树改进算法中,存在数据经降维处理后代表性不强的问题,导致算法需经过多次数据运行后,准确率才能小幅提升。在ID3算法基础上,在分类前两次提取属性特征值,并计算了需要分类的数据量,也即对原始数据进行最重要的属性选择。在子树建立之后,再进行数据的降维合并选择。采用UCI数据库中的3个数据集对改进算法进行验证,结果表明改进算法的平均准确率达到94.6%,相比传统ID3算法与普通PCA决策树优化算法分别提升了1.6%和0.6%。因此,基于PCA的决策树算法能在一定程度上提升结果准确率,具备一定的应用价值。  相似文献   

2.
针对银行CRM中的数据冗余大、数据挖掘效率低的问题,将基于属性约简的数据预处理方法应用在银行CRM中.使用决策表属性重要度属性约简算法简化客户贡献度决策表,实现决策表条件属性的归约.通过该算法在某商业银行CRM数据预处理过程中的实际应用,证实约简算法应用在银行CRM系统是有效可行的.  相似文献   

3.
提出了一种改进的基于粗集和Tabu搜索的属性约简算法。首先利用粗集中的一般约简算法,确定开始进行Tabu搜索的属性个数;然后逐渐减少属性个数,利用。Tabu搜索搜寻含有较少属性个数的属性约简。在进行Tabu搜索时,利用任一属性约简必包含属性核来减少算法的计算时间和搜索空间。实例表明,改进后的算法既具有较高的算法效率,又能以较大的概率得到最小属性约简。  相似文献   

4.
INTRODUCTION Nowadays, as a large number of residential blocks and college campuses are being constructed nationwide in China, improvement in the quality of residential community becomes a rising issue of city policy and urban planning. Layouts of open spaces in residential areas are predicated on their ability to deliver both a mechanism to maintain the viability of citizens’ outdoor lives and a treatment to alleviate the high-density of urban constructions. What kinds of residential o…  相似文献   

5.
基于属性依赖度的图像隐写分析算法   总被引:1,自引:1,他引:0  
针对文献[6]将粗糙集属性约简应用于信息隐藏盲检测中检测正确率有所下降的问题,提出了基于属性依赖度的图像隐写分析算法,该算法利用粗糙集理论属性依赖度提出决策表离散优化的措施,寻找一种提高整个决策表分类能力的办法,以达到提高检测正确率的目的。首先利用该算法对决策表进行优化,其次通过属性约简得到最小约简,最后采用支持向量机构造分类器,对Cox、Piva两种不同隐写术进行实验结果表明,使用该算法不仅检测正确率有较大提高,而且检测效率也有较大提高。  相似文献   

6.
属性约简是粗糙集理论的核心问题之一,寻找最优约简现已证明是NP—hard问题。本文在差别矩阵的基础上,采用贪心算法的策略,提出了一种启发式算法来寻求最优约简。该算法不仅能在有核的决策表中通过核进行属性扩充求得最优约简,而且在无核的决策袁中也能根据属性在差别矩阵中出现的频率求得最优约简。经实例验证该算法是有效的。  相似文献   

7.
决策树分类器是一个重要的数据挖掘问题,在数据流上建立决策树的关键问题是如何计算内部节点的最佳分裂标准。现有的算法有的不能处理数值型的属性,有的计算代价太高。本文采用将数值型的属性值分成适当的区间,根据它们gini index值的特殊性质,确定具有最大gini indes梯度的区间,因而可以快速地计算最佳分裂点,实现在流数据上快速地建立决策树。  相似文献   

8.
为了缩减知识推理空间,提高分布式环境下知识处理的效率,提出分布式概念格属性约简的理论框架.基于粗糙集理论的思想,从子形式背景和全局形式背景的角度,刻画了核心属性、相对必要属性和绝对不必要属性的属性特征,给出属性约简的判定定理.在此基础上,给出概念格的分布式属性约简方法:首先,使用现有的约简方法分别计算各子形式背景的约简,然后,逐一利用各子背景的约简,通过合并计算得到全局形式背景的约简.给出了算法的实现并用实例验证了它的有效性.分布式约简有效避免了使用现有方法而引起的数据安全和网络通信等问题,提高了约简的计算效率.  相似文献   

9.
本文主要采用主分量分析方法和二次判别分析(QDA)有监督分类的方法来对基因芯片(微阵列)数据进行分析.PCA是一种提取海量的数据有效特征的有效方法.可以获得与原来基因芯片数据更为接近的成分的提取特征的效果.实验表明采用PCA方法事先对数据处理不可以提高基因芯片数据分析的准确性.得出结论可为工业应用提供科学依据.  相似文献   

10.
本文主要采用两种降维的方法和k-近邻法(KNN)有监督分类的方法来对基因芯片(微阵列)数据进行分析。PCA,PLS是一种提取海量的数据有效特征的有效方法,可以获得与原来基因芯片数据更为接近的成分的提取特征的效果。比较PCA降维方法和PLS降维方法对KNN统计判别分类的效果。  相似文献   

11.
决策分析中的数据无量纲化方法比较分析   总被引:1,自引:0,他引:1  
决策分析中多属性决策问题的各属性通常具有不同的量纲,不同量纲的不可比较性给决策带来了困难.对数据进行规范化处理能够实现各属性数据的可综合性与可比性.对决策分析中常用的数据规范化方法进行比较分析,提出在不同应用中对最佳规范化方法的选择,能够使得决策方案更加合理、优化.  相似文献   

12.
基于粗糙集的属性约简算法   总被引:1,自引:0,他引:1  
属性约简是粗糙集理论研究的关键问题之一,现已证明寻找一个决策表的最优约简是N P-hard问题。本文首先介绍可辨识矩阵属性约简的基本算法并对求核算法进行了改进。在此基础上给出决策表中属性重要性的两种度量,并以此为启发式信息,提出了一种属性约简的启发式算法。最后,实验结果表明,该算法在大多数情况下能有效地获得决策表的最优约简。  相似文献   

13.
决策树是数据挖掘中的一种重要分类方法.在此以粗糙集理论中的正域为启发式函数,设计了一种新的、有效的决策树构造方法.该算法具有较大的灵活性.能从测试属性空间逐次删除已使用过的属性.避免对这些属性进行重复测试,减少测试空间,降低了树的复杂性,从而提高了分类效率.最后,实例验证了算法的可行性与有效性.  相似文献   

14.
根据粗糙集理论,讨论属性值的约简方法。属性值约简是在属性约简的基础上,对决策表中的每一条记录去掉冗余属性值,从而构成一个最小的决策规则集。重点根据启发式值约简方法,对隐形眼镜数据进行分析,为后序的数据分析减少冗余信息。  相似文献   

15.
针对传统信用评价方法分类精度较低、数据集属性变量间存在相关性等问题,提出基于主成分分析的稀疏贝叶斯学习(PCA-SBL)算法。首先对数据集特征变量进行主成分分析,使降维后的变量无相关性|其次,对主成分分析后的数据进行稀疏贝叶斯分类|最后将 PCA-SBL 分类方法分类精度与传统分类方法精度进行比较。分析发现,在 German Credit Data 和 Australian Credit Data 上,与传统 KNN、朴素贝叶斯、SVM、随机森林、决策树相比,改进的 SBL 算法分类精度平均提高了 5.26%、4.65%、2.11%、2.125%、4.66%,与稀疏贝叶斯学习算法(SBL)相比,平均提高 0.965%,从而证明 PCA-SBL 算法具有更高的分类效果。  相似文献   

16.
We present novel vector permutation and branch reduction methods to minimize the number of execution cycles for bit reversal algorithms. The new methods are applied to single instruction multiple data (SIMD) parallel implementation of complex data floating-point fast Fourier transform (FFT). The number of operational clock cycles can be reduced by an average factor of 3.5 by using our vector permutation methods and by 1.1 by using our branch reduction methods, compared with conventional implementations. Experiments on MPC7448 (a well-known SIMD reduced instruction set computing processor) demonstrate that our optimal bit-reversal algorithm consistently takes fewer than two cycles per element in complex array operations.  相似文献   

17.
基于核独立成分分析的静息态fMRI数据研究(英文)   总被引:1,自引:0,他引:1  
为了方便提取静息态默认网络,降低功能核磁共振(fMRI)数据复杂度,克服独立成分分析只适合于源信号线性混合的限制,提出了特征降维和非线性变换的框架.首先采用主成分分析对fMRI信号的时间维度进行降维,将原始维度为153 594×128的fMRI数据降至153 594×5,以达到降低计算复杂度的目的,并保留95%的信息成分.然后利用基于高斯核的非线性独立成分分析即核独立成分分析来分析静息态fMRI数据并提取默认网络.实验结果表明,在分析静息态fMRI数据的过程中,核独立成分分析不仅能准确提取默认网络,而且降低了噪声,所得到的结果优于普通独立成分分析.  相似文献   

18.
针对属性值为梯形模糊数,属性权重未知,决策者对方案有梯形模糊数互补判断矩阵的模糊多属性群决策问题,提出一种群决策方法.给出了由综合属性值得到方案间相互比较的梯形模糊数互补判断矩阵的转化方法.借助梯形模糊数间距离的顶点法表示,建立模糊规划模型,最小化两类梯形模糊数互补判断矩阵间的偏差.求解模型,得到属性的精确权重.进而根据综合属性值对方案排序.最后给出一个数值例子验证所提方法的有效性.  相似文献   

19.
提出了一种基于多属性分类的KNN改进算法,可有效提高传统的欧几里德KNN算法和基于信息熵的KNN改进算法的分类准确度。首先,按照单个属性不同属性值的个数占整个属性包含样本的比例进行属性的分类,分为基于信息熵的KNN算法处理的离散属性和基于传统欧几里德KNN相似度处理的连续属性两类,然后分别对不同属性进行区别处理;其次,将两类不同处理后得到的结果按比例求和作为样本之间的距离;最后,选取与待测样本的距离最小的k个样本判断测试样本的决策属性类别。  相似文献   

20.
To improve the accuracy of sand-dust storm forecast system, a sand-dust storm ensemble forecast model based on rough set (RS) is proposed. The feature data are extracted from the historical data sets using the self-organization map (SOM) clustering network and single fields forecast to form the feature values with low dimensions. Then, the unwanted attributes are reduced according to RS to discretize the continuous feature values. Lastly, the minimum decision rules are constructed according to the remainder attributes, namely sand-dust storm ensemble forecast model based on RS is constructed. Results comparison between the proposed model and the back propagation neural network model show that the sand-storm forecast model based on RS has better stability, faster running speed, and its forecasting accuracy ratio is increased from 17.1% to 86.21%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号