首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
从一个新的思路对基于最小Gini指标的决策树分类算法进行了讨论。简单介绍了CART算法和Gini指标的定义,并且对SLIQ和SPRINT决策树分类技术进行深入的分析。同时对SLIQ算法的时间复杂性和这两种算法的内存管理和性能方面进行了比较和分析。  相似文献   

2.
首先介绍了CRM和数据挖掘的基本理论知识;然后通过数据挖掘在CRM中的主要应用和在CRM中启动数据挖掘的基本步骤两个方面对数据挖掘在CRM中的应用进行了详细的说明;最后对数据挖掘技术中的决策树分类算法应用于客户分类进行了研究,着重探讨了其中的SLIQ算法及其改进算法。  相似文献   

3.
分类技术中的决策树算法分析   总被引:6,自引:0,他引:6  
介绍了解决分类问题的常用方法——决策树。并对决策树的原理及Quinlan的ID3、C4.5两种主要的决策树算法进行了分析。通过分析它们的基本原理以及主要特点,提出了对决策树算法改进的展望。  相似文献   

4.
本文根据决策树分类技术对福建省计算机等级考试中的成绩进行分析和挖掘.首先对成绩数据进行离散化处理,设置成决策树分类的属性数据;接着利用ID3改进算法构建成绩分类的决策树模型,并对其剪枝;最后根据模型给出相应的规则和几个教学建议.实验结果表明,利用决策树分类技术在计算机等级考试中进行挖掘分析的方法是有效可行的.  相似文献   

5.
HTTP隧道是各种木马和间谍软件进行网络通信的主要途径,严重威胁了网络安全。比较有效的算法主要是统计指印方法,统计指印采用的特征较少,对训练集的依赖程度较高,算法的稳定性较差。决策树分类算法提取了网络数据流更多的有效特征。使用决策树分类算法对HTTP隧道数据进行了检测,通过实验结果对比,决策树算法的稳定性更好,精确度和效率更高。  相似文献   

6.
ID3算法是决策树归纳分类算法的一种。通过对ID3算法的计算复杂度分析,提出了利用统计理论知识和条件概率的思想来改进算法,并运用改进算法构造决策树。  相似文献   

7.
决策树算法是数据挖掘系统中一个重要的分类算法,选择合理而有效的测试属性以及对决策树进行适当的修剪是决策树算法的关键内容之一。将决策树算法引入教务管理挖掘系统,并对决策树测试属性的选择算法以及预剪枝算法进行改进。以九江学院学生四级考试信息为例,结果表明改进的决策树算法对于数据挖掘更具可靠性和有效性。  相似文献   

8.
数据挖掘在各行业发挥着越来越重要的作用,随着数据挖掘中数据量的高速增长以及大规模计算在数据挖掘中的应用。挖掘算法处理海量数据的能力问题日益突出.通过对常见的数据挖掘分类并行算法进行研究探讨,分析了C4.5算法,SLIQ算法,SPRINT算法的优缺点,最后指出研究并行算法是解决处理海量数据能力的有效途径.  相似文献   

9.
决策树算法是数据挖掘系统中一个重要的分类算法,选择合理而有效的测试属性以及对决策树进行适当的修剪是决策树算法的关键内容之一。将决策树算法引入教务管理挖掘系统,并对决策树测试属性的选择算法以及预剪枝算法进行改进。以九江学院学生四级考试信息为例,结果表明改进的决策树算法对于数据挖掘更具可靠性和有效性。  相似文献   

10.
王琴竹 《运城学院学报》2011,29(2):53-54,57
决策树算法广泛应用于模式识别和机器学习等领域,用来解决与分类相关的问题。决策树算法中的过度拟合会在很大程度上影响到最终的分类结果。针对过度拟合产生的原因,采用悲观错误剪枝方法,对学生成绩决策数据进行分析,得出影响学生成绩的重要因素。实验表明,该方法可以得到尽可能短的分类规则,有效地提高了决策树的性能。  相似文献   

11.
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。对网络课程知识点个性化设计中的大量数据,运用数据挖掘算法中的决策树C4.5算法对所给数据进行处理,选取决策属性,构造决策树,提取分类规则,获取每一个知识点与不同类型的学生之间的关系。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。  相似文献   

12.
交通事故的形成常涉及多种因素,如驾驶人本身、车辆、环境等.以数据挖掘技术中的ID3分类决策树算法对交通事故数据进行分析和研究,得出蕴含在数据中的有益模式,决策树构造结果显示,分类决策树应用于交通事故成因分析中具有可行性与有效性.  相似文献   

13.
为了提高C4.5决策树算法的有效性,提出一种改进的C4.5决策树算法。结合粗糙集理论的属性约简算法和Fayyad边界点判定定理,对C4.5算法进行了改进,利用UCI数据集进行了实验。结果表明,改进的C4.5算法不仅提高了准确率,而且缩小了决策树规模,减少了分类时间。  相似文献   

14.
决策树通过对获取的样本数据属性使用信息论知识原理进行解析和归纳,最终形成类似于流程图的树型结构形式。ID3算法是典型采用贪心算法的归纳学习算法,其使用递归方式采用贪心算法来生成决策树。与其他分类技术算法比较,ID3算法有着自己的优势,但在实际应用中,采用决策树ID3算法进行分类时,需要先对数据进行一些处理或改进。  相似文献   

15.
ID5算法对于相对小的数据集是很有效的,但对大型数据库而言,ID5算法无法处理。SLIQ分类算法使用了一些独特的技术,改进了学习的时间,在同时没有降低精确度的情况下,解决了对磁盘驻留大数据集的分类,具有更快的速度而且生成较小的树。  相似文献   

16.
经典决策树算法不能处理树构建和分类过程中的不确定数据,针对这一局限,提出基于概率分布的方法,把决策树分类技术扩展到含有不确定数据的环境中。然后,针对软件外包评价中普遍存在着不确定数据,应用决策树分类方法,对软件外包公司进行客观评价。实验表明,本文提出的基于不确定数据的决策树分类算法能够实现对软件外包评价的定量研究。  相似文献   

17.
分类算法是数据挖掘中的一种重要技术,决策树学习是其中常用的一种方法。结合实例阐述了决策树基本算法的形成过程,分析总结了决策树算法在实际中的应用及其存在的缺陷。  相似文献   

18.
文本分类在自然语言分类中起着重要作用,将决策树ID3算法应用与文本分类,对数字图书馆的部分文本信息分类,提出一个基于ID3决策树的文本分类算法,取得了良好的实验结果。  相似文献   

19.
为了改善传统ID3算法在分类属性选择上存在多值偏向性的不足,提出基于PCA的决策树优化算法。在普通基于PCA 的决策树改进算法中,存在数据经降维处理后代表性不强的问题,导致算法需经过多次数据运行后,准确率才能小幅提升。在ID3算法基础上,在分类前两次提取属性特征值,并计算了需要分类的数据量,也即对原始数据进行最重要的属性选择。在子树建立之后,再进行数据的降维合并选择。采用UCI数据库中的3个数据集对改进算法进行验证,结果表明改进算法的平均准确率达到94.6%,相比传统ID3算法与普通PCA决策树优化算法分别提升了1.6%和0.6%。因此,基于PCA的决策树算法能在一定程度上提升结果准确率,具备一定的应用价值。  相似文献   

20.
将决策树ID3算法应用到计算机教学评价数据挖掘中,建立学生考试成绩是否优秀的决策树,并利用事后修剪法实现分类决策树的剪枝。最后由决策树产生分类规则,建立考试成绩优秀分析决策树模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号