共查询到20条相似文献,搜索用时 47 毫秒
1.
剪枝过程是决策树分类学习中的重要环节,能够简化决策树并提高决策树的泛化能力,避免对训练数据集的过适应。在PEP算法的基础上,本文提出了一种改进的决策树剪枝算法IPEP,实验结果表明,该算法剪枝效果较PEP算法更好。 相似文献
2.
决策树算法是数据挖掘系统中一个重要的分类算法,选择合理而有效的测试属性以及对决策树进行适当的修剪是决策树算法的关键内容之一。将决策树算法引入教务管理挖掘系统,并对决策树测试属性的选择算法以及预剪枝算法进行改进。以九江学院学生四级考试信息为例,结果表明改进的决策树算法对于数据挖掘更具可靠性和有效性。 相似文献
3.
高职院校在多年的管理以及教学工作中,相关数据库拥有相当多的学生数据,从中可以提取出高职院校所需要的一些数据,由此,决策树算法在高职院校中得到了广泛的运用。另外,学生的学习成绩可以在一定情况下体现学生的具体学习情况,还可以对教师的教学质量进行侧面的反映。通过对决策树算法的深入了解和探究,对其在学生学习成绩分析中的具体运用进行了探讨。 相似文献
4.
本文主要介绍了智能教学系统中的机器自学习机制,研究如何提高智能教学系统的智能性和通用性等方面的问题。文章采用基于信息论的示例学习,改进了决策树学习算法,并建立了机器学习决策树。 相似文献
5.
6.
7.
提出一种基于云理论和神经网络构造决策树的文本分类方法。运用云神经网络学习变量间的云映射关系,从中生成云决策树。这种方法结合了神经网络的学习算法和决策树的推理方法,具有神经网络的学习能力,并且应用了云发生器对处理不确定性的能力。更符合人类的思维方式,从而进一步提高了文本分类的效率、准确性和可靠性。 相似文献
8.
决策树算法是数据挖掘中一个重要的内容,但是在实际应用过程中,现存的多种决策树算法也存在着很多不足之处。本文总结并分析了近年来数据挖掘技术在决策树算法方面的研究,探讨了进一步的研究发展方向。 相似文献
9.
在医疗系统中,人们通常使用决策树对患者的发病类型以及概率进行有效地分类预测.随着信息技术的普及,医疗系统中产生了大量的历史医疗记录,处理和分析这些海量的医疗数据给医疗系统带来了极大地挑战.本文针对海量医疗数据问题,提出了分布式构建决策树算法.该算法分布式逐层构建决策树,可以高效地构建决策树,快速有效地完成医疗系统中的预测工作.该算法是基于现有流行的云计算平台,使用MapReduce分布式框架设计的分布式算法.实验结果表明,该算法具有很好的扩展性和高效性. 相似文献
10.
11.
决策树算法是数据挖掘领域的核心分类算法之一,ID3算法则是最为经典的决策树算法。本文以ID3数据挖掘算法在债务管理中的应用为例,验证了算法的性能。 相似文献
12.
选择网络节点与通道的Java决策树计算 总被引:1,自引:0,他引:1
决策树是一种随机性决策方法.在决策树方法中,以期望收支值作为决策目标,根据可能出现的状态及概率,确定最优行动方案.本文给出了决策树的Java网络算法Decision_Tree,可在兼容Java的网络浏览器上调用和运行.决策树Java网络算法可用于网络中节点与通道的搜索选择,有一定的应用价值. 相似文献
13.
对海量数据的处理能力是数据挖掘最关注的问题。决策树作为一种分类器,是数据挖掘中用到的一种基本方法之一。基于C4.5的决策树改进算法,是在一些典型的决策树分类算法的基础上提出的,基本思想是在建树过程中,用属性依赖度替代信息增益率来确定划分条件属性的顺序。该算法借鉴MedGen算法的阈值设定方法,在简化决策树剪枝和优化过程的同时,可优化C4.5算法中使用信息熵率的时间复杂度,避免了使用信息熵带来的不当划分。简述了该改进算法的执行过程,证明了算法的正确性。 相似文献
14.
科研管理评估的时效性以及科学性对于高校科研力量的发展至关重要,需要采取一定的实验方法提高其相关的有效指标,这样才能让评估变得更加顺利。在相关目标的要求基础上,提出决策树算法,它能够很耗地对评估对象进行属性的测试,并在此基础上进行属性值的评价。结合权重系数对信息进行计算,能够对最终的结果进行判断,看其是否具有一定的合理性。通过实验验证,结果表明:决策树算法能够运用于高校的科研管理之中,并且具有很高的信用度,算法难度适中,具有很好的使用价值。 相似文献
15.
从一个新的思路对基于最小Gini指标的决策树分类算法进行了讨论。简单介绍了CART算法和Gini指标的定义,并且对SLIQ和SPRINT决策树分类技术进行深入的分析。同时对SLIQ算法的时间复杂性和这两种算法的内存管理和性能方面进行了比较和分析。 相似文献
16.
提出了一种基于信息熵的可伸缩决策树生成算法SDT(AAScalableDecisionTreeAlgorithm)。与SPRINT算法不同,该算法使用基于信息熵增益的思想分割训练样本集,引入了新的数据结构:基于类别的属性表。该表记录存储了计算分割属性的所有信息,并且该表的大小不会随样本集的增大而增大,可以常贮主存。与SLIQ算法相比,SDTA算法彻底摆脱了主存容量对算法效率的限制。实验表明,SDTA算法能生成正确的决策树,而且具有良好的可伸缩性。 相似文献
17.
18.
旅游景点信用评估是一种典型的分类问题,本文概述了粗糙集和决策树的理论,基于这两种理论,提出了一个基于数据挖掘粗糙集理论与决策树分类技术相结合的信用评估方法来建立旅行景点的信用评估模型,利用粗糙集的知识约简的概念,对样本数据进行预处理,去除冗余属性对分类模型的影响,然后用决策树方法建立分类模型。最后通过Pawlak重要度的属性约简算法和ID3决策树算法实现了该模型。 相似文献
19.
ID3算法是决策树分类算法中一种重要方法而被广泛应用,但它存在一些缺点,如生成的树过于繁茂,分枝蕴含的信息量过小等。为了解决这些问题,本文提出了一种改进ID3算法,引入用户兴趣度,并通过试验对改进前后的算法进行了比较。 相似文献
20.
通过分析选择决策树作为保险业客户流失预测模型实现的手段,给出了决策树实现流失预测的算法设计,通过流程图及相应数据结构的说明,介绍了算法实现要点,最后的实验结果表明所建立的预测模型具有良好的准确率。 相似文献