首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
本文根据决策树分类技术对福建省计算机等级考试中的成绩进行分析和挖掘.首先对成绩数据进行离散化处理,设置成决策树分类的属性数据;接着利用ID3改进算法构建成绩分类的决策树模型,并对其剪枝;最后根据模型给出相应的规则和几个教学建议.实验结果表明,利用决策树分类技术在计算机等级考试中进行挖掘分析的方法是有效可行的.  相似文献   

2.
应用粗糙集理论,提出了一种新的多变量决策树构造算法.该算法以核相对于决策类的泛化来划分样本集,如果所划分子集的样本存在不一致决策类并且未用于划分的属性为空时,试探着分别把该子集和一致性子集合并,计算各合并子集的条件类对决策类的确定性程度,选择确定性程度大的作为同一子集,并用一致性子集的类标号进行标示.和苗夺谦提出的多变量决策树算法比较,本算法充分考虑了训练集中的噪声数据,允许在构造决策树的过程中划入正域的实例类别存在一定的不一致性,可简化生成的决策树,提高决策树的泛化能力.  相似文献   

3.
一种代价敏感学习方法在电信业流失预测中的应用   总被引:1,自引:0,他引:1  
根据已有的流失预测方法,提出新的流失预测方法解决数据挖掘中的非对称错分代价问题.该方法以传统C4.5决策树算法为基准分类器,融合代价调整方法实现代价敏感学习.相比之下,C4.5决策树算法仅是基于样本错分代价相同假定,建立了一种错分率最低而非总错分代价最低的预测模型.基于某电信企业的客户数据,及流失客户和非流失客户代价非对称的实际,实证研究结果表明,CS-C4.5通过调整流失类和非流失类样本的比例,大大降低了传统分类算法的样本错分总代价.该方法对于提高电信企业的核心竞争力具有重要的现实意义.  相似文献   

4.
针对大规模网页相关性排序工作中使用的多来源网页信息形式多样、利用困难的问题,提出了一种新的自动网页特征获取方法.该方法利用一组事先定义好的规则自动地从网页中获取相关性特征,这些特征可以有效地表达网页的实际内容并改善搜索引擎的排序性能.该方法所获取的网页相关性特征具有格式统一、噪声数据少的特点,能够非常方便地应用于网页的相关性排序.为了评价网页特征和用户查询之间的相关性,还提出了一个特征级别的相关性判定标准.最后,实验结果证明了所提出的特征获取方法和特征相关性等级判定标准对于提升搜索引擎的排序性能具有显著的作用.  相似文献   

5.
针对目前高校计算机等级考试持续过低的现状,应用决策树C4.5算法对安徽警官职业学院计算机等级考试成绩数据进行深入分析和研究,对预处理后的数据进行挖掘并建立决策树分类模型,由决策树产生分类规则,找出影响计算机等级成绩潜在的主导因素,从而为进一步提高高校计算机等级考试通过率提供参考依据.  相似文献   

6.
排序问题是一类重要的组合最优化问题,在生产计划、计算机控制等领域有着广泛应用,一直是理论界研究热点.对带服务等级的3台平行机排序问题进行研究,每台机器和每个工件都有等级标号,每个工件只能被某台服务等级不高于该工件等级的机器加工,目标是最小化最大机器的完工时间.运用新的算法思想解决离线状态等级约束下的3台机器负载均衡问题...  相似文献   

7.
Biskup首次将学习效应的约束条件引入排序模型,此后带有学习效应的相关排序问题受到了众多学者的关注.大量学者研究了特定条件下带有学习效应的单机排序问题,并给出了多项式算法的证明.对于更为一般条件下的此类问题,通常使用分枝定界法和启发式算法进行求解和对比验证.本文重点介绍分枝定界算法在带有学习效应的单机排序中的应用和几种常用的启发式算法,并给出了一些后续的研究方向.  相似文献   

8.
在提出决策树理论的基础上,使用某考点的考试数据,设计并实现了基于决策树C5.0算法的计算机等级考试通过率问题的数据挖掘过程,并对通过率偏低的结果进行了分析,对今后的计算机教学工作具有一定的指导意义.  相似文献   

9.
针对决策树算法C4.5在处理数据挖掘分类问题中出现的算法低效以及过拟合问题,提出一种改进的TM-C4.5算法。该算法主要改进了C4.5算法的分支和剪枝策略。首先,将升序排序后的属性按照边界定理,得出分割类别可能分布的切点,比较各点的信息增益和通过贝叶斯分类器得到的概率,使用条件判断确定最佳分割阈值;其次,使用简化的CCP(Cost-Complexity Pruning)方法和评价标准,对已生成决策树的子树根节点计算其表面误差率增益值和S值,从而判断是否删除决策树节点和分支。实验结果表明,用该算法生成的决策树进行分类更为精确、合理,表明TM-C4.5算法有效。  相似文献   

10.
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。对网络课程知识点个性化设计中的大量数据,运用数据挖掘算法中的决策树C4.5算法对所给数据进行处理,选取决策属性,构造决策树,提取分类规则,获取每一个知识点与不同类型的学生之间的关系。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。  相似文献   

11.
医疗大数据指数目庞大、增长迅速、结构复杂、隐藏价值高的数据。机器学习技术能够有效分析医疗大数据的内部联系,对疾病的早期诊断及预后具有重要临床指导意义。阐述了机器学习技术在医疗大数据中的应用及研究进展,包括在大数据分析中的回归分析、决策树、基于内核的算法、降低维度算法等浅层机器学习算法模型,卷积神经网络、循环神经网络、自动编码器、深度信念网络等深度学习算法模型,以及各个算法模型的临床应用,分析了机器学习在医疗数据挖掘中的应用前景和存在的技术难题。  相似文献   

12.
王琴竹 《运城学院学报》2011,29(2):53-54,57
决策树算法广泛应用于模式识别和机器学习等领域,用来解决与分类相关的问题。决策树算法中的过度拟合会在很大程度上影响到最终的分类结果。针对过度拟合产生的原因,采用悲观错误剪枝方法,对学生成绩决策数据进行分析,得出影响学生成绩的重要因素。实验表明,该方法可以得到尽可能短的分类规则,有效地提高了决策树的性能。  相似文献   

13.
利用傅立叶级数对散点小行星光变数据进行曲线拟合,以获得小行星表示参数,选取傅立叶级数为6的拟合方式对单体或双体小行星光变曲线进行分类,并用机器学习算法中的SVM和决策树建立预测模型。检验结果表明,SVM模型对单体和双体小行星的预测正确率达到95%,相较于决策树正确率提高了10%,为从小行星实际观测数据直接推测双体小行星潜在相关应用提供了参考。  相似文献   

14.
曲毅 《高教论坛》2006,(6):131-133
基于Internet的现代远程教育为学习者提供了极大的方便。而目前的远程学习系统缺乏智能化、个性化服务,为改善这一不足,本文提出了一个基于数据挖掘技术的个性化学习系统模型,并详细描述了应用决策树及BP神经网络算法对系统进行设计的方法。基于本模型实现的个性化学习系统真正体现了因才施教的教育理念。  相似文献   

15.
人工智能算法繁多,但经得起实践考验的经典算法有限,常见的有朴素贝叶斯、决策树、逻辑回归、支持向量机、深度学习、强化学习、遗传算法、蚁群算法、元学习等。依据人工智能算法理论基础知识,如概率统计、集合论、空间几何、图论、矩阵论等加以分类,并对相应经典人工智能算法概念和主要应用领域进行概述,去除结构细化和公式展开所带来的复杂感,揭开人工智能的神秘面纱,让算法整体轮廓得以更清晰地呈现。  相似文献   

16.
论机器学习     
机器学习是一门人工智能的科学,同时也是实现人工智能的一个重要途径。相应地,机器学习的研究目的有两个:一是用于提高机器人的性能;二是从数据库中发现新的知识。机器学习的研究队伍可以分为两个科学共同体:一个群体用于分类算法的改进;另一个群体主要进行从事计算学习理论的分析。  相似文献   

17.
论机器学习     
机器学习是一门人工智能的科学,同时也是实现人工智能的一个重要途径。相应地,机器学习的研究目的有两个:一是用于提高机器人的性能;二是从数据库中发现新的知识。机器学习的研究队伍可以分为两个科学共同体:一个群体用于分类算法的改进;另一个群体主要进行从事计算学习理论的分析。  相似文献   

18.
Using log data of 823 university students collected in two settings: their online learning setting and daily life setting (using campus ID cards for consumption purposes and book-borrowing in the university library), this study created indicators for online learning behavior, early-rising behavior, book-borrowing behavior and learning performance prediction. Five machine learning models were employed to analyze learning performance prediction, with the additional use of Boosting and Bagging to improve the accuracy of the prediction model. The predictability of the proposed model was also compared with that of both the Artificial Neural Network model and the Deep Neural Network model. At the same time, a classification rule set was established by combining decision tree and rule model, and a learning behavior diagnosis model combining decision tree and deep neural network was constructed. Findings showed that multi-scenario behavior performance indicators had strong predictive capabilities while the Deep Neural Network model had the highest prediction accuracy (82%) but was most time-consuming. The model based on the rule set is highly accurate, readable and operable and may be conducive to making accurate teaching interventions and resource recommendations.  相似文献   

19.
针对传统信用评价方法分类精度较低、数据集属性变量间存在相关性等问题,提出基于主成分分析的稀疏贝叶斯学习(PCA-SBL)算法。首先对数据集特征变量进行主成分分析,使降维后的变量无相关性|其次,对主成分分析后的数据进行稀疏贝叶斯分类|最后将 PCA-SBL 分类方法分类精度与传统分类方法精度进行比较。分析发现,在 German Credit Data 和 Australian Credit Data 上,与传统 KNN、朴素贝叶斯、SVM、随机森林、决策树相比,改进的 SBL 算法分类精度平均提高了 5.26%、4.65%、2.11%、2.125%、4.66%,与稀疏贝叶斯学习算法(SBL)相比,平均提高 0.965%,从而证明 PCA-SBL 算法具有更高的分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号