首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 796 毫秒
1.
为了提高C4.5决策树算法的有效性,提出一种改进的C4.5决策树算法。结合粗糙集理论的属性约简算法和Fayyad边界点判定定理,对C4.5算法进行了改进,利用UCI数据集进行了实验。结果表明,改进的C4.5算法不仅提高了准确率,而且缩小了决策树规模,减少了分类时间。  相似文献   

2.
以加速踏板开度、加速踏板开度变化率为输入参数,将加速意图分为缓加速、一般加速和急加速,建立了基于支持向量机的电动汽车驾驶意图识别模型。为了解决粒子群算法优化支持向量机参数时寻优范围的不确定性,导致搜索效率不稳定的问题,提出了一种自适应粒子群算法:先通过网格搜索法确定出粒子群算法参数寻优的最佳范围,再由粒子群算法在此范围精确寻优,最后得到了更高准确率的分类结果和缩短了的训练时间。通过仿真实验验证,运用这种自适应粒子群优化支持向量机建立的预测模型辨识度高,模型准确可靠,为驾驶意图的识别提供了新的方法。驾驶意图识别的结果可用于后续的纯电动汽车驱动控制策略的研究,进一步提高汽车的驾驶性能。  相似文献   

3.
大数据时代,数据量呈现爆炸式增长,且在内容与形式上日益复杂化,造成数据质量下降、数据丢失等,即产生不完备数据。提出一种改进的C4.5算法,使其能更好地处理不完备数据。每次特征选择前对本次特征选择的数据子集使用子集匹配方法进行处理,通过比较数据清洗方法与子集匹配方法的结果,显示即便是在相同清洗规则下,子集匹配方法在算法分类准确率上也更有优势。实验结果证明,在利用C4.5算法进行特征选择时,在该数据子集上对不完备数据进行处理,可以得到较高的分类准确率,同时得到比数据清洗高的时间复杂度。  相似文献   

4.
不同的聚类算法都可以完成对无标签数据的分类,而Kmeans聚类算法是一种无监督静态数据分析机器学习方法,已被广泛应用于机器学习、模式识别、数据挖掘等领域.但对维度数据准确率不高,本文引入深度自动编码器完成对输入样本的特征自动学习和重构,实现对数据的降维和特征提取,代替原始数据通过Kmeans算法进行聚类分析.实验结果证明,改进后的AE Kmeans(Auto Encoder Kmeans)算法与单独使用Kmeans算法完成聚类相比,准确率得到明显提高.  相似文献   

5.
运用开源系统WEKA,选取C4.5算法构建贫困生决策树模型,利用30%的数据来测试模型分类效果,实验结果显示,模型预测的准确率和精确度都较高,模型分类效果较好。从模型构建中发现了影响贫困生分类的重要标准和评价规则,从而为完善贫困生评价体系并改进评价工作提供有效建议。  相似文献   

6.
垃圾邮件处理作为一种典型的文本分类应用问题,受到高维数据的困扰。为提高垃圾邮件检测的效率和准确率,提出一种基于PLS特征提取和SVM的入侵检测算法,首先对原始垃圾邮件数据利用偏最小二乘算法降低维度,再采用遗传算法寻优转换特征子集,并通过支持向量机SVM进行分类。 Matlab仿真实验表明,本算法能有效降低数据维数,提高检测的准确率。  相似文献   

7.
提出了一种结合卷积神经网络和仿生模式识别的改进判别算法,以仿生模式识别为基础,首先构建一个基于卷积神经网络的特征提取网络。将图像特征提取之后,利用仿生模式识别构建并训练一个分类网络用于图像的分类。为证明方法的有效性,进行了3组对比实验,第1组为算法在少量数据下的对比分析,其改进后算法平均准确率比传统算法高了10%;第2组为算法在稍多数据下的对比分析,本算法平均准确率达到92%,高于传统算法;第3组为算法在较多数据下的对比分析,其平均准确率达到88%,高出传统算法10%。  相似文献   

8.
针对决策树算法C4.5在处理数据挖掘分类问题中出现的算法低效以及过拟合问题,提出一种改进的TM-C4.5算法。该算法主要改进了C4.5算法的分支和剪枝策略。首先,将升序排序后的属性按照边界定理,得出分割类别可能分布的切点,比较各点的信息增益和通过贝叶斯分类器得到的概率,使用条件判断确定最佳分割阈值;其次,使用简化的CCP(Cost-Complexity Pruning)方法和评价标准,对已生成决策树的子树根节点计算其表面误差率增益值和S值,从而判断是否删除决策树节点和分支。实验结果表明,用该算法生成的决策树进行分类更为精确、合理,表明TM-C4.5算法有效。  相似文献   

9.
介绍了一种一般情况下的C4.5数据挖掘算法的优化方法。原来的C4.5算法在计算属性信息增益率时需要大量用到对数运算,而优化后的C4.5算法计算属性信息增益率时只需用到加减乘除运算,在实现时不用频繁调用对数函数,优化后的算法不会改变属性信息增益率的排序,不改变生成的决策树。改进后的算法能做到在不改变准确率和不增加空间复杂度的情况下,减少时间复杂度,提高了决策树生成效率。  相似文献   

10.
出了一种可伸缩的朴素贝叶斯分类算法。算法针对大数据集的训练数据,通过构建雨林框架,能在有限主存里存储训练数据,训练生成概率矩阵,进而对测试样本进行分类。算法仅对整库一次扫描。实验表明,该算法能够获得与整库读入主存相同的分类准确率.并且有较高的处理效率。  相似文献   

11.
为了解决服务器运行过程中由于性能故障造成服务质量下降的问题,提出一种基于决策树的日志分析方法,以服务器日志文件中记录服务器关键性能指标的数据为研究对象,利用决策树中常用的ID3、C4.5和CART 3种算法预测服务器未来性能指标发展趋势。实验结果表明,在实际运行过程中,C4.5算法对服务器性能指标数据预测的准确率和召回率最好,分别达到了92.23%和95.37%,在3种决策树算法中拥有最高的准确率与召回率,且相比传统开发人员从日志文件中寻找故障的方法,准确率提高了20%左右,因此能够更好地预测服务器系统性能指标发展趋势。通过该方法可提前感知系统运行状况,并及时作出调整,从而有效降低实际生产过程中服务器故障发生概率,提高服务质量。  相似文献   

12.
基于支持向量机(SVM)的网络入侵,因SVM参数设置不当导致分类准确率偏低的问题,提出改进二进制鲸鱼算法优化支持向量机(IBWOA-SVM)的网络入侵检测。通过对鲸鱼优化算法中收敛因子的改进和更新机制融入粒子群策略的方式,改善其容易陷入局部最优且收敛精度慢的缺点。对初始化参数群采用改进二进制鲸鱼优化算法的更新机制不断地进行更新迭代,迫使鲸鱼搜索代理获取较优的参数值来建立性能较优的分类模型,进而提高网络入侵检测的分类性能。采用多个UCI数据集并与其他的参数优化方法进行对比,最后使用网络入侵检测KDD CUP 99数据集进行验证。结果表明,与遗传算法、粒子群算法和鲸鱼优化算法在SVM参数优化上的性能相比,IBWOA-SVM方法的分类准确率和适应度值在各数据集上都有所提高,从而有利于改善网络入侵检测参数优化中的分类性能。  相似文献   

13.
谢秋华 《三明学院学报》2012,29(4):34-39,100
介绍了一种C4.5算法的改进方法,即在计算属性信息增益率时只用到加减乘除运算,而不是像C4.5那样的大量用到对数运算。实验表明,改进的C4.5算法在不改变模型预测准确率的同时,减少了计算时间,提高了决策树的生成效率,而后将改进的C4.5算法作用于《大学计算机基础》课程的成绩分析,得到的分析结果用于辅助指导教师对《大学计算机基础》课程的教学工作,能够更好地促进教学,提高学生对此门课程的掌握程度和为普及计算机做出帮助。  相似文献   

14.
针对支持向量在分类过程中,特别是对于非线性可分问题,如果采用不同的核函数,支持向量机(SVM)可以构造不同的学习机器和分类模型,从而导致分类算法复杂且分类精度较低。研究了SVM的轴承诊断原理,测试诊断方案及原始测试数据的特征提取,最后进行了数据训练和测试实验仿真,然后对风力发电机组机械故障进行诊断,实验说明了改进后的SVM故障分类方法的可行性和有效性。在建立故障分类模型之后,采用网格搜索法、遗传算法、粒子群算法对支持向量机的惩罚参数C和径向基核函数参数γ进行优化选择,通过分析发现故障分类精度提升比较明显。  相似文献   

15.
人工智能带动计算机视觉算法迅速发展。人脸识别具有特征明显、不易伪造、安全性高等特点,成为计算机视觉的一个重要分支。基于Hog算法对人脸图像进行特征提取,基于改进的kNN算法进行分类识别。对收集的数据进行科学分析和数据挖掘,将数据信息进行图表可视化。不仅识别迅速、准确度高,还增强了数据分析的趣味性和交互性。应用在会议签到场合,只需采集8张左右的图片,经过预处理和算法优化,就能实现高达99%的准确率,有效解决了传统会议人工签到速度慢、数据可利用率低、组织效率差等弊端。  相似文献   

16.
针对文本分类算法的选择问题,使用二十新闻组数据集在开源的数据挖掘软件Weka上进行了仿真实验。通过实验结果综合评价了朴素贝叶斯算法、IB1算法和ZeroR算法的性能。实验结果表明在三种算法中朴素贝叶斯算法的准确率最高,ZeroR算法的运算速度最快。研究表明文本分类的效率受所选算法的影响较大,合适的算法可以显著地提高文本分类的准确率。  相似文献   

17.
C4.5 算法是数据分类的经典数据挖掘算法。整合并规范了临床确诊病例中的糖尿病并发症数据,同时进行了粗糙集约简,并运用C4.5算法实现了分类。研究表明,该方法能很好地实现决策分类,以辅助临床诊断。  相似文献   

18.
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。对网络课程知识点个性化设计中的大量数据,运用数据挖掘算法中的决策树C4.5算法对所给数据进行处理,选取决策属性,构造决策树,提取分类规则,获取每一个知识点与不同类型的学生之间的关系。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。  相似文献   

19.
文本自动分类技术是自然语言处理的一个重要的应用领域,是替代传统的繁杂人工分类方法的有效手段和必然趋势.本文简要介绍了文本分类的特征提取算法,并通过实验比较了各种提取算法在KNN中的性能.实验表明IG、MI、CE、χ2、WE五种特征提取方法在KNN分类器中性能接近,互信息(MI)特征提取方法随着特征数的提高分类性能提高地较快,当特征数目较小的时候分类性能极差.  相似文献   

20.
为提高电影情感内容分析的准确率,需要对电影的背景音乐进行情感的自动分类,为此提出改进蚁群-模糊聚类算法的音乐情感分类方法,分析改进蚁群-模糊聚类算法的基本原理及实现步骤,并以500首电影音乐数据为例,对该数据进行挖掘分析,使用改进蚁群-聚类算法对平均音高、平均音强、旋律的方向、音高的稳定值、节奏的强弱规律和节拍6个情感特征向量进行聚类。试验效果表明取得很好的聚类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号