期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

乔莹莹《安阳工学院学报》2017,16(4)

计算机出现以后,人们就想知道它能否学习.机器学习的主要任务就是发明计算机算法,将数据转化为智能行为.机器学习算法可分为两大类:有监督算法和无监督算法.有监督学习算法用来建立预测模型,无监督学习算法用来建立描述模型.有监督的学习算法可以用来分类和数值预测.针对可以进行数值预测的几种算法,比如回归分析、决策树、神经网络、支持向量机等算法做了简单介绍,然后分析了几种算法的在数值预测问题上应用. 相似文献

2.

基于随机森林的交通事件检测方法设计与分析(英文)

刘擎超陆建陈淑燕《东南大学学报》2014,(1):88-95

为了进一步提高决策树模型的交通事件检测性能,且避免噪音和过拟合现象,提出了基于随机森林的交通事件检测方法.从分类强度和相关性2个角度进行分析,并构建了3组实验:与不同数目决策树的对比、与不同决策树的对比及与神经网络的对比.实验数据采用实测的高速公路交通参数数据库(I-880数据库);实验的评价指标采用检测率、误警率、平均检测时间、分类率和ROC曲线下的面积.实验结果表明,基于随机森林的交通事件检测模型可以提高检测率、减少检测时间、提高分类正确率,和多层前馈神经网络相比具有很好的竞争力. 相似文献

3.

基于红外光谱和随机森林的蕨麻产地鉴别

《实验室研究与探索》2017,(3)

利用红外光谱与随机森林相结合的方法对不同产地蕨麻进行分类鉴别,测定了42个来自青海省不同产地的蕨麻样品的红外光谱。小波变换对红外光谱原始谱图数据进行了预处理,红外光谱数据压缩到原来的1/8,其分析精度与原始光谱数据基本相当。将42个样品划分为有30个样品的训练集和12个样品的测试集,建立随机森林预测蕨麻产地模型。使用内部交叉验证和外部数据进行验证,采用R语言实现随机森林算法,并对模型的参数进行了优化。结果表明,所建立的判别模型中训练样本和测试样本判别正确率均为100%。建立的模型能够正确地对蕨麻样品快速进行产地鉴别,红外光谱法结合随机森林可作为中药材产域分类鉴别的一种新的尝试。相似文献

4.

不平衡古漆器漆膜数据分类研究

张岚斌徐国庆李澜《教育技术导刊》2021,20(1):84-88

针对古漆器漆膜数据类间不平衡、样本规模小,以及传统机器学习算法分类效果较差的问题,提出一种改进SMOTE的过采样方法改变漆器漆膜数据样本分布,使其达到平衡。该方法通过比较各类样本间的欧式距离,删除了人工样本中的噪声数据,然后运用集成学习中的随机森林算法进行分类,提高了少数类的分类准确率。UCI数据集上的实验结果表明,改进的过采样方法性能更优,评价指标F1-score与AUC值分别得到2%、5%以上的提升。结合改进的过采样方法与机器学习算法进行对比实验,结果证明,随机森林算法精度更高,在对古漆器年代的判别中,随机森林算法的F1-score与AUC值高达87.76%、89.34%。相似文献

5.

基于mBagging的随机森林

《赣南师范学院学报》2022,(3):113-115

随机森林是采用Bagging组合方法集成的决策树集合,在数据分类、预测领域应用广泛.Bagging组合方法在机器学习中具有代表性,但对于实际的大数据挖掘仍存在一些不足.mBagging是基于Bagging组合方法的一种改进,具有更高的统计功效、更低的假阳率以及更快的运算速度.采用全基因组SNP仿真数据集的实验表明,基于mBagging的随机森林运算速度明显快于传统的随机森林,且在保证OOB袋外错误率不劣化的前提下,判断风险SNP的准确率得到了提高. 相似文献

6.

C4.5决策树法在网络课程知识点个性化设计中的应用

马伟杰《河南广播电视大学学报》2012,(3):108-110

决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。对网络课程知识点个性化设计中的大量数据,运用数据挖掘算法中的决策树C4.5算法对所给数据进行处理,选取决策属性,构造决策树,提取分类规则,获取每一个知识点与不同类型的学生之间的关系。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。相似文献

7.

基于双随机森林的透析病患白蛋白缺失值估计

李建春李智万里李健《教育技术导刊》2018,17(5):124-126

数据缺失是临床试验中常见但又不可避免的问题之一。由于医疗设备欠缺或者病患忽略检测白蛋白,可能造成白蛋白指标缺失。随着机器学习的广泛应用,很多研究者将机器学习应用在缺失数据估计上。提出一种基于随机森林与聚类方法结合的算法——双随机森林回归法,并将该算法应用于估计白蛋白缺失值。在准确率和鲁棒性方面,双随机森林回归法相比于最近邻法、决策树与随机森林方法,均有不同程度提高。该算法为缺失值的有效处理提供了一种新思路,可以为其它的缺失值估计研究提供参考。相似文献

8.

数据挖掘中决策树分类算法的研究与改进

但小容陈轩恕刘飞柳德伟《教育技术导刊》2009,8(2):41-43

决策树分类算法是数据挖掘中一个重要的内容,而ID3算法又是决策树分类算法中的一种重要方法且被广泛应用。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、多值偏向等。为了解决这些问题,提出了一种基于ID3算法的加权简化信息熵算法,它提高了决策树的构建速度,减少了算法的计算运行时间,同时也克服了ID3算法往往偏向于选择取值较多的属性作为测试属性的缺陷。并且随着数据规模的增大,决策树的分类性能表现得越好。相似文献

9.

ID3分类及其剪枝算法研究

刘冲杨磊李娜《教育技术导刊》2016,15(12):33-34

分类是数据挖掘的一个重要课题。分类的目的是建立一个分类模型,该模型能把数据库中的数据项映射到给定类别中的某一个利用该模型形成分类规则并预测未来数据趋势。决策树归纳是经典的分类算法,构建决策树模型算法中最有影响力的方法是ID3算法。针对ID3算法缺点,使用预剪枝和后剪枝相结合的办法处理决策树中的过学习情况,可生成一个更简单、更精确的决策树。相似文献

10.

决策树算法中过度拟合的研究与解决方案

王琴竹《运城学院学报》2011,29(2):53-54,57

决策树算法广泛应用于模式识别和机器学习等领域,用来解决与分类相关的问题。决策树算法中的过度拟合会在很大程度上影响到最终的分类结果。针对过度拟合产生的原因,采用悲观错误剪枝方法,对学生成绩决策数据进行分析,得出影响学生成绩的重要因素。实验表明,该方法可以得到尽可能短的分类规则,有效地提高了决策树的性能。相似文献