首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
通过随机森林算法获取变量的重要性并进行排序,确定模型参数,建立分类预测模型。实验表明,依据随机森林算法建立的模型,具有很好的分类及预测能力。  相似文献   

2.
提出了一种基于超像素进行肤色检测的方法。该方法首先应用分水岭算法对彩色图片进行分割得到超像素,同时对对应的肤色标注图片进行相应的分割;然后提取超像素直方图的特征值作为输入数据,对应的分割肤色标注图作为输出变量;最后采取了支持向量机以及随机森林算法对输入数据和输出数据进行训练。实验结果表明,基于提出的超像素特征值,支持向量机与随机森林算法都取得了比基于像素的肤色分类算法更好的分类效果。  相似文献   

3.
利用计算机视觉技术和机器学习技术对学生课堂行为进行自动识别,是过程性评价的一种新方法,近年来逐渐引起了研究者的关注。文章以监控设备拍摄的实际课堂教学视频为数据源,采集、标注了学生课堂行为数据,提取了学生的人体骨架信息。在此基础上,文章采用Boosting算法和卷积神经网络算法,对基于这两类不同机器学习算法的5种模型进行了学生课堂行为自动识别准确率实验。实验结果表明,在学校教室这种识别比较困难的场景,基于人体骨架信息提取的学生课堂行为自动识别可以达到较高的精度,其中基于Boosting算法的XGBoost模型识别准确率最高。文章的研究推动了计算机视觉技术和机器学习技术的进一步应用,有助于解决学生课堂行为自动识别难题,并助力教师优化教学策略、提高教学效率。  相似文献   

4.
随机森林算法随机选择多个决策树构成森林,算法分类结果由这些决策树投票得到,在运算量没有显著增加的前提下提高了预测精度,是一种目前比较流行的组合分类器算法。随机森林算法不仅可以用来做分类,也可用来做回归预测,是机器学习、计算机视觉等领域内应用极为广泛的一个算法。该文将随机森林分类算法用于交通状态判别,利用实测数据进行模型训练和验证,并用袋外数据计算判别正确率,实验结果表明该方法具有可行性,为交通状态判别提供了一种新思路。  相似文献   

5.
传统自动柜员机(ATM)监控系统以摄像为主,不能及时检测用户身份是否异常。提出一种基于行为特征的ATM机用户身份实时识别方法,采集用户输入密码时的触屏行为特征数据,通过SVM分类算法判断该用户行为是否属于合法用户。该方法不仅要求用户输入的账户密码正确,还要求该用户的行为特征与预设定的合法用户行为特征一致。实验结果表明,通过数据预处理和SVM分类算法参数优化后的ATM机用户身份识别系统识别精确度达到97.9769%,比没通过数据预处理和SVM分类算法参数优化后的识别精确度高出4.5769%。  相似文献   

6.
基于在线学习行为预测学生成绩可以辅助教师动态掌握学情,制定差异化的教学策略,然而在混合课程中仅仅依据在线数据对学生成绩迸行预测难度很大,尚处于探索中.文章选取某高校2018秋季学期和2020春季学期的"高活跃型混合课程"学生在线行为数据,采用增量学习的随机森林算法构建学生成绩预测模型,研究发现:(1)增量学习随机森林算法在混合课程样本最多的数据集中,获得预测结果准确率最高(75.1%);(2)相较于批量学习随机森林算法,增量学习算法在数据样本量较多的数据集中预测结果准确率更高;(3)当样本数量达到一定规模后,预测结果准确率波动减小、稳定性增强.本研究采用增量学习随机森林算法预测混合课程中的学生成绩,不仅取得了较好的预测准确率,而且解决了新增数据后模型的稳定性问题,将有助于模型的迭代优化,提高模型的通用性,以及可持续追踪学生在不同学期的学习行为特征.  相似文献   

7.
为了实现教育领域的“个性化”,无论是自由组卷的个性化,还是试题推荐的个性化,都首先需要确定试题难易度。研究目标为寻找新的方法解决基于试题难易度的分类问题,提高分类准确率。以高中数学为例,采用2018年多套高考数学试题作为实验数据,对原始数据各个特征进行相关性分析,剔除影响较小的特征,再采用随机森林算法探索试题难易度分类问题,对参数进行改进优化,并与其它分类方法进行对比。实验结果证明,采用随机森林的高中数学试题分类准确率高达90%,而其它3种分类算法准确率分别为72%、74%、74%。因此得出结论,随机森林算法在高中数学试题难易度分类上有较好表现,能够大幅提高分类准确率。  相似文献   

8.
针对目前三维人脸模型的语义标记和分割研究较少的问题,提出一种基于正方形切平面描述符的三维人脸模型区域标记算法。这种新的描述符由三维人脸模型顶点的正方形切平面区域内的几何信息编码而成。随后通过随机森林算法对其进行学习,对模型上的所有顶点进行分类,从而实现对三维人脸模型上眉毛、眼睛、鼻子、嘴巴等区域的识别和标记。在定位仿真实验中,分类准确率可达94.46%。该描述符具有旋转、头部姿势与三维模型分辨率不变性,对模型噪声具有鲁棒性。实验结果表明,该方法能有效标记三维人脸模型区域。  相似文献   

9.
为了解决电费回收问题,采用机器学习算法,通过对电力客户历史数据进行分析和研究,选择精确度普遍较高的随机森林算法,采用用电客户的基本信息、缴费行为、用电特征等多个维度确定模型指标,构建用户欠费模型,在分析用户欠费行为的同时对客户的欠费行为进行风险评级,提高对欠费用户的识别效率,降低电费回收的风险,通过该方法可以有效预测用户欠费风险.  相似文献   

10.
针对银行客户信用评估模型不健全不完善等问题,在对比随机森林(RF)、GBDT和XGBoost三种集成算法基础上,提出基于XGBoost算法的金融客户信用评估模型。从知名的UCI数据库中选取德国某银行客户信用数据集,在对数据进行缺失值、标准化等预处理后,分别对随机森林(RF)、GBDT算法和XGBoost三种集成算法建立个人信用评估模型,然后依据计算得到的相关多元评价指标对个人信用评估进行对比研究。实证结果表明,建立在XGBoost集成算法上的个人信用评估模型性能最优,在准确率指标上比随机森林(RF)高出6%,比GBDT算法高0.8%。  相似文献   

11.
针对古漆器漆膜数据类间不平衡、样本规模小,以及传统机器学习算法分类效果较差的问题,提出一种改进SMOTE的过采样方法改变漆器漆膜数据样本分布,使其达到平衡。该方法通过比较各类样本间的欧式距离,删除了人工样本中的噪声数据,然后运用集成学习中的随机森林算法进行分类,提高了少数类的分类准确率。UCI数据集上的实验结果表明,改进的过采样方法性能更优,评价指标F1-score与AUC值分别得到2%、5%以上的提升。结合改进的过采样方法与机器学习算法进行对比实验,结果证明,随机森林算法精度更高,在对古漆器年代的判别中,随机森林算法的F1-score与AUC值高达87.76%、89.34%。  相似文献   

12.
针对垃圾邮件大量存在的问题,提出基于MapReduce并行SVM的垃圾邮件分类算法,用支持向量机作为分类器,基于MapReduce将各子分类器进行合并,并通过重训练得到模型,利用该模型对测试集进行分类,得到结果。为解决算法精度损失、准确率低等问题,引入KNN,在原算法基础上进行循环迭代。  相似文献   

13.
通过惯性校正方法和重新构造响应函数法来克服BP神经网络学习算法上存在收敛速度慢,容易陷入局部极小的问题,对BP网络学习算法进行了改进.利用小波多尺度边缘检测对列车异物图像进行分割和特征提取,并利用矩不变量特征和改进BP神经网络对列车异物自动识别和分类,实验结果表明使用这种方法使得系统具有更好的稳定性和更快的响应速度.  相似文献   

14.
在介绍SVM和KNN分类算法的基础上,提出了一种新的、较简单的,但更为合理的基于表模型的文档表示方法,阐述了一种基于表模型的分类算法——TableKNN算法。通过实验比较TableKNN算法与传统KNN算法应用于文本分类的效果,证实了TableKNN算法在处理文本分类问题上的优越性。  相似文献   

15.
针对传统信用评价方法分类精度较低、数据集属性变量间存在相关性等问题,提出基于主成分分析的稀疏贝叶斯学习(PCA-SBL)算法。首先对数据集特征变量进行主成分分析,使降维后的变量无相关性|其次,对主成分分析后的数据进行稀疏贝叶斯分类|最后将 PCA-SBL 分类方法分类精度与传统分类方法精度进行比较。分析发现,在 German Credit Data 和 Australian Credit Data 上,与传统 KNN、朴素贝叶斯、SVM、随机森林、决策树相比,改进的 SBL 算法分类精度平均提高了 5.26%、4.65%、2.11%、2.125%、4.66%,与稀疏贝叶斯学习算法(SBL)相比,平均提高 0.965%,从而证明 PCA-SBL 算法具有更高的分类效果。  相似文献   

16.
为了改善复杂环境下的人脸识别精度,特别是在当前疫情防控转入常态化的形势下,提升戴口罩场景下的人脸识别精度及红外测温精度至关重要。基于对场景数据的统计和分析,通过对识别参数的动态优化,提升人脸算法识别精度;基于人脸检测的戴口罩检测算法,自动识别是否戴口罩,并针对戴口罩场景采用专用的人脸识别模型,提升人脸识别性能;基于人脸检测的红外测温技术,自动识别测温区域和距离,并对测温结果进行校正,提高测温精度。结果表明,开放场景下识别准确率超过98%;人证核验场景下识别准确率超过93%,戴口罩场景下识别准确率超过92%,红外测温误差小于0.3℃。基于场景适配的参数优化策略,能够在不依赖核心算法性能提升的条件下,使得人脸算法识别性能提升7%;基于人脸检测的红外测温技术,通过温度补偿策略,使得测温误差小于0.3℃。  相似文献   

17.
葡萄酒的化学成分是辨别葡萄酒品种的主要依据。考虑到常规检测方法复杂、繁琐,准确率低,选择机器学习方法识别葡萄酒种类。针对目前常用的K均值算法在葡萄酒识别中存在的问题,尝试使用支持向量机进行分类,并与K均值算法进行对比分析。结果表明,基于支持向量机的模型分类性能更好,准确率达到98.15%。  相似文献   

18.
雌激素受体α亚型(Estrogen receptors alpha,ERα)被认为是治疗乳腺癌的重要靶标,对于治疗乳腺癌非常关键。为准确找出能抑制ERα活性的化合物,以504个分子描述符作为研究变量,采用Spearman相关系数、最大互信息系数和随机森林特征选择三种方法,分别筛选出排名前30的分子描述符,综合三种方法的结果,使用基于秩的变量选择算法选出前20个对生物活性最具显著影响的分子描述符,并分别建立岭回归和随机森林非线性回归模型对其进行比较。结果表明,随机森林模型方法的预测效果更好,可用于化合物对ERα生物活性值的预测。  相似文献   

19.
由于海关检查人员的木材分类专业知识参差不齐,进口的珍稀和濒危木材常被伪报成普通木材以逃避监管,因此开发基于Web的木材图像远程鉴定系统,为检查人员提供便捷的木材种类自动识别工具.木材图像远程鉴定系统包括Web端、木材数据库与服务器端,其中服务器端包括应用服务器与木材图像识别服务器.将算法模型部署在木材图像服务器上,通过...  相似文献   

20.
《宜宾学院学报》2019,(12):92-99
针对P2P网络借款平台存在着借款人与投资人信息的不对称性、借款成功率低下这些阻碍网贷平台未来发展的问题,依托已有的非均衡少量样本数据,构建随机森林预测模型并进行实证分析.结果表明,随机森林模型对各级风险样本的正确识别率接近100%,说明该模型具有很高的实用价值和很好的预测能力.与其他模型相比,随机森林比线性模型和广义线性模型的预测精度高,抗噪声性能良好,且能够有效估计模型中各变量在分类中的重要性.通过对各评价指标的重要程度及其与借贷成功率之间的关系的分析,可为P2P网贷发展提供理论依据和实践基础.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号