首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 312 毫秒
1.
选取了城市生活垃圾产量的7个影响因素,采用本征值与病态指数检验法进行多重共线性进行诊断,说明在7个因素之间存在着严重的多重共线性,为了克服多重共线性导致的预测失真问题,运用偏最小二乘回归模型,以合肥城市垃圾产量为研究对象,按照交叉有效性的决策原则,建立了预测模型,所提取成分对X累计解释能力达到99.74%,对y的累计解释能力达到97.03%,具有较高的预测精度,该方法还可进一步应用到类似问题中。  相似文献   

2.
为了提高南京某所某型雷达伺服系统故障诊断准确率,考虑到传统故障诊断算法的局限性,提出一种基于 Stacking 集成算法的雷达伺服系统故障诊断方法。针对某所某型雷达伺服系统的历史监测数据,首先采用孤立森林算法识别异常样本|然后基于原始数据构造出新的特征,使用卡方检验进行特征选择,并使用SMOTE 算法解决样本不平衡问题|最后,通过建立一种新颖、准确的基于 XGBoost、随机森林和 BP 神经网络的Stacking 集成模型进行故障诊断。实验结果表明,该方法在测试集上的诊断准确率达到了 96.2%,比传统方法诊断准确率提高了 1.8%,证明该方法能够很好地完成雷达伺服系统故障诊断任务。  相似文献   

3.
可读性指文本易于阅读的程度或性质,评估对外汉语文本可读性在对外汉语教学中十分重要。文章针对对外汉语文本可读性难以人工评估的问题,提出了一种基于随机森林算法的对外汉语文本可读性自动评估方法。该方法从基础特征、词性特征、等级特征和语法特征这四个维度提取特征,进行特征选择后在训练集上利用随机森林算法训练分类器,并在测试集上证实了该方法的有效性。  相似文献   

4.
体液组织来源的鉴定可为刑事案件的侦查提供线索和证据。为了建立一种高效的法医学体液鉴定方法,本研究选取了8个新的体液特异性DNA甲基化标志物,并基于这些标志物构建了可用于5种常见体液(静脉血、唾液、经血、阴道液和精液)鉴定的多重单碱基延伸反应(SNa Pshot)体系。结果表明,该系统具有良好的物种特异性和灵敏度,可用于混合生物样本的鉴定。同时,本研究利用前期研究数据构建了一个人工体液预测模型和两个分别基于支持向量机和随机森林算法的机器学习预测模型,并利用本研究获得的检测数据(n=95)对这些预测模型进行了测试。基于研究者经验建立的人工预测模型的准确率为95.79%,支持向量机预测模型对除唾液(96.84%)外的所有体液的预测准确率均为100.00%,随机森林预测模型对5种体液的预测准确率均为100.00%。综上所述,我们所构建的SNaPshot系统和随机森林预测模型能够实现体液组织来源的准确鉴定。  相似文献   

5.
多重共线性通常指不完全多重共线性。当两个或多个自变量之间具有很强的(但不是完全的)线性函数关系,并且这种线性关系已经显著地影响方程的估计时,就可能会产生严重的后果。本文对多重共线性进行了较为深入的分析,并提出了相应的补救措施。  相似文献   

6.
为提高早期糖尿病患病风险的预测准确性,基于集成学习算法建立糖尿病患病风险预测模型.分别基于集成学习算法随机森林、GBDT和XGBoost建立糖尿病预测模型,并比较以上3种方法与单一分类器支持向量机和BP神经网络的分类预测性能.在UCI数据库的早期糖尿病数据集上进行验证试验,使用准确率、精确率、召回率、F1分数和AUC ...  相似文献   

7.
基于在线学习行为预测学生成绩可以辅助教师动态掌握学情,制定差异化的教学策略,然而在混合课程中仅仅依据在线数据对学生成绩迸行预测难度很大,尚处于探索中.文章选取某高校2018秋季学期和2020春季学期的"高活跃型混合课程"学生在线行为数据,采用增量学习的随机森林算法构建学生成绩预测模型,研究发现:(1)增量学习随机森林算法在混合课程样本最多的数据集中,获得预测结果准确率最高(75.1%);(2)相较于批量学习随机森林算法,增量学习算法在数据样本量较多的数据集中预测结果准确率更高;(3)当样本数量达到一定规模后,预测结果准确率波动减小、稳定性增强.本研究采用增量学习随机森林算法预测混合课程中的学生成绩,不仅取得了较好的预测准确率,而且解决了新增数据后模型的稳定性问题,将有助于模型的迭代优化,提高模型的通用性,以及可持续追踪学生在不同学期的学习行为特征.  相似文献   

8.
通过随机森林算法获取变量的重要性并进行排序,确定模型参数,建立分类预测模型。实验表明,依据随机森林算法建立的模型,具有很好的分类及预测能力。  相似文献   

9.
为降低经济指标众多及外部因素给经济预测准确度带来的影响,有效提高区域经济预测性能,借助元学习算法的小样本分析优势,提高随机森林算法的适用性,实现区域经济预测。根据区域经济统计数据选取多个数据样本,构建随机森林算法的经济预测模型,通过多个弱分类器投票获得经济预测结果;考虑弱分类器权重数量较少,借助元学习算法对权重进行优化;采用优化的随机森林算法模型完成区域经济预测,并选取中等城市和区不同数量规模的经济样本进行多个经济指标预测仿真。结果表明,经过元学习优化后,随机森林算法在区域生产总值、进口额增长率和居民消费价格指数等方面的预测误差率均有大幅下降,元学习对随机森林算法的优化效果显著。  相似文献   

10.
冒伟 《教育技术导刊》2020,19(3):248-251
为解决传统谱聚类算法在图像分割时计算量大、使用单一特征分割的局限性问题,设计一种融合谱聚类和多特征的图像分割算法。首先进行超像素分割以减少计算量,分别提取每个超像素的颜色特征和纹理特征,构建超像素相似度矩阵|然后采用特征加权方法线性融合颜色和纹理特征的超像素相似度矩阵|最后采用谱聚类算法进行聚类分割。在UCMerced_LandUse和Berkeley数据集上进行实验测试,并与现有方法进行比较。实验结果表明,大多数实验图像IOU指标均在90%以上,相比于传统方法有了显著提高。  相似文献   

11.
对基于CFA(颜色滤波阵列)模型的篡改检测算法进行了改进。其检测过程为:首先,利用插值算法得到像素位置的预测误差,根据预测误差计算出CFA单元特征;然后,利用EM(期望最大化)算法估计特征模型的参数,算法对篡改位置的均值不做事先确定(从实验来看这种改进具有较好的效果);最后,利用贝叶斯理论计算出每个像素点的似然率,根据似然率的不同来定位篡改区域。在进行单CFA阵列模式检测的情况下,对多种CFA阵列模式的图像也进行了检测分析,实验结果显示,该算法能够对多种CFA阵列模式的图像准确定位篡改区域。  相似文献   

12.
Co-training is a semi-supervised learning method, which employs two complementary learners to label the unlabeled data for each other and to predict the test sample together. Previous studies show that redundant information can help improve the ratio of prediction accuracy between semi-supervised learning methods and supervised learning methods. However, redundant information often practically hurts the performance of learning machines. This paper investigates what redundant features have effect on the semi-supervised learning methods, e.g. co-training, and how to remove the redundant features as well as the irrelevant features. Here, FESCOT (feature selection for co-training) is proposed to improve the generalization performance of co-training with feature selection. Experimental results on artificial and real world data sets show that FESCOT helps to remove irrelevant and redundant features that hurt the performance of the co-training method.  相似文献   

13.
特征选择是避免维度诅咒的一种数据预处理技术。在多变量时间序列预测中,为了同时找到与问题相关性最大的变量及其对应时延,提出一种基于多注意力的有监督特征选择方法。该方法利用带有注意力模块和学习模块的深度学习模型,将原始二维时间序列数据正交分割成两组一维数据,分别输入两个不同维度的注意力生成模块,得到特征维度和时间维度的注意权重。两个维度的注意力权值点积叠加作为全局注意力得分进行特征选择,作用于原始数据后输入随学习模块训练不断更新至收敛。实验结果表明,所提出的方法在特征数小于10时可达到全量数据训练效果,与现有几种基线方法相比实现了最佳准确率。  相似文献   

14.
为了使聚类可以在低维数据空间中进行,提出了一种新的聚类特征选择方法.该方法分3个步骤,每个步骤都在一个wrapper框架中执行.首先,将所有原始特征都按照重要性进行排序,引入一个特征重要性评价函数E(f);然后,顺序地选择特征组成重要特征子集;最后,去除重要特征子集中可能存在的冗余特征.由于是顺序选择特征而不是在巨大的特征子集空间中进行搜索,因此算法效率很高.实验结果表明该方法可以找出有助于聚类的重要特征子集,并且可以去掉那些不利于聚类的特征.  相似文献   

15.
Mutual information is an important information measure for feature subset. In this paper,a hashing mechanism is proposed to calculate the mutual information on the feature subset. Redundancy-synergy coefficient,a novel redundancy and synergy measure of features to express the class feature,is defined by mutual information. The information maximization rule was applied to derive the heuristic feature subset selection method based on mutual information and redundancy-synergy coefficient. Our experiment results showed the good performance of the new feature selection method.  相似文献   

16.
为了改善传统脑电情绪识别方法需要对脑电信号进行深入了解,且需要人工提取相关特征的缺点,基于深度森林的表征学习能力对脑电样本的时域与频域数据进行自动特征提取,并融合32通道脑电信号的时域特征向量和频域特征向量,通过级联森林对特征作进一步学习。实验结果表明,该方法对效价二分类预测的准确率达到68.4%,查准率达到66.3%,查全率达到89.9%,F1分数达到76.3%;对唤醒度二分类预测的准确率达到68.2%,查准率达到65.8%,查全率达到91.2%,F1分数达到76.4%。通过与DEAP数据集使用EEG信号给出的二分类实验结果进行对比,基于深度森林的脑电情绪识别方法对未知样本的识别准确率高于DEAP的结果。  相似文献   

17.
对当前建立的基于基因表达式编程的软件可靠性评测方法进行改进,引入了连续一步向前预测方式,并以改进后的系统和传统的数学模型预测方法做了对比实验。实验的结果证明基于GEP的预测方法具有更高的预测精度。  相似文献   

18.
采用机器学习中的随机森林算法对葡萄酒的化学特性与葡萄酒的品质之间的关系进行学习,并建立了有效的模型对葡萄酒品质进行预测。该方法具有预测准确率高、预测精度稳定以及葡萄酒分级详细等特点,在葡萄酒行业品质预测的应用中,能够有效地减少因品酒师个人因素带来的评级波动。还将实验结果与已经存在的一些工作进行量化比较,特别是在成本(风险)比较中,所提供的方法明显优于已有的方法。  相似文献   

19.
In this paper, a wavelet packet feature selection method for lung sounds based on optimization is proposed to obtain the best feature set which maximizes the differences between normal lung sounds and abnormal lung sounds (sounds with wheezes or rales). The proposed method includes two main steps: Firstly, the wavelet packet transform (WPT) is used to extract the original features of lung sounds; then the genetic algorithm (GA) is used to select the best feature set. The obtained optimal feature set is sent to four different classifiers to evaluate the performance of the proposed method. Experimental results show that the feature set obtained by the proposed method provides a higher classification accuracy of 94.6% in comparison with the best wavelet packet basis approach and multi-scale principal component analysis (PCA) approach. Meanwhile, the proposed method has effective generalization performance and can obtain the best feature set without priori knowledge of lung sounds.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号