首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
集成学习算法的效果取决于各个基分类器,如何构造有效的基分类器是关键。对集成学习算法中的Bagging算法进行了研究,提出了一种基于层次抽样构造SVM基分类器的方法进行P2P流分类,并通过实验验证了该方法的有效性。  相似文献   

2.
为提高含容参元件模拟电路软故障的诊断率,并考虑到单分类器分类精度的提升已达到了一个瓶颈,提出一种优化AdaBoost-SVM算法并将其应用于模拟电路故障诊断中。以OrCAD/PSpice软件中对电路进行Monte-Carlo分析的数据为基础,选取特征时,采用对时频信号中易直接测量的物理量归一化后组合的方式。实验结果表明,通过选取的组合特征向量,利用优化的AdaBoost-SVM算法,构造出具有差异度的SVM分类器并集成后,能够自适应地提升单SVM分类器性能,表现出更好的分类精度与泛化性能,能较好地满足容差模拟电路软故障诊断要求。  相似文献   

3.
如何从小样本、高维度特性的功能磁共振成像(fMRI)数据中识别出内在的脑区活动模式,对理解人脑意义重大。随着模式识别技术和机器学习算法的发展,fMRI的分类研究也引起了人们的重视。提出一种对fMRI数据分类的加权随机SVM集群(WRSVMC)算法。该算法分为两步,首先通过随机选择样本和特征建立多个SVM,以构建集成分类器;然后在投票过程中,对每个SVM赋权重,以优化模型的集成性能。结合fMRI数据和图论特征,采用WRSVMC算法对轻度认知障碍(MCI)患者数据展开分类研究。结果表明,准确率最高可达87.67%。该方法能帮助医师对MCI患者进行辅助诊断。  相似文献   

4.
肺栓塞是一种致死率很高的常见疾病,肺栓塞的预测和早期诊断对于人类的健康具有重要意义。本文提出了一种基于属性聚类的多示例集成学习方法,首先采用K-Means聚类算法对CTA数据进行属性聚类,降低数据的维度,然后用多示例集成学习方法进行肺栓塞预测。在真实世界数据集上的实验结果显示,与属性聚类前、单个分类器及一般的简单集成学习方法相比,该方法构造的分类器取得了更好的预测效果。  相似文献   

5.
为提高早期糖尿病患病风险的预测准确性,基于集成学习算法建立糖尿病患病风险预测模型.分别基于集成学习算法随机森林、GBDT和XGBoost建立糖尿病预测模型,并比较以上3种方法与单一分类器支持向量机和BP神经网络的分类预测性能.在UCI数据库的早期糖尿病数据集上进行验证试验,使用准确率、精确率、召回率、F1分数和AUC ...  相似文献   

6.
针对个人信用数据存在连续型和离散型交织并存以及类不平衡问题,为提高信用评估分类效果,提出一种结合代价敏感和集成算法的个人信用评估分类模型.通过集成信息价值、互信息、信息增益率和基尼指数特征,选择算法生成最优特征子集.结合代价敏感构建以L1-逻辑回归、弹性网-逻辑回归、贝叶斯、决策树和神经网络为基模型的集成模型,并辅之动...  相似文献   

7.
为提高肺癌患者存活性预测的准确率,提出一种基于Stacking集成学习的肺癌患者存活性预测模型.先对数据集进行预处理、特征选择、变量转换等,然后以XGBoost(eXtreme Gradient Boosting)、SVM(Support Vector Machine)和LR(Logistic Regression)3种算法为基学习器,以朴素贝叶斯为元学习器构造模型,再运用Grid Search网格搜索方法优化超参数,并利用交叉验证方法对SEER公开的肺癌数据集进行仿真实验.研究结果表明,该模型的预测准确率达85%,比单一模型高10%.该模型在肺癌患者存活性预测上有着更好的准确性和解释性,可以很好地为肺癌患者预后提供决策支持,以弥补经验的不足.  相似文献   

8.
提升基于数据流的数据挖掘正确率并克服概念漂移的影响是当前的研究热点之一。相对于传统意义上的数据挖据,基于数据流的数据挖掘具有动态、数量多、持续性强等特点。由于传统的数据挖掘算法都是应用于静态数据,挖掘结果并不完全匹配动态变化。将样本数据流进行数据块化处理后使用集成算法,可提升流数据挖掘的准确性。其中集成算法基分类器包括决策树和KNNModel算法等。对于不同算法的效果给予不同权值,提升算法相比于基分类器,能够更加准确地判定概念漂移的发生。实验结果表明,通过集成学习方法可以有效提升学习效果及分类判定准确率,非同质类型的集成算法对于抑制概念漂移的不良影响可起到一定作用。  相似文献   

9.
支持向量机(SVM)在处理大样本特征维数较多的数据集时,算法消耗时间长而且容易陷入局部最优解,选择不合适的SVM算法参数会影响SVM模型分类性能。为了提高SVM性能,提出了基于粒子群算法(PSO)和遗传算法(GA)相结合的SVM特征选择与参数同步优化算法PGS。在UCI标准数据集上的实验表明,PGS算法能有效地找出合适的特征子集及SVM算法参数,提高收敛速度并能在较小的特征子集获得较高的分类准确率。  相似文献   

10.
针对古漆器漆膜数据类间不平衡、样本规模小,以及传统机器学习算法分类效果较差的问题,提出一种改进SMOTE的过采样方法改变漆器漆膜数据样本分布,使其达到平衡。该方法通过比较各类样本间的欧式距离,删除了人工样本中的噪声数据,然后运用集成学习中的随机森林算法进行分类,提高了少数类的分类准确率。UCI数据集上的实验结果表明,改进的过采样方法性能更优,评价指标F1-score与AUC值分别得到2%、5%以上的提升。结合改进的过采样方法与机器学习算法进行对比实验,结果证明,随机森林算法精度更高,在对古漆器年代的判别中,随机森林算法的F1-score与AUC值高达87.76%、89.34%。  相似文献   

11.
1 Introduction The degree of malignancy in brain glioma[1]domi-nates the way of treatment .In case of gradeⅠorⅡaccording to Kernohan,the success rate of operationis satisfactory. Otherwise ,for gradeⅢor IV,the sur-gical risk is high ,and poor life qual…  相似文献   

12.
为提高大数据集粗分类识别率,提出一种基于聚类分析的SVM-Kd-tree树型粗分类方法。首先根据数据集特征分布进行k-means两簇聚类,对聚类后的数据集进行类别分析,同时将属于两簇的同一类别样本划分出来;然后使用两簇中剩余样本训练SVM二分类器并作为树型结构根节点,将两簇数据分别合并,将划分出来的样本作为左右子孩子迭代构建子节点,直到满足终止条件后,叶子节点开始训练Kd-tree。实验结果表明,迭代构建树型粗分类方法使训练单一SVM平均时间减少了61.977 4%,比Kd-tree同近邻数量的准确率提高了0.03%。在进行大规模数据集粗分类时,使用聚类分析迭代构建组合分类器时间更短、准确率更高。  相似文献   

13.
注重整体音乐教学手段的应用是对传统器乐合奏教学观的超越。在器乐合奏教学中,应利用整体音乐教学手段:调动学生各种感官的协同作用,发挥学生的主体作用、教师的主导作用和指挥的宏观调控作用,构建有利于学生的学习环境,切实提高教学实效。  相似文献   

14.
针对非平稳噪声环境下的语音活动检测问题,提出了基于在线单类SVM的自适应语音活动检测算法。该算法采用单类SVM对多种特征信息进行在线学习与综合,为非平稳背景噪声建模,并采用双层决策机制,能有效提高语音活动检测的稳健性。在语音识别系统中的实验结果表明,算法在多种噪声环境和信噪比条件下有效,并明显提高了在非平稳噪声环境下的识别率。  相似文献   

15.
针对车牌字符在车牌图象退化时识别率较低的问题,提出一种基于神经网络集成的车牌字符识别方法。基于小生境遗传算法在提高进化的局部搜索方面的良好性能来动态构建个体网络差异性大的神经网络集成,进而提高整个集成系统的泛化能力。将该方法应用于车牌字符的识别,实验结果表明,该方法能有效地生成差异度较大的个体网络,得到的神经网络集成能有效提高车牌字符的识别率。  相似文献   

16.
熊思 《培训与研究》2009,26(8):87-90
乳腺癌是现代女性最常见的恶性肿瘤之一。支持向量机SVM是一种基于统计学习理论的机器学习算法,它能在训练样本很少的情况下达到良好的分类效果。本文提出一个基于支持向量机的超声乳腺肿瘤图像计算机辅助诊断系统,它由图像预处理、ROI特征提取和SVM分类器异常诊断三个模块构成。通过实验证明,在处理相同的样本数据集时,基于SVM算法的计算机辅助诊断系统相对于BP神经网络,有更高的诊断灵敏度。统计学习理论的发展将更加完善SVM,具有高分类性能的分类器将使计算机辅助诊断的能力进一步提高。  相似文献   

17.
INTRODUCTION Support Vector Machine (SVM) is a relativelynew soft computing method based on statisticallearning theory presented by Vapnik (1995). In SVM,original input space is mapped into a high dimen-sional dot product space called feature space in whichthe optimal hyperplane is determined to maximize thegeneralization ability of the classifier. The optimalhyperplane is found by exploiting a branch ofmathematics, called optimization theory, and re-specting the insights provided by …  相似文献   

18.
可靠的语音端点检测算法是稳健语音识别系统所必须的。针对现有算法在噪声环境下的稳健性问题,提出了基于单类SVM(Support Vecfor Machine)的端点检测算法。通过对多特征信息进行在线学习与综合,以及采用双层决策机制,有效提高了语音检测的稳健性。实验表明,算法在多种噪声环境和信噪比条件下有效,明显提高了语音识别系统在噪声环境下的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号