首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
利用近红外光谱与判别分析相结合的方法对不同生产厂家的银黄颗粒剂进行分类鉴别。采用多元散射校正(MSC)+一阶导数对银黄颗粒剂的近红外光谱进行预处理,在7400~4000cm-1光谱区间内建立近红外判别分析模型,并用三重交叉验证的方法对模型的稳定性进行验证。所建判别分析模型对校正集样品的分类鉴别准确率为100%,对验证集样品的预测鉴别准确率为100%。结果表明,该方法准确、快速、简便,可用于不同生产厂家银黄颗粒剂的分类鉴别。  相似文献   

2.
针对复杂非线性多通道时变信号模式分类问题,提出了一种集成卷积神经网络(CNN)与随机森林(RF)相融合的方法。该方法以CNN为基学习器,自动提取信号样本的抽样特征,同时省去降维与人工选择特征的过程,以RF为次级学习器,增加样本扰动,同时增加属性扰动。为增强样本多样性,使得该模型尽可能充分利用信息,在训练集中随机抽取7份子训练集,再利用7份子训练集训练出7个不同的学习器;最后通过投票法和学习法建立集成模型,提高了识别精度。实验结果表明,在测量区间上,该方法对3种ECG信号类别的平均分类精度达94.60%,提高了1.1%,取得了良好结果,验证了模型和算法的有效性。  相似文献   

3.
利用红外光谱与随机森林相结合的方法对不同产地蕨麻进行分类鉴别,测定了42个来自青海省不同产地的蕨麻样品的红外光谱。小波变换对红外光谱原始谱图数据进行了预处理,红外光谱数据压缩到原来的1/8,其分析精度与原始光谱数据基本相当。将42个样品划分为有30个样品的训练集和12个样品的测试集,建立随机森林预测蕨麻产地模型。使用内部交叉验证和外部数据进行验证,采用R语言实现随机森林算法,并对模型的参数进行了优化。结果表明,所建立的判别模型中训练样本和测试样本判别正确率均为100%。建立的模型能够正确地对蕨麻样品快速进行产地鉴别,红外光谱法结合随机森林可作为中药材产域分类鉴别的一种新的尝试。  相似文献   

4.
红外光谱结合人工神经网络鉴别浓缩苹果汁生产厂家   总被引:1,自引:0,他引:1  
利用红外光谱结合人工神经网络技术对不同厂家生产的浓缩苹果汁进行了鉴别.在800~1100cm-1波段采集不同样品的红外光谱,利用小波分析将156个原始数据压缩至21个,然后进行主成分分析,提取前3个特征向量.以样本的前3个特征向量为输入,建立结构为3-5-1的三层BP神经网络进行训练和预测.训练样本集包含48个样本,预测样本集包含21个,预测结果正确率达95%.  相似文献   

5.
目的:由于高光谱成像的特性,高光谱遥感影像较光学、多光谱影像具有更多的光谱信息,因此对高光谱影像地物的分类也相对困难。为提高分类精度,本文提出一个新的高光谱遥感影像分类模型。创新点:考虑到不同的地物覆盖对不同波段范围的电磁波有不同的敏感度,本文提出一个基于卷积神经网络和光谱敏感度的深度学习模型,以提高对高光谱遥感影像地物分类的准确率。通过在最终的分类器后添加一个光谱权重,该模型能够更准确地分类地物。方法:1.将带标记的样本在光谱维度上分为可见光和红外波段,并将部分样本作为训练集和测试集输入到网络中进行训练。2.训练完成后利用模型对全图进行预测,并通过部分预测结果计算出未识别率δ和误识别率γ两个参数。3.利用δ和γ可计算出不同光谱范围的光谱权重并将其置于分类器前(图5)。结论:1.模型加入光谱权重后的分类准确率较之前提高了约2%。2.利用公共数据集测试后显示,使用了光谱权重的卷积神经网络模型的分类精度比未使用光谱权重的模型高约1%。3.本文结果显示,利用不同地物对电磁波的敏感性差别可以增加不同地物间的差异,从而提升分类模型的性能。  相似文献   

6.
农业文本分类旨在对主流的农业信息网抽取的文本数据集进行分类.在样本充足的情形下,经典的支持向量机方法能取得较好的效果,然而在样本较少或者样本矩阵很稀疏的情形下效果较差.提出了一种基于特征族群语义扩散核(它是语义扩散核的一种)和支持向量机的半监督农业文本分类方法.该方法在经典的支持向量机方法基础上结合特征族群语义扩散核,使得农业文本分类准确率得到一个显著的提升,在训练集样本数量只有原来一半的数量情况下预测原来的测试样本,预测准确率几乎与原来的相同.  相似文献   

7.
出了一种可伸缩的朴素贝叶斯分类算法。算法针对大数据集的训练数据,通过构建雨林框架,能在有限主存里存储训练数据,训练生成概率矩阵,进而对测试样本进行分类。算法仅对整库一次扫描。实验表明,该算法能够获得与整库读入主存相同的分类准确率.并且有较高的处理效率。  相似文献   

8.
常用的网页分类技术大多基于普通文本分类方法,没有充分考虑到网页分类的特殊性--网页本身的半结构化特征以及网页中存在大量干扰分类的噪音信息,同时多数网页分类的测试集和训练集采源于同一个样本集而忽视了测试集中可能包含无类别样本的可能.基于向量空间模型,将样本集看成由有类别样本和无类别样本两部分组成,同时选择了样本集来自于相同的网站,在去除网页噪音基础上结合文本相似度算法和最优截尾法,提出了一种基于不完整数据集的网页分类技术LUD(Learning by Unlabeled Data)来改善分类效果,提高分类精度.实验证明:LUD算法与传统的分类方法相比较而言,不但可以提高已有类别样本的分类精度,更主要的是提供了一种发现新类别样本的方法.  相似文献   

9.
基于近红外光谱结合化学模式识别中的偏最小二乘法研究了一种快速、简单和低成本检测STR基因型的方法.选择STR基因座D5S818中的总串数相差较大的10—10、11—11与13—13基因型作为研究对象,将这三个基因型样本进行标准的PCR扩增并采集PCR产物的近红外光谱,以每一基因型的任意三分之二样本作为校正集,剩余三分之一作为预测集样本,探索了基于近红外光谱进行基因分型的可能性,结果发现该三类模型能够得到正确的判别,没有误判,预测集预测率达到100%.成功实现了基于近红外光谱对STR基因型的快速、简单和低成本检测.  相似文献   

10.
为了满足车牌识别系统对国内车牌字符的有效识别,利用最大似然分类简单快速、实施方便的特点,提出了一种最大似然分类的国内车牌字符识别的方法。通过对样本图像进行采集和预处理,再提取字符的特征数据并建立训练集数据库,依据字符特征向量样本和最大似然分类建立字符识别模型,针对不同类别的字符提供训练模式,对训练集样本进行模型学习和训练完成机器学习算子,最后完成车牌的识别。实验结果表明,作为国内车牌字符识别的一种方法参考,该方法可以有效识别国内车牌字符。  相似文献   

11.
《嘉应学院学报》2016,(5):16-20
针对传统Android恶意应用检测方法在处理大规模样本时存在的训练时间长、存储空间消耗大的问题,提出一种基于增量学习SVM的Android恶意应用检测方法.该方法提取Android应用的权限申请和API函数调用特征,利用增量学习SVM理论将训练样本集随机划分为初始样本集和若干个增量样本集,利用循环迭代方法训练SVM分类器,每次新的训练仅保留上一轮训练得到的支持向量集并合并到新增样本集中,舍弃大量对分类结果不产生影响的样本以提高分类器学习效率,同时产生新的支持向量集,并最终得到一个高精度的SVM分类器.通过将增量学习SVM算法与基本SVM算法进行对比实验,结果表明,该算法可以有效降低分类器学习时间,减少样本存储的空间占用,同时随着样本规模的积累逐步提高分类精度.  相似文献   

12.
为减少不均衡数据对支持向量机分类性能的影响,提出一种基于二次支持向量机的欠取样分类算法,该算法依据样本的分类超平面贡献大小对多数类样本进行欠取样.并对少数类样本进行过取样,重构训练数据集。该算法能够删除样本中的噪声数据。用控制参数控制删除样本的规模,实验表明,该算法能够提高支持向量机在不均衡数据集下的分类性能。  相似文献   

13.
为实现生鲜牛肉嫩度等级的无损快速判别,用可见近红外光谱检测实验系统,获取不同嫩度的40块牛肉样品的400~1650 nm范围的光谱信息,以肉类嫩度测量仪测量牛肉剪切力值为分类依据.用多元散射校正(MSC)、SG平滑处理方法处理光谱数据,分别建立牛肉嫩度的线性判别分类模型和支持向量机分类模型.结果显示,用MSC+SG预处理后所建立的线性判别分类模型预测能力最好,训练集和测试的回判识别率和预测识别率分别为96.7%、100%.结果表明,用光谱技术结合线性判别分析,可以对牛肉嫩度进行无损快速判别.  相似文献   

14.
周靖 《茂名学院学报》2011,21(4):56-58,66
在文本分类过程中,为解决传统支持向量机(SVM)多类分类的不可分区域问题及提高分类性能,提出了一种改进的偏二叉树多类SVM算法。算法依据根据样本的分布情况计算训练集文本特征参数的信息熵,并将熵值结合欧式距离公式以确定各类文本间的相似性测度;以相似性测度作为偏二叉树结构的分类走向,对训练集进行学习,构建各个二类子SVM分类器。实验结果表明,该算法具有较高的分类性能,能更好地解决实际文本分类过程中的问题。  相似文献   

15.
利用构造性学习(CML)算法训练分类器需要大量已标记样本,然而获取大量已标记的样本较为困难.为此,提出了一种人脑半监督的构造性学习算法(HPSS-CML).根据已标记样本,通过覆盖算法构造分类网络,对未标记样本进行有选择的标记,并将其加入训练集,调整分类网络参数.重复进行上述过程,直到没有新标记的样本为止,得到最终的分类器.测试阶段再次利用未标记样本对"拒认状态"的测试样本进行标记.最后选取UCI数据集进行实验,结果表明,与CML算法及Tri-CML算法相比,该方法的分类更为有效.  相似文献   

16.
在MATLAB环境下,取ORL人脸数据库的部分人脸样本集,基于PCA方法提取人脸特征,形成特征脸空间,然后将每个人脸样本投影到该空间得到一投影系数向量,该投影系数向量在一个低维空间表述了一个人脸样本,这样就得到了训练样本集。同时将另一部分ORL人脸数据库的人脸作同样处理得到测试样本集。然后基于最近邻算法进行分类,得到识别率,接下来使用BP神经网络算法进行人脸识别,最后通过基于神经网络算法和最近邻算法进行综合决策,对待识别的人脸进行分类。  相似文献   

17.
为对草莓硬度进行预测研究,利用高光谱成像系统获取草莓的高光谱数据,光谱数据波长为400~1 000nm,采用标准正态变换(SNV)、多元散射校正(MSC)、卷积平滑方法(Savitzky Golay )以及几种方法相结合对光谱数据进行预处理,选择最优的预处理方法,进一步结合化学计量学方法建立PLS预测模型,比较不同的光谱预处理方法对预测模型的效果,以选择最优预测模型。结果表明,经标准正态变换(SVN)处理后建立的偏最小二乘(PLS)模型效果最好,校正集和预测集的相关系数及均方根误差分别为0.989,0.882和0.021,0.073。因此,可采用高光谱成像技术对草莓硬度进行预测。  相似文献   

18.
为满足临床上癫痫发作预测的准确性和实时性要求,提出一种基于时域和频域特征提取的癫痫发作预测算法.算法采用移动步长为1s,窗口大小为5s的数据段进行特征提取,并代替原始数据送入LightGBM分类器进行训练,样本分类标准为15min后患者癫痫发作与否,发作即为负样本.将该算法应用于南京市某医院癫痫数据集上进行测试,结果表...  相似文献   

19.
《宜宾学院学报》2019,(12):121-124
利用近红外光谱分析(NIR)技术对安徽产地铁观音名茶茶多酚含量模型进行定量分析,通过不同的光谱预处理方法比较,得出最优的光谱预处理方法,同时结合偏最小二乘法(PLS)在近红外特征吸收峰波段1 872 nm与2 218 nm建立茶叶的茶多酚含量模型.从建立的样本校正集模型相关系数R和均方根误差RMSEP分析发现,1 872 nm处的模型R=0.9624、RMSEP=0.01648精度较好,以此模型为标准得出预测集样本茶多酚含量,并建立茶多酚化学值和预测值的相关关系图.该法可对茶叶中茶多酚含量的快速无损检测提供参考.  相似文献   

20.
把粗糙集与神经网络结合,应用于文本分类,可以充分发挥两种方法的优势,取长补短,粗糙集理论可以有效地对样本集进行约简,从而简化了神经网络的结构,减少了网络的训练次数,学习速度和分类精度明显提高,并用仿真实验验证了此方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号