首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
在分析支持向量机(Support Vector Machines,SVM)回归算法的基础上,提出了一种免疫遗传优化向量机回归算法来预测混沌时间序列.算法根据混沌时间序列样本的特点利用免疫遗传算法对支持向量机回归方法参数进行优化.免疫遗传算法有效地克服了未成熟收敛现象,获得相关参数最优值.对混沌时间序列预测的实际算例表明,与支持向量机方法相比,本文所提的免疫遗传优化支持向量机回归方法具有更高的预测精度.  相似文献   

2.
针对标准支持向量机训练时间过长与参数选择无指导性问题,给出一种通过粒子群优化双支持向量机模型参数的方法。与标准支持向量机不同,该方法的时间复杂度更小,特别适合不均衡的数据样本分类问题,对求解大规模的数据分类问题有很大优势。将该算法与标准的支持向量机分类器在不同的文本数据集上进行仿真实验对比,以验证算法的有效性。结果表明基于粒子群优化的双子支持向量机分类器的分类结果高于标准支持向量机分类结果。  相似文献   

3.
支持向量机(SVM)作为一种机器学习分类算法应用广泛,但在处理高维度数据集时往往会由于特征维数较多遇到算法分类速度慢且容易陷入局部最优等问题。为了提高支持向量机的性能,提出一种基于多宽度高斯核(GKMW)的支持向量机特征选取算法FSG。FSG算法将泛化能力更强的多宽度高斯核函数引入支持向量机中代替传统的高斯核函数,利用多宽度高斯核函数能体现各个特征对分类贡献程度不同且能区分样本中各个特征重要性的特点,以多宽度高斯核函数的参数优化结果为基础进行特征选取。利用特征选取后的特征子集在多组标准UCI数据集上分类实验,实验结果表明所提算法性能优于有代表性的特征选取法。  相似文献   

4.
支持向量机(SVM)是统计学习理论最为成功的实现。支持向量机适用于两类样本的分类问题,面对正负样本数目失衡的情况,加权的方法虽然能有效改变分类器对数目小的样本类的预测偏置问题,但往往是以牺牲数目较大样本类的预测精度为前提。单分类支持向量机(One-SVM)只用某一类样本来训练分类器,可以有效避免预测偏置问题的出现。本文将单分类支持向量机(One-classSVM)用于UCI数据库的灯盏花分类研究,结果显示,单分类支持向量机在处理样本数目失衡的模式识别问题中,具有良好的泛化能力,预测精度特异性达到95.45%,同时单分类支持向量机只用一类样本训练分类器,在算法的时间复杂度上也具有优势。  相似文献   

5.
<正>支持向量机(support vector machine,SVM) (文献[1-2])是近几年来的研究热点,特别是使用SVM进行分类获得了极大的成功。然而当样本较大时,运算速度比较慢,使其应用受到了局限。文献[3]提出了中心支持向量机,它把以往的支持向量机同中心向量结合使用,改善了最优超平面  相似文献   

6.
针对设备故障信号的微弱和噪声干扰严重问题,提出了基于奇异值分解和支持向量机的故障诊断方法.利用聚类分析的方法预处理设备的状态信号,剔除信号的异常点,以提高信号的准确性.对预处理后的信号进行构造矩阵和奇异值分解,选择恰当的窗口长度,以奇异值作为信号特征.支持向量机对信号特征进行识别和分类,为了避免支持向量机在多状态分类中输出的不确定性,记录支持向量机的训练输出作为决策表.支持向量机测试时的输出与决策表比对,以提高诊断结果的可靠性.最后,通过对比试验验证了基于奇异值分解和支持向量机的方法可以对设备进行可靠、准确、快速的故障诊断.  相似文献   

7.
农业文本分类旨在对主流的农业信息网抽取的文本数据集进行分类.在样本充足的情形下,经典的支持向量机方法能取得较好的效果,然而在样本较少或者样本矩阵很稀疏的情形下效果较差.提出了一种基于特征族群语义扩散核(它是语义扩散核的一种)和支持向量机的半监督农业文本分类方法.该方法在经典的支持向量机方法基础上结合特征族群语义扩散核,使得农业文本分类准确率得到一个显著的提升,在训练集样本数量只有原来一半的数量情况下预测原来的测试样本,预测准确率几乎与原来的相同.  相似文献   

8.
为减少不均衡数据对支持向量机分类性能的影响,提出一种基于二次支持向量机的欠取样分类算法,该算法依据样本的分类超平面贡献大小对多数类样本进行欠取样.并对少数类样本进行过取样,重构训练数据集。该算法能够删除样本中的噪声数据。用控制参数控制删除样本的规模,实验表明,该算法能够提高支持向量机在不均衡数据集下的分类性能。  相似文献   

9.
由于孤立点和原始样本的选取对于支持向量机的分类性能具有较大的影响,所以本文旨在设计一种区别于以往的支持向量机的算法来解决这个问题。首要步骤是通过主成分分析法对原始数据样本进行处理,以达到用最好的方式对原始数据进行表达,从而达到使高维特征空间的维数降低的目的。然后使用类均值法,依据样本在特征空间的投影到特征空间中本类样本均值的距离,来确定其模糊隶属度,为达到使孤立点对最优分类超平面的影响最小,本文通过赋予较小隶属度的方式来实现这一目标。通过进行仿真实验,我们可以发现,这种算法能够比较有效地降低分类误差,而且在一定程度上也能够使支持向量机的鲁棒性得到提高。  相似文献   

10.
加权支持向量机分类算法是对类别差异造成的影响进行相应补偿的一种支持向量机算法,目的是提高样本中小类别的分类精度.我们通过用支持向量机和加权支持向量机算法相比较,加权支持向量机可提高样本中小类别的分类精度,这对于某些需要重点关注的小类别精度的分类有重要的现实意义.  相似文献   

11.
Kindergarten, third-grade and fifth-grade children were tested on a same-different auditory discrimination task. Stimuli consisted of familiar and unfamiliar 3-letter words which were subdivided into high and low positional frequency word pairs. Analysis of correct same and different judgments supported the hypothesis that prereaders who have had normal language experiences develop sensitivities to intraword-redundancy relations. Children made significantly more correct same or different judgments when word pairs were high rather than low in summed positional frequency.  相似文献   

12.
针对当前基于LDA模型扩展的文本情感分析方法未能考虑同一词语在不同语境下其情感极性的差异及非特征情感词对微博文本情感极性的影响这两个问题,提出一种基于语境分类和遗传算法的微博情感分析方法。该方法首先利用LDA模型构造微博主题集及微博主题词集,然后用微博标签数据逐一对各微博主题词集应用遗传算法自动迭代计算得出词集中词语的情感值,最后利用词集词语的情感值计算微博文本情感极性。实验结果表明,该方法精确度比LDA提升3.12%,召回率达87.32%,F1达73.79%,能够从语境和非特征情感词获取微博情感信息,有效提高情感分类准确率。  相似文献   

13.
对文本分类技术进行研究,首先介绍文档频数特征词评价方法;然后提出一种词分布均衡度评价的特征词选取方法,最后分析基于词分布均衡度评价的支持向量机文本分类算法,并实验证明其优越性.  相似文献   

14.
From classifications of word problems in international discussion of elementary mathematics instruction as well as from conceptual elaborations of didactical analyses in Germany, a classification of semantic structures of one-step word problems involving multiplication or division is proposed, comprehending four main classes: Forming the n-th multiple of measurers, combinatorial multiplication, composition of operators, and multiplication by formula. This classification is more comprehensive and differentiated than the classifications of Vergnaud (1983), Nesher (1988), and Bellet al. (1989) — aiming at a better assignment between diverse contextual circumstances and conceptual demands of mathematics and at compatibility with the well-known semantic structures of addition and subtraction word problems.  相似文献   

15.
在迅速增加的海量数据中,文本形式的数据占很大比重。文本分类作为最常见的文本挖掘技术,可在大量杂乱的文本数据中发现有价值的信息,具有重要意义。文本分类面临的首要问题是如何在确保分类准确率的同时缩短分类时间。提出使用分类模型FastText学习单词特征以解决该问题,同时在数据集上使用停用词处理方法降低噪声数据对分类模型的影响。实验结果表明,使用FastText文本分类模型在数据集上准确率达到96.11%,比传统模型提高近4%,且模型处理每条文本的平均时间为1.5ms,缩短了约1/3。  相似文献   

16.
词相似度计算在文本分类等自然语言处理众多任务中有广泛应用,为了提高准确率并将其应用于文本分类任务中,提出基于知网与同义词林以及基于nGram训练大规模语料相结合的方法,通过词义演化技术检测词义变化确定两种方法的权重,利用皮尔逊相关系数对比人工定义词语相似度。通过实验将该方法与基于知网和同义词林的方法进行对比,根据随时间改变而词义有无变化选取15对词语进行测试,结果表明后者比前者提高了28%。由此可以看出,基于语料与语义词典的方法明显比单纯基于语义词典的方法好,但仍有较大改进空间。  相似文献   

17.
“不如”作为动词,所表达的比较意义并不简单地与“比不上”对应,同时还具有“不类同”“当不得”“不好于或强于”等多个比较语义层面;而这些不同于“比不上”的比较意义又显著地与“不如”能表达主观比较认识的特性集合在一起;并且,与“比”字句相对,表达异比关系、逆比关系、不及比关系则是“不如”比较句的语义构成规律。  相似文献   

18.
《全唐诗》中“茶”与“茗”两字共出现1227次,这些诗里涉及茶叶产地的又有不少。首先,分析各产茶地,可看出其分布呈现“多个中心,四面开花”的特点。其次,对产茶地等级作进一步考察,发现各地经济水平与茶叶发展及茶品质之间呈正比例关系,即经济水平高的地方茶业发展快,同时好茶也一般出在经济富裕地区。  相似文献   

19.
词汇学习是英语教学的重要组成部分。本文在词的语义分类基础上进行英语一词多类 ,一词多义 ,同义词 ,反义词的比较 ,分析词义比较教学法在词汇教学中的重要作用。指出词义比较教学法能够从多方面促进英语词汇教学水平的提高 ,帮助学生在语言习得的过程中更好理解词义 ,掌握词义的变化 ,提高学生的语言能力  相似文献   

20.
东巴文字作为人类早期的一种向象形文字、标音文字过渡的图画文字形式,既具有图画文字以图表意特点,又具有现代文字使用简单线条表达含义的特点。东巴文字本身的复杂性使其相关研究一直较少且连贯性不强。从东巴文字的构字要素入手,通过分析东巴文字的组成要素、结构特征及造字习惯,给出适用于东巴象形文字的预处理及基于网格分解的分类识别算法。该算法思路简单、复杂度低、易于实现,能够快速实现不同类型东巴文字的检索和识别,具有较好的缩放和平移不变性,从而为东巴文字的造字研究提供强有力的技术支持,也为研究其它象形文字的检索和识别技术提供重要参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号