首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
一种混合文本分类方法研究   总被引:1,自引:0,他引:1  
文本自动分类是信息检索领域的一个重要研究方向。一些标准的机器学习算法像支持向量机已经成功地运用到了这一领域。不幸的是高维的输入向量严重的影响了分类速度,而支持向量机核函数参数的确定影响到分类的精度。为了提高分类精度和分类速度,本文提出了一种混合分类算法,首先用粗糙集理论对向量进行约简,然后采用基因算法对支持向量机的核函数参数进行优化。实验证明我们提出的算法是有效的。  相似文献   

2.
支持向量机理论引入到图像水印技术,给图像水印技术的研究发展带来了新的活力。本文对基于支持向量机的图像水印技术的研究现状进行概要性的介绍,并在此基础上,鉴于光滑支持向量机比传统支持向量机拥有更好的综合特性,提出今后基于光滑支持向量机图像水印技术的研究设想,为光滑支持向量机理论的应用提供新的思路。  相似文献   

3.
本文将潜在语义索引理论与支持向量机方法相结合,对文本向量各维与文本的语义联系进行特征抽取,建立了完整的基于潜在语义索引的支持向量机文本分类模型,分析了该方法与分词的维数以及SVM惩罚因子选择之间的关系.并在NN-SVM分类算法的基础上,通过计算样本点与其最近邻点类别的异同以及该点与其k个同类近邻点在核空间的平均距离来修剪混淆点,提出了一种改进的NN-SVM算法:KCNN-SVM算法.利用该算法对降维后的训练集进行修剪.实验表明,用新的模型进行文本分类,与单纯支持向量机相比,受到文本分词维数以及支持向量机惩罚因子的影响更小,其分类正确率更高.  相似文献   

4.
股票投资作为一种常见的投资方式,其投资方法也日新月异。越来越多的投资分析师利用计算机分析数据的优势来进行股票交易。支持向量机(Support Vector Machine,SVM)作为一种数据挖掘技术,在高维、非线性、过拟合等问题上具有较强处理能力,在股价预测方面表现出特有优势。系统论述了支持向量机的发展及其在预测领域中的应用,并构建SVM股票预测模型,运用股票数据对股票进行涨跌情况预测,通过选取核函数以及调整参数,并计算准确率、精确度、召回率、F1值等预测模型评估指标,分别进行SVM模型和SVM_RBF模型构建及模型效果评估。  相似文献   

5.
个性化服务中基于支持向量机的用户兴趣挖掘分析   总被引:2,自引:1,他引:1  
用户兴趣的准确获取是保证个性化服务质量的关键;分析用户所浏览的网页集,捕获用户兴趣、建立用户兴趣挖掘模型是目前个性化服务研究的一个重要方向.本文首先比较支持向量机与其他分类算法的性能,分析了基于支持向量机进行用户兴趣挖掘的可行性;然后在介绍支持向量机分类原理和分析分类预测理论模型的基础上构建了用户兴趣挖掘模型;最后选取中文网页分类训练集和特定用户的网页浏览记录,主要从支持向量机分类器的构造和用户兴趣预测两个方面进行了模型的实现研究.  相似文献   

6.
本文的研究目的在于介绍一种新兴的从统计学习理论发展而来的方法——支持向量机(SVM),并将其用于银行信用风险分析。支持向量机是一种基于统计学习理论的分类方法。可将其用于分析财务比率和非财务比率,并且用于违约概率的估计的一种方法。本文将通过实证分析来证明支持向量机能够从财务数据中提取或挖掘出有用信息。  相似文献   

7.
提出了将支持向量机应用于文本自动分类的研究,与常用的K-最邻近法相比,无论是对训练数据集还是测试数据集均具有一定的优势,而且不同特征选择方法对支持向量机的影响要比K-最邻近法小。此外,从研究中的不同特征选择的评价函数来看,它们对分类有一定的影响,应用X2统计进行特征选择的分类正确率最高,其次是文本证据权,而期望交叉熵的效果最差,说明特征选择在文本自动分类中也是相当重要的。  相似文献   

8.
文章提出了基于支持向量机的短时用水量预测模型,对城市用水量本身固有的非线性、复杂性和不确定性进行综合考虑。结合实例数据,对基于支持向量机的预测模型和基于BP神经网络的预测模型进行比较。结果表明,基于支持向量机的预测模型在精度、收敛时间、泛化能力、最优性等方面均优于基于BP神经网络的预测模型。  相似文献   

9.
运用非结构化信息挖掘,对网络评论情感进行分析是一个非常重要的方法。本文基于Web客户评论情感文本,在情感文本预处理过程中使用四种不同的停用词表,采用两种不同的特征选择方法,选用著名的TF-IDF权重计算方法,使用基于RBF核函数的支持向量机方法的分类器实现了对携程网上采集的4000个酒店客户评论情感文本的分类研究。通过实验,分析了不同特征选择方和停用词表的使用对客户评论文本情感分类的影响,提出了基于情感文本分类的有效的停用词表。  相似文献   

10.
利用Contourlet变换的方向性和各向异性,提出了一种基于contourlet变换和支持向量机(SVM)的人脸识别方法。首先对人脸图像进行Contourlet变换,将得到的低频分量系数作为人脸图像的识别特征,然后利用SVM多类剐分类器进行分类。实验结果表明该方法具有较好的识别性能。  相似文献   

11.
提出了一种基于预抽取支持向量机及模糊循环迭代算法的改进的支持向量机(Support Vector Machines,SVM)的两类文本分类方法, 与传统的SVM相比, 该方法具有高得多的计算效率。文中给出了具体算法并将其用于文本分类中,实验表明了本算法用于文本分类的有效性及其高效率。  相似文献   

12.
针对一示例同属多类的问题,提出多标记支持向量机并在此基础上构建基于访问页面的多标记用户分类系统。该系统首先对Web页面进行预处理并利用流形判别分析进行文本特征提取,然后利用多标记支持向量机对文本进行分类,最后对分类结果进行评价。真实数据集上的实验表明所建系统的有效性。  相似文献   

13.
陈莉 《情报学报》2008,27(2):229-234
支持向量机根据VC 维理论和结构风险最小化原则,是一种建立在统计学习理论基础之上具有新颖、功能强大特点的机器学习方法.它具有全局最优、结构简单、推广能力强等优点,近年来越来越引起关注.但支持向量机是一种小样本机器学习方法,自身的复杂性和多重共线性成为其处理大规模数据时的"瓶颈"问题.岭回归方法是一种修正的最小二乘估计法,是一种专门用于复共线性数据分析的有偏估计方法,当自变量系统中存在多重相关性时,它可以提供一个比最小二乘法更为稳定的估计.本文将岭回归-支持向量机结合,用于数据挖掘方法之一--文本分类中,实验结果表明:本方法可以提高支持向量机分类的训练速度和分类精度.  相似文献   

14.
移动互联网的迅速发展成为全球信息通信领域最令人瞩目的现象之一,相比于传统电信市场下的用户需求,移动互联网环境下的消费者需求更加多样化,消费者的行为也呈现出新的特点。根据消费者的以上行为特点,本文基于支持向量机的算法对此现象进行数据挖掘和研究。现有研究证明支持向量机具有良好的推广泛化能力,取得了大量的应用研究成果,采用此研究方法能够得到可靠有效的实验结论,适宜在移动互联网环境下消费者行为研究上推广应用。  相似文献   

15.
支持向量机在文本自动分类中的应用研究   总被引:3,自引:0,他引:3  
田晓宇  梁静国 《情报学报》2006,25(2):208-214
针对数据挖掘中的文本自动分类问题,提出了一种基于支持向量机的分类方法。构造了可用于多个模式类识别的多层级连式SVM模型,该模型可完成对多个模式的分类识别。根据训练样本的分类体系完成对模型的构造之后,即可应用于实际文档的自动分类。文中给出了该模型的构造及应用的方法,用两种核函数作为内积回旋方案,以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。  相似文献   

16.
博硕士学位论文具有较高的学术研究和使用价值,本文根据学位论文编目分类的特点,使用支持向量机的方法,采用分层分类的办法对学位论文进行自动分类,实验证明了该方法在学位论文分类上的有效性和可行性.  相似文献   

17.
停用词表对中文文本情感分类的影响   总被引:6,自引:2,他引:4  
王素格  魏英杰 《情报学报》2008,27(2):175-179
本文利用三种特征选择方法、两种权重计算方法、五种停用词表以及支持向量机分类器对汽车语料的文本情感类别进行了研究.实验结果表明,不同特征选择方法、权重计算以及停用词表,对文本情感分类的影响也不尽相同;除形容词、动词和副词外的其余词语作为停用词表以及不使用停用词表对情感分类作用较大,得到的分类结果比较好;总体上,采用信息增益和布尔型权重进行中文文本情感分类的效果较好.  相似文献   

18.
骨龄检测在医学、体育科学和司法等领域有着广泛的应用,基于数字图像处理技术来进行骨龄检测是目前骨龄评价的发展趋势,文章提出了一个完整的基于手腕部X光图像的骨龄检测系统的设计和实现方案。骨龄算法依据我国提出的骨龄评价方法CHN法,提取手部X光图像的骨骺特征参数,运用支持向量机方法进行骨龄识别。骨龄检测系统具有交互检测,可视化的特点,允许在检测过程中对图像处理所使用的方法和骨骺特征进行可视化交互调整,骨龄数据管理根据用户角色的不同提供不同的数据管理操作。  相似文献   

19.
应用最大似然分类、马氏距离分类、最小距离分类、决策树和支持向量机这五种分类方法对北京密云1999年的TM影像进行分类。首先介绍了分类的流程,然后对这五种分类方法进行简单介绍,通过选取训练样本,最后进行分类。  相似文献   

20.
基于机器学习的自动文本分类模型研究   总被引:2,自引:0,他引:2  
基于机器学习的方法是自动文本分类中非常重要的一大类方法。本文先给出了形式化的定义,提出了自动文本分类的流程模型,然后选取了支持向量机(Support Vector Machine,SVM)算法作为一个典型例子进行分析,最后作者通过一个中文文本分类实验评价了该算法的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号