首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 189 毫秒
1.
贝叶斯文本分类方法研究   总被引:1,自引:0,他引:1  
朴素贝叶斯分类器是当前流行的一种文本分类算法 ,它的简易性使其适合于处理属性个数较多的分类问题 ;TAN (TreeAugmentedNaiveBayes)综合了朴素贝叶斯的简易性以及贝叶斯网表示依赖关系的能力 ,使其能容纳属性间存在的某种依赖关系。通过实验比较朴素贝叶斯和TAN ,可以发现TAN方法具有较好的分类性能。  相似文献   

2.
朴素贝叶斯文本分类模型是一种简单而高效的文本分类模型,但是它的独立性假设属性使其无法表示现实世界属性之间的依赖关系,从而影响它的分类性能。这里提出一种改进的基于贝叶斯定理的文本分类模型——“树桩网络(Stump Network)”,并将该方法与朴素贝叶斯文本分类器和TAN(Tree Augmented Naive Bayes)文本分类器进行实验比较,结果表明,在大多数数据集上该文本分类方法具有较高的分类正确率。  相似文献   

3.
旅游突发事件自动分类能快速地为旅游产业链中的各行业提供决策依据,介绍文本分类技术中朴素贝叶斯分类方法的基本原理,利用Java语言调用开源的机器学习软件Weka相关算法,构建一个朴素贝叶斯分类器,实验数据表明,朴素贝叶斯分类器在旅游突发事件自动分类中有较好的性能。  相似文献   

4.
朴素贝叶斯分类器是分类算法集合中基于贝叶斯理论的一种算法,为了对海量的视频进行分类,提出了一种基于朴素贝叶斯分类器的视频分类方法。首先,对视频进行特征提取,提取纹理、颜色以及亮度三种反映其类别的特征。在提取到视频的颜色、亮度以及纹理特征之后,然后进行基于朴素贝叶斯分类器的视频分类。对于输入的几种特征,采用极大似然估计,直至完成最终的分类。实验结果表明,提出的视频分类方法取得了较为准确的分类结果,对篮球、足球、斯诺克等5个运动项目均取得了90%以上的分类准确性。  相似文献   

5.
朴素贝叶斯理论是一种典型机器学习技术,能够应用于文本分类中。运用朴素贝叶斯理论阐述了贝叶斯分类器的样本训练和分类计算的过程,构造了一个文本分类器。试验表明,朴素贝叶斯理论在文本分类中有较好的分类效果。  相似文献   

6.
传统图像特征提取具有较高维度缺陷,造成算法分类效率低、复杂度高、分类速度慢、计算开销大等问题。为此提出AAM算法,定位关键点提取人脸表情几何特征。将朴素贝叶斯分类器结合特征属性重要度调节高斯核函数,使用K近邻算法实现分类决策,提出一种WNBC-KNN分类方法,从降低数据维度和分类算法两方面优化人脸表情分类。在CK+数据和JAFFE数据集上实验,识别率分别达到90%和86%。与传统的朴素贝叶斯算法比较,改进后的算法识别率分别提高6%和30%。  相似文献   

7.
RSS是一种基于RDF/XML描述的全新的互联网信息获取方式。但目前,RSS文档的分类完全依赖于预先设定,对于适应用户多变的需求存在着明显的不足。朴素贝叶斯分类器是解决自然语言文本文档分类问题的最有效的方法之一。通过构造朴素贝叶斯学习器,用户可以构造出符合自己要求的RSS分类结构。实验结果表明,这种基于朴素贝叶斯方法的分类器。可以很好地实现对RSS文档的自动分类。  相似文献   

8.
为了弥补传统朴素贝叶斯分类器在实际应用中代价不敏感的缺点,基于最小风险准则构建朴素贝叶斯模型和树增强朴素贝叶斯网模型,通过预先设置损失矩阵,分类器可以区分各种误判情形产生的代价,利用1 000条德国信用卡样本数据进行实验。研究发现,在以损失最小为导向的用户信用评估方面,基于最小风险准则构建分类器产生的总损失更小,综合性能更好;在分类性能上,简单的朴素贝叶斯模型可与复杂的基于爬山算法建立的贝叶斯网络模型相媲美;从整体经济效益看,朴素贝叶斯模型更胜一筹。  相似文献   

9.
通过对Web数据的特点进行详细的分析,在基于传统的贝叶斯聚类算法基础上,采用网页标记形式来有效地弥补朴素贝叶斯算法的不足,并将改进的方法应用在文本分类中,是一种很好的改进思路。最后实验结果也表明,此方法能够有效地对文本进行分类。  相似文献   

10.
针对传统的特征选择方法在非平衡数据集中分类效果不理想的问题,提出了一种适合非平衡数据分类的改进特征选择方法.该方法将集中度和分散度相结合,同时考虑到在文本长短不一时词频对文本分类的作用,得到一种新的词频归一化方法,实现了对传统特征提取方法的改进.另一方面,将三支决策思想引入到朴素贝叶斯算法,得到了NB-三支决策分类算法,并将该算法应用到非平衡数据集的分类.通过两组实验对比结果表明:改进特征选择方法较CHI和IG方法,处理非平衡度高的数据集分类效果较好;选取相同的特征选择方法和数据集,NB-三支分类器比NB-分类器的分类效果好.选用本文提出的改进特征选择方法和NB-三支分类器,在处理非平衡度高且文本长短不一的数据集时,分类效果有一定提升.  相似文献   

11.
针对文本分类算法的选择问题,使用二十新闻组数据集在开源的数据挖掘软件Weka上进行了仿真实验。通过实验结果综合评价了朴素贝叶斯算法、IB1算法和ZeroR算法的性能。实验结果表明在三种算法中朴素贝叶斯算法的准确率最高,ZeroR算法的运算速度最快。研究表明文本分类的效率受所选算法的影响较大,合适的算法可以显著地提高文本分类的准确率。  相似文献   

12.
本文在探讨模式匹配算法的基础上,针对高校考生报到率不稳定的实际情况,利用模式匹配算法,结合朴素贝叶斯方法,对考生报到结果进行预测,能够为高校的招生宣传和教学管理等工作提供有价值的参考依据。  相似文献   

13.
本文提出了一种基于主题采集的Web文档自动分类算法,该算法对朴素贝叶斯分类模型进行了改进。利用该算法,我们实现了一个基于主题信息采集的网页分类系统。文中着重对该系统的页面解析、中文分词和文本分类模块进行了论述,并对改进后的贝叶斯分类方法进行了评估。实验结果表明,该算法对网页分类有较高的准确性。  相似文献   

14.
根据构件检索的研究现状,通过增加语义特征,改进了基于刻面分类的构件描述模型.结合领域本体,提出了基于语义的构件检索过程模型及相应的概念语义匹配算法.在基于语义的构件检索过程模型中对其中的构件推理引擎、构件分类引擎的实现进行了详细说明,并给出了贝叶斯分类方法在构件分类中的具体应用.实验表明,基于语义的构件检索方法提高了构件的查全率和查准率,证明了此方法的可行性和有效性.  相似文献   

15.
针对传统信用评价方法分类精度较低、数据集属性变量间存在相关性等问题,提出基于主成分分析的稀疏贝叶斯学习(PCA-SBL)算法。首先对数据集特征变量进行主成分分析,使降维后的变量无相关性|其次,对主成分分析后的数据进行稀疏贝叶斯分类|最后将 PCA-SBL 分类方法分类精度与传统分类方法精度进行比较。分析发现,在 German Credit Data 和 Australian Credit Data 上,与传统 KNN、朴素贝叶斯、SVM、随机森林、决策树相比,改进的 SBL 算法分类精度平均提高了 5.26%、4.65%、2.11%、2.125%、4.66%,与稀疏贝叶斯学习算法(SBL)相比,平均提高 0.965%,从而证明 PCA-SBL 算法具有更高的分类效果。  相似文献   

16.
谭嗣同思想产生的社会基础和理论根源   总被引:1,自引:0,他引:1  
谭嗣同的思想代表了民族资产阶级中下层的利益和愿望,也是近代中国民族危机的产物.其哲学思想和社会政治思想,主要是受到西方自然科学和墨子、张载、王船山、黄宗羲的影响.  相似文献   

17.
在大数据时代背景下,利用人工智能相关技术,改进了传统运维的基本流程,包括告警、根因定位、分析预测和能耗管理,对潜在的问题进行趋势预测,最后结合智能化运维系统对大数据日志进行分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号