首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对文本分类算法的选择问题,使用二十新闻组数据集在开源的数据挖掘软件Weka上进行了仿真实验。通过实验结果综合评价了朴素贝叶斯算法、IB1算法和ZeroR算法的性能。实验结果表明在三种算法中朴素贝叶斯算法的准确率最高,ZeroR算法的运算速度最快。研究表明文本分类的效率受所选算法的影响较大,合适的算法可以显著地提高文本分类的准确率。  相似文献   

2.
朴素贝叶斯理论是一种典型机器学习技术,能够应用于文本分类中。运用朴素贝叶斯理论阐述了贝叶斯分类器的样本训练和分类计算的过程,构造了一个文本分类器。试验表明,朴素贝叶斯理论在文本分类中有较好的分类效果。  相似文献   

3.
本文提出了一种基于主题采集的Web文档自动分类算法,该算法对朴素贝叶斯分类模型进行了改进。利用该算法,我们实现了一个基于主题信息采集的网页分类系统。文中着重对该系统的页面解析、中文分词和文本分类模块进行了论述,并对改进后的贝叶斯分类方法进行了评估。实验结果表明,该算法对网页分类有较高的准确性。  相似文献   

4.
近年来,随着智能移动设备的普及,人们可以随时随地通过网络社交媒体获取与分享信息。然而,便捷的上网方式以及自由的网络空间,也为网络谣言的产生与传播提供了条件,广泛传播的谣言可能具有极大的破坏性。因此,及时识别谣言对于保障社会稳定具有重要意义。使用词嵌入对微博短文本进行向量化处理,然后使用朴素贝叶斯、K最近邻和支持向量机对文本向量进行主题分类,以期及时发现具有周期性出现特点的谣言。将该模型在中文谣言真实数据集上进行有效性验证,使用5 487条数据作为训练集,2 703条数据作为测试集进行分类实验。实验结果表明,K最近邻模型相比于朴素贝叶斯模型及支持向量机模型,在谣言主题分类任务中表现最佳,其F1值和分类准确率都达到0.93,表明基于词嵌入的谣言主题分类方法可及时发现周期性谣言。  相似文献   

5.
贝叶斯文本分类方法研究   总被引:1,自引:0,他引:1  
朴素贝叶斯分类器是当前流行的一种文本分类算法 ,它的简易性使其适合于处理属性个数较多的分类问题 ;TAN (TreeAugmentedNaiveBayes)综合了朴素贝叶斯的简易性以及贝叶斯网表示依赖关系的能力 ,使其能容纳属性间存在的某种依赖关系。通过实验比较朴素贝叶斯和TAN ,可以发现TAN方法具有较好的分类性能。  相似文献   

6.
旅游突发事件自动分类能快速地为旅游产业链中的各行业提供决策依据,介绍文本分类技术中朴素贝叶斯分类方法的基本原理,利用Java语言调用开源的机器学习软件Weka相关算法,构建一个朴素贝叶斯分类器,实验数据表明,朴素贝叶斯分类器在旅游突发事件自动分类中有较好的性能。  相似文献   

7.
通过对Web数据的特点进行详细的分析,在基于传统的贝叶斯聚类算法基础上,采用网页标记形式来有效地弥补朴素贝叶斯算法的不足,并将改进的方法应用在文本分类中,是一种很好的改进思路。最后实验结果也表明,此方法能够有效地对文本进行分类。  相似文献   

8.
提出了一种基于机器学习的Web文本自动分类的架构,提出了中文Web文档自动分类的主要技术问题。介绍了中文Web文档自动分类工具的总体设计,它主要包括网络蜘蛛、中文分词、特征选取和贝叶斯分类器等功能模块。最后对中文Web文档自动分类器进行了实验。  相似文献   

9.
给出一种基于累积反馈学习的简单贝叶斯舆情信息分类方法;引入领域专家经验设置普通关键词,通过提供学习样本,运用简单贝叶斯方法,对样本加入领域规则进行累积反馈学习.实验结果表明累积反馈学习对提高舆情信息挖掘和分类的准确率是必要的.  相似文献   

10.
当前互联网快速发展,网络社会与现实社会逐渐同步,网上网下事件的关联性提高,网络舆情也越来越能够及时反映现实社会中发生的事情。因此,网络舆情监测不仅能够了解民意,为相关决策部门制定方案提供参考,而且能够通过大数据分析,对突发事件进行及时预警。以互联网上微博、贴吧、论坛、新闻评论等信息作为对象,以实用性为原则,研究一种基于文本自动分类的网络舆情监测方法。该方法通过网络爬虫抓取互联网上的信息,并采用基于KNN算法的文本自动分类方式完成网络舆情自动分类,最后通过实验验证了该方法的实用性。  相似文献   

11.
微博作为大学生最重要的日常文化生活方式,有其积极的一面,大学生利用微博关注社会热点事件、积极参与公共事务。大学生微博文化也出现了一些话语困境,如微博的泛娱乐化倾向,大学生在微博围观事件中的盲从性以及大学生微博的碎片化和"去深度化"倾向都是值得深思的文化动态。加强大学生媒介素养和大学生网络道德自律以及强化大学生的公共意识和公共理性是引导大学生微博文化走出困境的有效途径。  相似文献   

12.
随着智能手机的普及,APP软件越来越流行,随之而来的是APP软件用户评论的增多。在数量极大的评论中,关于APP软件缺陷问题的评论是APP开发者最关心的。通过对APP评论的大量阅读和观察,发现APP软件缺陷问题是分散的。总结了7类缺陷问题,使用改进卡方统计和APP软件简介中的名词和动词作为特征选择思路,使用朴素贝叶斯算法对每个缺陷问题评论进行训练学习。用8 677条评论进行实验,结果表明该方法的准确率、召回率和F1值较高。该方法不仅减轻了人工标记APP缺陷问题评论的工作量,而且提高了分类准确度。  相似文献   

13.
针对目前国内外学者对微博情感只作二分类研究,仅仅从正面和负面研究微博情感不足的问题,选取NLPCC2013-2014年多情感的微博数据集,重点研究常用的3种机器学习算法、3种特征选择以及特征权重方法对中文微博情感多分类的影响。实验表明:不管选择哪种特征权重,使用SVM的微博文本分类准确率都最高,KNN的准确率最低;不同特征权重下,信息增益作为特征选择的方法时,3个算法各自准确率都是最高的;当信息增益为特征选择,TF-IDF为特征权重时,支持向量机的文本分类准确率最高。由于微博简短、口语化,词袋模型忽视了词与词间的联系,导致微博情感分类准确率不高。  相似文献   

14.
针对协同过滤算法中存在数据稀疏的问题,提出一种基于融合用户标签和蚁群的协同过滤微博推荐算法。将表示用户兴趣的标签引入推荐模型中,利用标签和用户以及标签和微博的关联度,建立用户对微博的兴趣度模型。另外结合蚁群聚类和协同过滤为目标用户进行用户聚类,计算出对目标用户的待推荐微博集。最后利用用户对微博的兴趣度模型从待推荐微博集中选出Top-N为目标用户进行推荐。实验引入标签和蚁群算法的有效性,将测试结果与传统协同过滤推荐算法和纯基于标签的微博推荐算法进行比较,该算法不仅改善了协同过滤算法中数据稀疏和冷启动的问题,而且推荐准确度有明显提高。  相似文献   

15.
垃圾短信过滤是文本分类的一种,将用户收到的短信分为正常短信和垃圾短信,从而实现对垃圾短信的屏蔽。在朴素贝叶斯分类算法的基础上进行改进,针对短信内容较短包含信息不足的特点,引入同义词集对短信中特征词进行扩展,降低同义特征词分散给分类带来的负面影响。同时针对垃圾短信自身包含的特殊信息,提出模式概念,采用模式概念替换具有相同模式的特征词,使垃圾短信的特征更加集中,增强分类算法对垃圾短信的鉴别能力,最后通过实验对朴素贝叶斯算法以及改进后算法的分类性能进行了分析,验证了改进后算法的有效性。  相似文献   

16.
朴素贝叶斯文本分类模型是一种简单而高效的文本分类模型,但是它的独立性假设属性使其无法表示现实世界属性之间的依赖关系,从而影响它的分类性能。这里提出一种改进的基于贝叶斯定理的文本分类模型——“树桩网络(Stump Network)”,并将该方法与朴素贝叶斯文本分类器和TAN(Tree Augmented Naive Bayes)文本分类器进行实验比较,结果表明,在大多数数据集上该文本分类方法具有较高的分类正确率。  相似文献   

17.
在移动电话成为现代人重要通讯工具之一的同时,其短信业务因使用方便、收费低廉和随时随地收发的特点,得到大规模普及.随之而来的是各种垃圾短信带给人们的诸多困扰,垃圾短信过滤研究也就越来越迫切和深入,借鉴了在垃圾邮件过滤技术中经常采用的文本过滤技术,并结合分词和贝叶斯分类,实现手机垃圾短信的识别,进而为垃圾短信的过滤服务.  相似文献   

18.
随着网络信息技术的快速发展和论文投稿数量的大幅提高,为了减轻学报编辑的工作负担,提高工作效率,学报编辑部都有必要建立自己投稿系统。本文设计和实现了一个基于贝叶斯的智能学报投稿系统。该系统采用现在先进的SSH框架整合技术,运用基于贝叶斯理论的分类器对来稿进行自动分类等操作。  相似文献   

19.
针对传统信用评价方法分类精度较低、数据集属性变量间存在相关性等问题,提出基于主成分分析的稀疏贝叶斯学习(PCA-SBL)算法。首先对数据集特征变量进行主成分分析,使降维后的变量无相关性|其次,对主成分分析后的数据进行稀疏贝叶斯分类|最后将 PCA-SBL 分类方法分类精度与传统分类方法精度进行比较。分析发现,在 German Credit Data 和 Australian Credit Data 上,与传统 KNN、朴素贝叶斯、SVM、随机森林、决策树相比,改进的 SBL 算法分类精度平均提高了 5.26%、4.65%、2.11%、2.125%、4.66%,与稀疏贝叶斯学习算法(SBL)相比,平均提高 0.965%,从而证明 PCA-SBL 算法具有更高的分类效果。  相似文献   

20.
微博自2006年诞生以来,给人们提供了一个全新的信息获取和交流的渠道,作为一个知识群体,大学生在微博的使用人群中占了很大的比例。微博为大学生的信息获得、情感交流提高了技术手段,同时在大学生的思想政治教育中也发挥着重要的作用,逐渐成为高校进行大学生思想政治教育的新工具。在进行大学生给你思想教育的时候,可以通过微博来让学生对热点事件进行讨论,从而引导学生建立正确的思想政治观念。本文将对微博的特点、微博对大学生思想政治教育的影响进行分析,然后找到利用微博这一现代会技术手段来加强大学生思想政治教育的手段和措施。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号