首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
微博情感分析是当今情感分析的一大研究热点,中文微博情感分析按照处理层面的不同可以分为主题无关和主题相关分析,分析方法主要分为两类,一是基于情感词典的方法,另一类是基于机器学习的方法.本文对目前中文微博情感分析的主要流程和处理方法进行了探讨,对两类方法的特点及其研究现状进行了分析、比较,对不能完全准确进行情感分类的主要原因进行了归纳总结,为情感分析方法的进一步研究提供了参考方向.  相似文献   

2.
作为社交网络重要载体,微博成为信息传播的重要平台,承载着公众情感表达及舆论传播的重要功能。对微博博文及评论作出主题概括及情感分析在网络管控、舆情监测及公众情绪引导方面具有重要的实践意义。提出一种基于机器学习与文本分析的主题概括及情感分析模型。以武汉理工大学研究生坠亡事件为话题,利用Word2vec将文本转化为词向量,并且通过机器学习聚类方法对舆情各个生命周期过程进行主题概括,采用基于词典文本分析方法,对评论文本进行多元情感分析,对表现突出的情感大类作细粒度分析,最终实现基于主题与情感分析的多元细粒度公众情感变化分析模型。该分析模型可在特定舆情事件下得出公众在各阶段的关注中心及情绪变化规律,实现舆情主题与情感变化的协同演化研究。  相似文献   

3.
本文围绕文本倾向性分析的基本流程进行论述,主要研究了以文本情感分析技术为主的倾向性分析,以主观性文本及客观性文本识别为前提,从特征选择算法和特征加权算法方面对现有文本倾向性进行分析,介绍了算法的推导公式及模型训练代码,重点涵盖了基于机器学习的文本倾向性分析方法,对其算法复杂性、算法效率和适用范围给出了具体的概括和总结.  相似文献   

4.
情感分析在业界被广泛应用于产品分析、商品推荐等方面,具有很高的商业价值。目前常用的研究方法主要基于机器学习算法和基于词典的方法,该类方法通常需依赖复杂的人工规则和特征工程。针对传统情感分类方法需要人工干预的问题,总结目前已有可用于情感分析的深度学习方法,提出将卷积神经网络(CNN)和双向长短时记忆网络(BLSTM)进行组合,并将融合后的特征添加至注意力机制,设计出CBLSTM-Attention模型。实验表明,该模型在中文数据集上准确率达0.965 0,在NLPCC英文数据集上准确率达0.942 2,证明该方法不仅可提高文本情感倾向性分析的准确率,而且可有效解决人工干预问题。  相似文献   

5.
基于机器学习的情感分类方法已经取得了较大进展,但在大量情感分类方法中,往往都是结合词嵌入和传统的机器学习方法,缺乏对文本主题以及时序关系等因素的有效利用。针对上述问题,提出了一种基于主题流与深度学习的情感分类算法,通过分析文本的主题分布,并引入时序关系,在此基础上利用适合的长短记忆神经网络的深度学习方法进行情感分类。实验证明,基于主题流与深度学习的情感分类算法性能较好。  相似文献   

6.
高校辅导员是高校管理的一线工作人员,研究高校网络舆情获取方法,对高校辅导员进行学生思想引导工作以及维护高校网络健康发展具有重要意义。从高校辅导员视角出发,运用对比分析方法,对近年来网络舆情获取方法和文本分析方法进行研究,进而根据高校网络舆情的内涵和特点,改进TF-IDF算法对高校网络舆情进行文本分析,最后给出该算法的实现过程,既可为分析高校网络舆情发展方向提供依据,也可为高校管理工作顺利进行提供技术保障。  相似文献   

7.
利用深度学习方法进行情感分析时,将文本作为一个整体进行编码,缺乏对表情符号与情感词的有效关注。而传统基于词典的方法则过分依赖于情感词典与判断规则的质量,不能充分考虑文本深层语义关系。针对该问题,构建融合表情符号与情感词的自注意力模型。通过BLSTM训练得到情感符号,并与文本特征向量融合,同时引入结构化自注意力机制识别文本中不同情感符号的情感信息。在NLPCC2014和微博公开语料数据集上的实验表明,相较传统情感分析方法,该模型可有效提高情感分类准确率。  相似文献   

8.
近年来,电子商务发展迅速,对电商商品评论进行情感分析可为消费者购物、商家调整销售策略与电商平台个性化推荐提供重要参考意见,因此提出双通道卷积记忆神经网络文本情感分析模型。首先,通过词向量与由特征词典构造的扩展特征矩阵两个不同的通道进行卷积运算,再利用卷积神经网络提取文本局部最优信息,最后利用长短期记忆神经网络学习长距离的上下文情感,完成文本情感分析任务。实验结果表明,与多种文本情感分析方法相比,双通道卷积记忆神经网络文本分析算法具有较高的精度,达到95%,且考虑了文本语义信息与文本情感信息,可获得更好的文本表示,同时兼顾文本局部特征与上下文信息的学习,可有效提高文本情感分析准确率。  相似文献   

9.
利用计算机视觉技术和机器学习技术对学生课堂行为进行自动识别,是过程性评价的一种新方法,近年来逐渐引起了研究者的关注。文章以监控设备拍摄的实际课堂教学视频为数据源,采集、标注了学生课堂行为数据,提取了学生的人体骨架信息。在此基础上,文章采用Boosting算法和卷积神经网络算法,对基于这两类不同机器学习算法的5种模型进行了学生课堂行为自动识别准确率实验。实验结果表明,在学校教室这种识别比较困难的场景,基于人体骨架信息提取的学生课堂行为自动识别可以达到较高的精度,其中基于Boosting算法的XGBoost模型识别准确率最高。文章的研究推动了计算机视觉技术和机器学习技术的进一步应用,有助于解决学生课堂行为自动识别难题,并助力教师优化教学策略、提高教学效率。  相似文献   

10.
在线教育师生情感缺失问题是当前教育研究亟待解决的难题之一。在线教育弹幕文本作为学习者对在线课程内容及自身学习状态的实时反馈,隐含了大量情感信息,对于上述问题的解决具有重要意义。然而,目前鲜有针对在线教育弹幕文本开展情感分析的研究。基于此,设计了一种融合变式情感词典与深度学习技术的在线教育弹幕情感智能识别模型。具体而言:通过构建弹幕种子情感词集,计算弹幕文本与情感种子短语间的相似度,实现极短弹幕文本情感识别;借助BERT动态表征弹幕文本,双向长短时记忆网络挖掘弹幕文本中的深层特征,实现常规弹幕文本情感识别;融合两类弹幕文本情感识别信息并更新后,完成在线教育弹幕文本情感信息的智能识别。研究通过模型对比实验检验模型性能有效性,并借助具体案例验证模型应用可行性。  相似文献   

11.
随着各个在线平台用户生成内容的普及,在线评论对品牌方、消费者、平台的影响越来越大,针对在线评论文本情感分析的技术成为研究热点。与此同时,为提升自身信誉或诋毁竞争对手的虚假评论泛滥,对消费者的购买决策及产品的网络口碑带来不利影响。使用文献研究、案例分析等方法,以虚假评论识别方法研究为基础,探讨其文本情感特点,总结出当前多是通过情感极性的角度来识别虚假评论,并对未来有针对性地构建更合理完善的情感词典及对新媒体平台的虚假评论识别进行展望。  相似文献   

12.
情感是影响学习者认知和行为的关键性非智力因素。准确分析、识别学习者的情感状态,对教育的个性化、智能化发展尤为重要,它是情感计算的重要内容,已经成为人工智能和教育领域的交叉研究热点。学习体验文本是学习者情感分析的主要数据来源。面向学习体验文本,是在完善基础词典和情感词典的基础上,提出一种融合情感词典和机器学习的学习者情感分析模型,能够实现对段落级/篇章级学习体验文本的多级情感分类,从而挖掘学习者内隐的情绪状态。为了检验模型的有效性,采用宏平均指标全面评估情感分析模型的整体分类性能。研究结果表明:选择情感词特征和句子构成特征、采用SVM分类器时,该模型能够准确识别学习体验文本中的学习者情感;模型不仅为学习者多级情感分析提供新的研究思路,而且也为深入挖掘学习行为、改善在线教育的学情分析等,提供了技术支撑。这一研究结果,有助于进一步把握模型的应用前景、面临的问题和挑战等,并提出了相关建议。  相似文献   

13.
成人在线学业情绪倾向的测度方法研究   总被引:1,自引:1,他引:0  
积极的学业情绪有助于学习者认知活动的开展和学习目标的达成.为使远程教育院校及时了解成人学生群体在线学习时的学业情绪倾向,帮助他们以积极的学业情绪开展学业活动,我们借鉴情感计算这个前沿领域的有关研究,构建了情感权值词典并以此为基础,综合采用情感计算、社会网络分析、文本挖掘、多元回归分析等方法,揭示了成人在线学习活动文本纪录语料中所蕴藏的学业情绪倾向及其相关影响因素,建立了基于情感权值词典的成人在线学业情绪倾向的测度方法.实验结果表明,基于情感权值词典进行情绪倾向分类达到了较高的测度精度;回归模型解析了在线学业情绪倾向的相关影响因素的影响力,显示了对在线学业情绪进行监控和调节的相关切入点.本研究为构建人机和谐的交互环境提供了学业情绪方面的参考依据,亦可为今后同类研究提供若干借鉴.  相似文献   

14.
为了提高机器学习算法对手写字文本识别能力,克服个体手写字风格多变的干扰,设计了一种基于贝叶斯与生成式对抗网络的手写字文本识别算法。首先,建立10000个汉字的手写字数组头,每个汉字数组头后面依附100种手写体,构建起1000000帧汉字文本图像帧,作为后续学习训练的训练集数据输入。然后,利用贝叶斯线性模型,结合线性回归和先验分布,基于手写字图像样本数据库,进行有监督的机器学习训练,得到机器学习算子,完成针对手写字的粗识别。随后,根据生成式对抗网络原理,创建生成模型和判别模型,设计自适应潜在损失函数和迭代终止函数,解决深度学习普遍存在的过拟合问题,完成生成式对抗网络算子,完成针对手写字的深度识别。最后基于QTcreator开发的集成平台来实现所提算法的功能,其中,机器学习算子由OpenCV视觉函数实现,深度学习算子由TensorFlow框架实现。实验数据显示,相较于传统手写字识别算法而言,所提算法具有更高的手写字识别能力。  相似文献   

15.
《滁州学院学报》2020,(2):69-73
机器学习方法已被逐渐应用于僵尸物联网的检测过程。然而,由于已有研究工作所用的机器学习方法以及实验用的数据集不同,很难对不同机器学习方法在僵尸物联网检测的性能进行一致性地评价。为解决上述问题,从是否使用特征降维、使用特征降维时所用的特征维度数量、测试和训练样本分布比例等三个方面设计了不同的实验方案,并在公共数据集上综合评价了多种基于机器学习的僵尸物联网检测方法。实验结果表明,在同样的数据集下,基于LDA-RandomFores的僵尸网络检测算法最好,基于GaussianNB的检测算法性能最差。实验结果为僵尸物联网检测方法研究与应用,选择合适的检测算法,提供了数据支持。  相似文献   

16.
文本聚类综述   总被引:1,自引:0,他引:1  
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘、智能搜索引擎、短文本信息处理等领域获得了广泛的应用。本文首先讨论了文本聚类(Text clustering)的应用,然后对文本聚类算法、聚类关键技术进行了综述。  相似文献   

17.
随着互联网的普及和网络信息传播速度的加快,意见领袖在网络信息传播控制中起到至关重要的引导作用。针对当前有关意见领袖的研究方法忽略了网络用户行为与情感倾向之间的关联性,或者只是将回复次数当作用户节点权重而进行简单累加的缺陷,提出一种基于用户情感倾向的意见领袖发现算法以提高意见领袖识别的精准度。不仅综合考虑了回复者对发帖者情感倾向,还将回复文本中大量存在的匿名回帖纳入计算,得到实名、匿名相融合的用户领袖值。以某论坛数据设计实验,结果表明,该算法具有更高的识别准确度。  相似文献   

18.
对大学生特定时间的社交媒体评论文本进行情感倾向分析,不仅可以帮助教师更好地了解该群体的情感特点,还可以为有关部门针对该群体的决策提供科学参考。文章采用SVM、KNN、DT和NB四种机器学习算法分别构建情感分类模型,同时采用查准率P、召回率R和F值作为评估指标对情感分类模型进行对比,最终选择SVM模型对157名大学生2019年1月至2020年2月期间的13048条微博文本数据进行了情感分析。研究结果表明,负向情感出现的时间段集中在2019年11月和2020年1至2月。在这两个时间段内,研究群体更关注“军训”“期末”“疫情”等事件,由此,学校管理者可针对这些话题或事件进行有针对性的干预,从而在一定程度上缓解学生的负向情绪,保障大学生的心理健康。  相似文献   

19.
基于碎片分词的未登录词识别方法   总被引:1,自引:0,他引:1  
提出了一种新的基于碎片分词的未登录词识别方法。该方法首先对文本进行分词,然后对分词结果中的碎片进行全切分生成临时词典,并利用规则和频度信息给临时词典中的每个字串赋权值,最后利用贪心算法获得每个碎片的最长路径,从而提取碎片中的未登录词。实验证明该方法开放测试的准确率达到82.88%,召回率达到87.51%。  相似文献   

20.
情感分类是自然语言处理的一个重要分支,情感分类方法包括传统的基于情感词典的方法和基于机器学习的方法,以及最新的基于深度学习的方法。为了探索情感分类的实现方法和研究进展,对传统的情感分类方法和基于深度学习的情感分类方法进行对比,并对深度学习LSTM原理进行了简要描述,可以发现基于深度学习的情感分类方法在情感分类上具有更大优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号