首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 797 毫秒
1.
陈杰  马静  李晓峰  郭小宇 《情报科学》2022,40(3):117-125
【目的/意义】本文融合文本和图像的多模态信息进行情感识别,引入图片模态信息进行情感语义增强,旨在 解决单一文本模态信息无法准确判定情感极性的问题。【方法/过程】本文以网民在新浪微博发表的微博数据为实 验对象,提出了一种基于DR-Transformer模型的多模态情感识别算法,使用预训练的DenseNet和RoBERTa模型, 分别提取图片模态和文本模态的情感特征;通过引入Modal Embedding机制,达到标识不同模态特征来源的目的; 采用浅层Transformer Encoder对不同模态的情感特征进行融合,利用Self-Attention机制动态调整各模态信息特征 的权重。【结果/结论】在微博数据集上的实验表明:模型情感识别准确率为 79.84%;相较于基于单一文本、图片模 态的情感分类算法,本模型准确率分别提升了 4.74%、19.05%;相较于对不同模态特征向量进行直接拼接的特征融 合方法,本模型准确率提升了 1.12%。充分说明了本模型在情感识别的问题上具有科学性、合理性、有效性。【创 新/局限】利用 Modal Embedding 和 Self-Attention 机制能够有效的融合多模态信息。微博网络舆情数据集还需进 一步扩充。  相似文献   

2.
[目的/意义]社会化在线评论与传统的专业性评论相比,具有更为显著的传播速度和影响力。文本评论中的情感因素并非单纯的数量化评分能够完全体现的。对本文评论中情感因素的测量与分析,能够有助于在线评论的全角度识别与揭示,更加客观准确地反映在线评论的价值。[过程/方法]通过提取用户发布的在线文本评论数据,采用有监督机器学习的算法,分别计算文本评论的情感分类得分、情感倾向得分、综合情感得分。从类型、地区、人数多个维度对情感得分与总评分进行交叉对比分析。[结果/结论]研究结果表明,文本评论蕴含的情感因素对总评分具有部分的影响作用。用户的认知偏好、社会文化背景和评论人数占比会对情感因素的有用性产生影响。  相似文献   

3.
[目的/意义] 提出一种基于在线产品评论的竞争情报挖掘框架,为企业改进产品设计和制定竞争策略提供参考。[方法/过程] 利用Word2vec技术构建产品特征词集合,识别用户评论主题特征。然后使用情感分析方法对评论文本进行分类,得到特征维度的评论情感。最后从产品主题特征和情感态度特征两方面进行数据分析,并以可视化结果呈现。[结果/结论] 以汽车行业的评论数据为例进行实验,结果表明该方法能够有效提取产品情报信息,帮助企业有效识别自身品牌及竞争对手的优势和劣势,为大数据环境下的竞争情报挖掘提供方法指导。  相似文献   

4.
[目的/意义]针对单纯使用统计自然语言处理技术对社交网络上产生的短文本数据进行意向分类时存在的特征稀疏、语义模糊和标记数据不足等问题,提出了一种融合心理语言学信息的Co-training意图分类方法。[方法/过程]首先,为丰富语义信息,在提取文本特征的同时融合带有情感倾向的心理语言学线索对特征维度进行扩展。其次,针对标记数据有限的问题,在模型训练阶段使用半监督集成法对两种机器学习分类方法(基于事件内容表达分类器与情感事件表达分类器)进行协同训练(Co-training)。最后,采用置信度乘积的投票制进行分类。[结论/结果]实验结果表明融入心理语言学信息的语料再经过协同训练的分类效果更优。  相似文献   

5.
[目的/意义]反讽作为一种隐性而间接的情感表达方式,在社交评论中被广泛使用,正确识别用户的反讽情感对于网络平台和服务商具有重要意义。[方法/过程]文章基于深度学习构建多模态反讽识别模型,以在线旅游评论为例,运用深度学习模型分别提取文本、表情符号和图片的特征向量,通过不同的特征融合方式进行反讽识别。[结果/结论]通过与单模态反讽识别模型进行对比实验,发现文章提出的多模态旅游评论反讽识别模型在准确率、召回率等指标上的结果更优,验证了多模态模型比单模态模型反讽识别效果更佳的结论。  相似文献   

6.
文章以豆瓣网站书籍评论为分析对象,采用中文情感词汇本体库进行情感要素的识别与加权,结合朴素贝叶斯算法实现了用户评论文本的情感自动分类,并探讨了该算法的分类效果,研究发现:朴素贝叶斯算法能够实现评论文本的情感分类,分类效果较好,但仍需结合规则匹配和人工校对的方式,提升分类效果。  相似文献   

7.
【目的/意义】随着旅游网站的增加,游客的网络评论日益增多。针对传统方法在旅游短文本评论主题分类 时出现特征维度过高和数据稀疏等问题,本文提出一种基于卷积神经网络和 SOM的旅游评论主题发现方法。【方 法/过程】首先采用词向量来进行文本表示,降低了特征维度过高问题;其次,通过卷积神经网络对评论文本提取高 阶的抽象特征;最后在通过 SOM 模型基于提取到的抽象特征对主题进行聚类。【结果/结论】实验结果表明, CNN-SOM算法较传统文本聚类算法在准确率、召回率和 F值上都有显著提高,能够更好的进行旅游评论的主题 发现。  相似文献   

8.
[目的/意义]掌握和了解微博环境下高校舆情情感的演化规律,对相关部门加强高校舆情监测监管,使高校适时采取措施应对负面舆情事件的恶性传播具有十分重要的意义。[方法/过程]本文通过文本挖掘并利用词云可视化展示对文本特征进行分析;基于朴素贝叶斯分类器将网络用户评论文本进行情感分类;结合用户情感演化与舆情事件发展周期的分析动态展示高校舆情情感演化图谱。[结果/结论]网民负向情感的占比在舆情蔓延期达到顶峰,中性情感的占比在舆情蔓延期最低,正向情感的占比在舆情周期中几乎没有变化。通过对微博环境下高校舆情情感演化图谱进行研究,为微博环境下高校舆情的研究提供新的理论支撑,在实践层面为舆情监管部门及时监测和有效引导高校舆情走向起到针对性的作用。  相似文献   

9.
高欢  那日萨  杨凡 《情报科学》2019,37(11):48-52
【目的/意义】准确挖掘消费者在线评论情感倾向,对于改善商家服务具有重要意义,而情感倾向预测的准 确性仍需提高。【方法/过程】文中设计基于集成学习的在线评论情感分类算法,即以N-gram算法分析在线评论词 语特征,结合情感词典构造文本特征,利用逻辑回归、Light GBM等机器学习方法为基础的集成学习进行训练,实现 在线评论情感分类。【结果/结论】实现了评论的情感倾向预测,在电脑评论数据集,较之于经典的SVM算法和无监 督类算法,该模型的分类衡量指标F1值分别提高了10%到30%不等。同时,在酒店、图书等不同领域的数据集上显 示,该方法的分类准确性仍具有上述效果,证明了该方法具有领域移植性。  相似文献   

10.
[目的/意义]针对专业领域研究人员难以从大量无监督文本数据中快速获取领域关键知识,以精准把握专业研究方向和内容。[方法/过程]文章提出一种基于迁移学习领域自适应的文本关键词提取模型。首先通过采集中国知网中特定领域的文章和关键词,将其作为目标域数据,将待提取关键词的无监督文本作为源域数据,通过最小化二者间的共享相似特征和关键词分类交叉熵,实现关键词提取方法的跨领域迁移,完成对无监督领域文本的关键词提取任务。[结果/结论]对1313篇“人工智能风险”主题的文章进行领域关键词提取,实验表明该领域关键词提取模型相比于BiLSTM-CRF、TF-IDF模型提取效果提升显著,在领域关键知识提取场景中有较强应用价值。  相似文献   

11.
[目的/意义]探讨网络舆情事件中群体观点的演变规律,构建有效预测其演变趋势的方法。[方法/过程]参考物理学中场的思想和信息科学中数据场的方法,引入观点场概念,提出了一种基于观点势的观点潜在影响力评估模型;然后将该模型运用到微博评论的群体观点演化分析中,建立了微博评论的观点趋势预测方法。该方法的基本思想是以当前评论的观点势分布来预测未来评论的观点分布,在观点势计算时,以既有评论的排序值代表新的信息受众所处的参考场点与观点场中既有评论之间的距离。[结果/结论]通过实际的微博舆情事件数据实验表明,该网络舆情群体观点趋势预测模型能较好地评估已发表的显性观点对后来网民观点形成的影响力,具有较高的网络舆情观点趋势预测准确率。  相似文献   

12.
自然语言处理是人工智能领域中的一个热门方向,而文本分类作为自然语言处理中的关键技术受到专家学者的广泛关注。随着机器学习技术的发展,决策树算法已经在文本分类中取得了较好的分类效果。本文针对短文本分类问题,利用TFIDF提取文本特征后,结合梯度提升决策树算法进行文本分类,并与朴素贝叶斯、逻辑回归和支持向量机的分类效果进行对比分析,验证了梯度提升决策树用于短文本分类的可行性。  相似文献   

13.
[目的/意义]旨在通过对网络舆情进行情感倾向分析和舆情追踪,为政府有效掌控网络舆情突发事件提供理论基础与决策支持。[方法/过程]以"罗一笑"事件为例,在建立加入特定事件语料情感分类词典和构建情感倾向分析模型的基础上,统计该事件微博文本的情感性强度和情感类型,从而划分网络舆情演化阶段。[结果/结论]揭示了舆情演化各阶段的特征与规律,据此提出引导网络舆情情感演化的相关建议。  相似文献   

14.
[目的/意义]实现海量产品评论数据的快速分析,帮助产品设计人员高效地获取用户需求,在新产品设计的决策中提供参考。[方法/过程]在特征提取和情感分析的基础上,构造了包括"词+词性+词干+位置+依存关系"等节点特征的条件随机场模型,按照"产品特征、谁、在何种情境下、遇到了什么问题"4个要素,以描述手机屏幕和电池的负面评论为例,从产品评论中提取用例。[结果/结论]模型评估和实证研究表明,所构造的模型可以有效地从评论文本中识别产品特征、使用主体、使用情景和遇到的问题,从而快速构造用例,获取用户需求。  相似文献   

15.
杜姗  杨敏  仇蓉蓉 《情报杂志》2023,(4):156-164
[研究目的]通过从评论文本和评论者两个维度对在线评论的特征进行挖掘,探究电商平台如何有效提高虚假评论识别的准确性,增加用户在线商品评论可信度,为消费决策提供参考。[研究方法]提出一种基于多维特征和SMOTE-RF模型的虚假评论识别方法。首先,通过识别商品虚假评论线索,构建多维特征向量,引入情感极性等特征并进行单调化处理;其次,在评分偏离度中添加了商品得分均值等统计指标来全面刻画虚假评论;最后,针对在线评论数据集中真实评论与虚假评论类不平衡问题,运用SMOTE算法优化随机森林分类模型,从而达到提高虚假评论识别准确性的目的。[研究结论]实验结果显示该方法在正负样本不平衡的虚假评论识别中具有更高的准确率、召回率及F1值。其中评分偏离度特征对虚假评论识别的影响最大,情感极性可作为识别的次要参考特征。因此,综合考虑在线评论多维特征和正负样本不平衡可帮助电商平台对虚假评论进行有效的过滤,为消费者提供更为可靠的评论数据。  相似文献   

16.
[目的/意义]用户生成内容有用性评价是自然语言处理研究的重要内容,文章提出一种融合领域情感词典与信息熵的评价方法,对体验型产品的用户生成内容有用性评价问题进行研究。[方法/过程]基于领域情感词典抽取用户评论语料的情感特征,并以信息熵作为信息量特征,以随机森林和梯度下降树分类模型进行对比实验,验证研究假设。[结果/结论]证明了体验型产品用户生成内容的有用性评价效果可以利用领域情感特征得到大幅提升,扩展了领域情感词典的实践应用场景。  相似文献   

17.
[目的/意义]大数据环境下,传统的竞争对手识别方法存在局限性,文章针对这种不足提出了一种能够适应大数据环境的竞争对手识别方法。[方法/过程]第一,基于互联网下顾客价值领先战略,从消费者角度出发,选择基于消费者情感特征的竞争对手评价体系;第二,以顾客评论作为数据源,通过对评论文本分析,提取顾客关注的产品特征;第三,基于文本情感分析技术计算企业相应产品特征的顾客情感得分;第四,基于自组织神经网络(SOM)构建竞争对手识别模型,并根据模型结果识别目标企业竞争对手。[结果/结论]使用酒店行业顾客评论数据进行实验,证实了该方法能够在大数据环境下快速、高效、客观地识别企业竞争对手。  相似文献   

18.
王浩 《情报探索》2020,(3):24-29
[目的/意义]旨在为有关部门及时分析和应对舆情提供参考。[方法/过程]通过爬虫搜集媒体上的舆情数据,计算舆情热度并划分舆情演化阶段,利用TextRank算法提取不同舆情阶段的关键词,采用Python语言的Snownlp库进行文本的情感分析,构建公安舆情分析模型,并通过“六安事件”对该模型进行验证。[结果/结论]该模型从热度、关键词与情感三个维度较好地对公安舆情数据进行分析和挖掘,有助于及时有效地处理社交媒体上的公安舆情数据,为公安舆情分析提供新的途径。  相似文献   

19.
[目的/意义]新媒体平台逐渐成为政民交互的重要载体,准确把握新媒体政务互动内容中的情感倾向,有助于提升政府舆情把握能力与社会治理能力。[方法/过程]在BERT文本语义表示基础上,将主动学习策略与BiLSTM模型集成,进行新媒体政务互动内容情感倾向分析,以提升模型对互动内容情感数据的有效利用。[结果/结论]针对“法律法规草案公开征求意见类”微博互动内容的实验表明,将主动学习引入BERT-BiLSTM模型后,模型的准确率、召回率及F值提升,新媒体政务互动内容情感呈现效果较好。文章所提模型科学可行,能够在减少数据依赖的情况下,提升情感挖掘的效率。  相似文献   

20.
[目的/意义]丰富的互联网数据为洞悉真实事件提供了多维视角,快速识别突发事件并准确判断其所属类别,有助于各级政府及应急管理部门高效地管理应急情报资源。[方法/过程]文章构建了基于文本—图像增强的突发事件识别及分类的理论模型;通过文本卷积神经网络、视觉几何群网络搭建深度神经网络共同组成Multi-DNN模型;最后以真实的自然灾害类突发事件数据进行实例验证。[结果/结论]通过文本、图像相互增强,多模态特征融合能够提升突发事件识别及分类的准确率,同时在小样本数据的任务处理中仍有良好效果,证明不同模态的数据能够相互补充、相互印证,对其融合处理能够提供比单一模态更为准确和全面的信息分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号