首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
陈杰  马静  李晓峰  郭小宇 《情报科学》2022,40(3):117-125
【目的/意义】本文融合文本和图像的多模态信息进行情感识别,引入图片模态信息进行情感语义增强,旨在 解决单一文本模态信息无法准确判定情感极性的问题。【方法/过程】本文以网民在新浪微博发表的微博数据为实 验对象,提出了一种基于DR-Transformer模型的多模态情感识别算法,使用预训练的DenseNet和RoBERTa模型, 分别提取图片模态和文本模态的情感特征;通过引入Modal Embedding机制,达到标识不同模态特征来源的目的; 采用浅层Transformer Encoder对不同模态的情感特征进行融合,利用Self-Attention机制动态调整各模态信息特征 的权重。【结果/结论】在微博数据集上的实验表明:模型情感识别准确率为 79.84%;相较于基于单一文本、图片模 态的情感分类算法,本模型准确率分别提升了 4.74%、19.05%;相较于对不同模态特征向量进行直接拼接的特征融 合方法,本模型准确率提升了 1.12%。充分说明了本模型在情感识别的问题上具有科学性、合理性、有效性。【创 新/局限】利用 Modal Embedding 和 Self-Attention 机制能够有效的融合多模态信息。微博网络舆情数据集还需进 一步扩充。  相似文献   

2.
韩娜  马海群  刘兴丽 《情报科学》2021,39(11):180-186
【目的/意义】从大数据驱动角度出发,探索采用人工智能方法实现对政策文本协同性定量分析的可能性。 【方法/过程】以政策全文本数据为研究对象,使用知识图谱技术实现不同主题的本体构建,并应用数据挖掘中关联 规则构建推理模型,对图谱表示的政策文本进行协同性语义挖掘和推理。【结果/结论】围绕“开放数据”和“数据安 全”主题构建知识图谱,实现对政策文本的本体表示,在此基础上使用关联规则完成单文本和多文本在两个主题间 的协同性分析。【创新/局限】本文将知识图谱应用于政策文本分析领域,并完成协同性分析,为政策的全样本分析 提供可能性,后续需扩大样本规模,提升推理效率。  相似文献   

3.
郝彦辉  王曦  陈铎 《情报科学》2021,39(8):78-85
【目的/意义】教育招生考试备受社会各界关注,极易触发舆情事件。及时监测并准确研判相关网络信息传 播发展态势,发现潜在舆情并处置应对,对于保障考试安全和维护学校声誉具有重要意义。【方法/过程】采集研究 生复试期间主流媒体社交平台数据,将BERT语言训练模型同BiLSTM相结合,构建深度神经网络模型,对文本的 情感极性进行分析。用TextRank算法提取不同情感极性类属文本的热门主题词,监测潜在舆情并提出管理建议。 【结果/结论】实证结果表明,该模型能够有效挖掘不同情感极性下的热门主题信息,从而发现潜在隐患以及可能发 生的舆情焦点,为高校网络舆情管控提供了方法参考和实践依据。【创新/局限】与传统方法相比,基于BERT的预训 练语言模型可有效解决因数据量少而导致模型无法准确表示不同语句之间复杂关系的局限性,同时BERT可对文 本进行双向建模,捕获不同句子之间的关系特点,提升对文本情感主题挖掘的准确性。  相似文献   

4.
赵蓉英  张扬 《情报科学》2018,36(10):171-177
【目的/意义】情感分析目的是对用户评论等网络文本信息进行抽取和情感判断,为企业、政府等机构提供 决策支持。本文旨在分析情感分析提出至今相关研究的主题演化规律,及图书情报学科进行情感分析的研究特 点。【方法/过程】本文基于文献计量学和可视化的方法,系统梳理国内外情感分析研究发文量、学科、主题及研究热 点规律,并利用 Web of science学科类别分析情感分析在图书情报领域的特点。【结果/结论】本文总结出情感分析研 究不仅与社交媒体联系密切,更融合了计算机科学、语言学、文献学等多学科知识。图书情报领域开展情感分析研 究有广泛的应用空间和实际需求,目前正处于快速发展时期,研究者应把握这一研究热点。  相似文献   

5.
王曦  陈铎 《情报科学》2022,40(7):55-60
【目的/意义】为把握招生考试过程中网络舆论的基本特点和发展规律,及时发现潜在舆情隐患,本研究对 考研复试期间国内主流网络社交平台的相关话题讨论文本进行了主题演化研究。【方法/过程】使用 Python采集数 据,BTM模型对数据中的词对建模来进行主题挖掘和聚类,对各主题强度和内容随时间的演化进行分析。【结果/结 论】主题强度和内容演化结果显示,公众的关注点与招生录取进程密切相关,并呈现一定的周期和规律性,能够做 为网络舆情预测的依据。【创新/局限】BTM模型克服了短文本语料中的数据稀疏问题,能够有效进行主题挖掘,但 同时也存在语义理解不足,需要人工辅助解读的问题,需要在后续研究中进一步改进。  相似文献   

6.
【目的/意义】目前舆情情感演化研究大多是基于主题的方法来进行情感演化分析且重点均集中在从文本 本身提取的信息上,对在社交媒体中影响情感分析的用户特征缺乏考虑。【方法/过程】本文充分考虑网络用户信息 特征,构建融合用户特征的舆情情感演化方法,提出一种基于用户注意力机制的情感分析模型(U-BiLSTM),并以 新冠肺炎疫情事件为例分析舆情情感演化过程。【结果/结论】研究结果表明U-BiLSTM情感分析模型具有一定的 优越性,F1值和准确率能达到97.08%和95.19%。【创新/局限】研究提出的融合用户注意力机制的情感分析模型能够 使舆情情感演化分析具有一定的可解释性,有效揭示面向突发公共卫生事件下网民的情感演化趋势,但由于时间 和设备条件的限制,仅采用单一数据源未考虑数据的多源性,研究的数据集不够充分且研究角度仅考虑时间维度 忽略了空间维度。  相似文献   

7.
庞庆华  董显蔚  周斌  付眸 《情报科学》2022,40(5):111-117
【目的/意义】负面在线评论已成为商家重要的经营决策信息,对了解客户消费满意度、改善产品和服务质量 具有重要意义。【方法/过程】该文将情感分析和关键词抽取相结合,提出一种基于BiGRU-CNN 和 TextRank的在 线评论负面关键词抽取方法,即首先对在线评论文本数据进行清洗,然后构建 BiGRU- CNN 情感分类模型对在 线评论进行情感分析,最后采取TextRank 方法抽取情感分析得到的负面评论中的关键词。利用这种方法,对十个 产品与服务类别的6万余条消费者在线评论文本数据进行实证分析。【结果/结论】实验结果表明,该方法能准确判 别客户负面在线评论情感倾向,F1值达92.41%,并且负面在线评论关键词抽取结果能较好帮助商家完善产品质量 和服务。【创新/局限】提出一种结合双向GRU 和CNN 结合的情感分类模型,在此基础上基于TextRank 方法抽取 情感分析得到的负面评论中的关键词,进一步提升模型对于在线评论情感分析的准确性。  相似文献   

8.
叶英平  任志欣  周昕 《情报科学》2023,(5):144-152+160
【目的/意义】探究亲子阅读偏好对引导亲子读物选购具有重要的参考价值,通过对亲子读物的在线消费评价进行分析,深度挖掘影响亲子阅读偏好的维度要素,对提高亲子阅读质量和兴趣具有理论意义与实践价值。【方法/过程】从材质材料、形式形态、主题内容、社会感知价值四个维度对亲子阅读偏好进行评价,建立基于情感词典的在线消费评价偏好模型,对评论文本进行情感词抽取及情感值计算,获取在线消费评价中情感数据,绘制在线消费评价的偏好词标签云和动态偏好趋势曲线。【结果/结论】在线消费评价分析结果表明,幼儿更易被材料环保、形式独特的读物吸引;随着认知阶段的发展,亲子阅读偏好逐渐转向对主题内容的关注;注重提升社会感知价值。【创新/局限】本文构建亲子阅读偏好的评价模型,围绕亲子阅读的偏好维度对在线消费评价情感进行可视化分析。本文仅通过情感分析技术提取在线消费评价中的情感数据,未结合对具体消费者的深度访谈,未能全面概述基于在线消费评价的亲子阅读偏好情况。  相似文献   

9.
【目的/意义】分析网民在突发公共卫生事件中的情感演化历程,探究影响网民情感波动的因素及其时空演 化的差异。【方法/过程】运用Python爬取微博新冠疫情相关文本数据315 445条,基于SnowNLP情感分析工具对数 据文本进行情感分析。使用TF-IDF及LDA主题模型进行建模,对不同阶段及不同群体的舆情时空演化及差异进 行内容分析。【结果/结论】网民的情感演化呈现阶段性和群体性差异,尽管整体为积极态势,但疫情上升期为负面 情绪集中爆发期;网民群体中受教育程度较低的群体情感波动幅度更大,更容易受到舆论的影响,舆情演化更易极 化;中心大城市情感波动相对稳定,而引起其他区域网民消极情绪的往往不是疫情本身,而是由疫情引发的负面舆 论;普通网民群体较于高影响力群体在舆情演化阶段的负面情绪更为严重,情感演化在各阶段呈现明显的涟漪效 应,需在不同阶段针对不同群体制定有效的舆情引导政策。【创新/局限】本文将整个语料库划分为50多个小语料, 个别语料文本数据量较少,具有一定的局限性。  相似文献   

10.
【目的/意义】在线健康社区用户规模庞大,信息量浩如烟海,如何帮助社区管理者和用户判别有用信息,提 高决策效率是亟待解决的问题。【方法/过程】在复杂网络视角下,提出一个新的评论有用性分析框架。首先,采集 在线健康社区患者评论数据,采用文本分析法分析有用评论、非有用评论以及所有评论的主题分布和情感分布,初 步分析各类评论文本的有用性特征;其次,将各类评论文本分别转换为文本关联网络,使用社会网络分析方法进一 步分析其有用性特征;最后,分析评论有用性及其特征与患者发表评论、用户对评论的有用性投票以及文本关联网 络结构特征的关联性,实现基于文本关联网络的评论有用性分析。【结果/结论】有用评论和非有用评论文本关联网 络结构具有一定差异,在线健康社区用户就诊前后的信息需求和经验输出的重点有所不同。【创新/局限】基于复杂 网络视角研究在线健康社区评论有用性,但仅使用了好大夫在线的数据,未来可对更多数量和种类的在线健康社 区信息内容有用性进行研究。  相似文献   

11.
刘家益  邹益民 《情报科学》2017,35(7):154-161
【目的/意义】文本自动摘要能快速获取文本主要内容,极大提高信息使用效率,帮助人们从信息海洋中解 放出来。随着互联网大数据日益深入发展,文本信息的数量已经远远超出人工处理极限,文本自动摘要研究显得 越发迫切和重要。【方法/内容】本文通过对过去70年国内外文本自动摘要经典文献重要文献进行收集、整理和分 析,总结归纳出六类主要文本自动摘要方法及其理念和具体做法,对比评析其优势不足,并对未来研究方向进行展 望,绘制出该研究领域的一个发展全景图。【结果/结论】自动摘要方法所使用的特征经历了由简单到复杂、由个体 到联系、由表层到深层的发展路径;如何深入利用深度学习方法,以及如何将传统方法与深度学习方法更好结合起 来将是下一步研究的热点和重点。  相似文献   

12.
李湘东  阮涛  潘练 《情报科学》2018,36(4):14-21
【目的/意义】使用聚类技术在话题分析之前对文本集中的噪声文本进行识别筛查,并采用文档相似度分布 及困惑度等对去噪和建模效果加以检验。【方法/过程】在提高文本集质量之后,借助LDA概率主题模型对新闻文本 集进行话题抽取,通过计算相似度为不同时间窗口下的主题建立联系,挖掘热点话题及其演化规律。【结果/结论】 将本方法应用于2014 年度电商类新闻,得到的结果与同年度新华网经由人工评选出的电商热点新闻主题相比较, 证明本方法的准确性。  相似文献   

13.
【目的/意义】明确用户评论的情感倾向及其主要影响因素,有助于政府了解网民的态度及观点,更好地引 导和控制舆情发展。【方法/过程】运用八爪鱼软件采集新浪政务微博上的辟谣信息,获取数据75847条,构建多元 Logistic回归模型对用户情感倾向的影响因素进行分析。【结果/结论】研究发现:用户对政府辟谣信息表现出不同的 情感倾向,其中,中性情感倾向用户比重最小,消极情感用户和积极情感用户占比接近;内容特征变量、文本特征变 量、用户特征变量均对用户情感倾向有显著影响,但影响方式各异。  相似文献   

14.
【目的】 以开放平台的研究论文为研究对象,跟踪分析单篇论文的各项Altmetrics数据,探讨研究论文的网络传播特征及规律,丰富学术论文的网络传播理论。【方法】 跟踪记录PLoS BiologyPLoS Medicine期刊38篇研究论文的Altmetrics数据,数据收集日期为2016年11月论文发表日至2017年10月16日。利用统计学方法分析以及检验记录的数据,重点探索总浏览量指标的累积趋势和分布规律。【结果】 研究论文总浏览量累积曲线呈现规律性增长,增长速度先快后慢;20%研究论文的总浏览量之和是另外80%研究论文所累积的总浏览量之和的一半以上;论文初期与后期2个时间节点的总浏览量的分布情况一致。【结论】 论文发表初期是总浏览量的大量累积阶段,不同论文的总浏览量分布规律随时间增长具有一致性。  相似文献   

15.
摘 要 【目的】为国内出版界介绍如何使用CrossRef文本和数据挖掘。【方法】 研究CrossRef文本和数据挖掘的流程,并分析《浙江大学学报(英文版)》的CrossRef文本和数据挖掘创新服务的实践。【结果】 CrossRef文本和数据挖掘可以为研究人员提供便捷的服务,支持科学研究。【结论】 加入CrossRef文本和数据挖掘顺应国际出版业的潮流和发展,并可藉此扩大期刊的国际显示度,从多角度增强期刊的国际影响力。  相似文献   

16.
【目的】为国内出版界介绍如何使用CrossRef文本和数据挖掘。【方法】 研究CrossRef文本和数据挖掘的流程,并分析《浙江大学学报(英文版)》的CrossRef文本和数据挖掘创新服务的实践。【结果】 CrossRef文本和数据挖掘可以为研究人员提供便捷的服务,支持科学研究。【结论】 加入CrossRef文本和数据挖掘顺应国际出版业的潮流和发展,并可藉此扩大期刊的国际显示度,从多角度增强期刊的国际影响力。  相似文献   

17.
【目的/意义】分析高校新媒体的信息传播网络结构及演化特征,有利于推动高校信息的有效传播,提升舆 论引导力。【方法/过程】以高校官方微博为例,本文对高校新媒体信息传播网络密度特征、网络中心性特征、网络结 构特征、地域路径及情感路径特征进行了分析,最后运用BA无标度网络模型对高校新媒体信息传播网络结构的演 化特征进行了仿真模拟。【结果/结论】高校新媒体信息传播网络具有较小的聚类系数、较短的网络平均路径,节点 的度分布符合幂律规律;高校新媒体影响力正在突破传统地域影响;高校信息传播中以积极情感为主,网络舆情事 件对情感影响较大;随着节点增加,网络平均度经过前期快速增长后会稳定在某个恒定值左右,网络平均路径长度 则一直呈现增长趋势。最后本文提出了改善高校新媒体信息传播网络结构的建议。【创新/局限】在今后的研究中 需要进一步扩大数据样本和时间跨度。  相似文献   

18.
【目的/意义】提出融合深层演化特征的情感分析方法,以提升公共安全事件微博情感分析精度。【方法/过 程】以红黄蓝幼儿园涉嫌虐童事件为例,使用LDA与爬虫软件提取演化特征中的主题特征、时间特征,结合传统浅 层文本词性特征与情感特征,应用于XGBoost以生成微博情感分析集成模型。【结果/结论】演化特征的融入使得 情感识别准确度Auc值提高4%,且XGBoost分类精度均优于SVM、随机森林。本文提出的情感识别模型能够在公 共安全事件微博情感分析方面取得较好效果  相似文献   

19.
【目的/意义】消费者评论数量巨大且充满随意性,因此需要对评论信息进行分析,信息分析可以给潜在消 费者提供有价值参考,可以给商家提供消费者对产品的反馈意见,也可以给平台改善服务提供参考,从而实现消费 者、商家和平台的共赢。【方法/过程】以从京东商城爬取的部分产品评论文本为研究对象,使用词频、词云分析的方 法对评论中的产品特征进行抽取,分析消费者对产品属性的偏好,通过情感倾向计算方法,对五种不同类别的产品 评论进行情感倾向分析,并研究消费者对产品属性的偏好和情感倾向间的关系。【结果/结论】研究结果表明,对于 不同类型的产品,消费者有不同的属性偏好,且关注的产品特征数量也不同。在此基础上,分别对商家、电商平台 和消费者提出了有针对性的建议。【创新/局限】使用评论挖掘的方法,从消费者、商家和平台三个视角进行研究,提 出应对方法。但对数据的处理仍然不够精确,有待进一步研究。  相似文献   

20.
范昊  何灏 《情报科学》2022,40(6):90-97
【目的/意义】随着社交媒体的发展,各类新闻数量激增,舆情监测处理越来越重要,高效精确的识别舆情新 闻可以帮助有关部门及时搜集跟踪突发事件信息并处理,减小舆论对社会的影响。本文提出一种融合 BERT、 TEXTCNN、BILSTM的新闻标题文本分类模型,充分考虑词嵌入信息、文本特征和上下文信息,以提高新闻标题类 别识别的准确率。【方法/过程】将使用BERT生成的新闻标题文本向量输入到TEXTCNN提取特征,将TEXTCNN 的结果输入到 BILSTM 捕获新闻标题上下文信息,利用 softmax判断分类结果。【结果/结论】研究表明,本文提出的 融合了基于语言模型的 BERT、基于词向量 TEXTCNN 和基于上下文机制 BILSTM 三种算法的分类模型在准确 率、精确率、召回率和F1值均达到了0.92以上,而且具有良好的泛化能力,优于传统的文本分类模型。【创新/局限】 本文使用BERT进行词嵌入,同时进行特征提取和捕获上下文语义,模型识别新闻类别表现良好,但模型参数较多 向量维度较大对训练设备要求较高,同时数据类别只有10类,未对类别更多或类别更细化的数据进行实验。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号