首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 742 毫秒
1.
金占勇  田亚鹏  白莽 《情报科学》2019,37(5):142-147
【目的/意义】为推动深度学习在网络舆情管理中的应用,提高突发灾害事件网络舆情情感识别效率。【方 法/过程】基于OCC模型建立了突发自然灾害网络舆情情感规则,并由word2vec构建文本向量作为长短期记忆网 络(Long-short term memory,LSTM)的初始输入,对其训练得到突发灾害事件网络舆情多情感识别模型。【结果/结 论】通过对比试验发现,OCC情感规则能够提升情感识别模型的正确率,基于LSTM和word2vec的突发灾害事件 网络舆情情感识别模型在情感识别效果上优于TF-IDF文本向量化方法以及基于卷积神经网络(Convolutional neural network,CNN)和传统的机器学习方式(Support vector machine,SVM)的分类算法结果。  相似文献   

2.
张雷  谭慧雯  张璇  韩龙 《情报科学》2022,40(3):144-151
【目的/意义】构建高校师德舆情微博用户评论LDA模型,可以更精准识别舆情演化特征和分析关键主题传 播路径,帮助高校和相关部门更为有效地进行舆情监管和舆情引导。【方法/过程】本文以“天津大学一教授学术造 假”事件为例,基于 LDA模型构建高校师德舆情下微博用户主题生成模型,采用困惑度评价指标确定 LDA模型最 优主题数,采用信息熵确定每一主题在不同日期的主题强度,通过关键词共现知识图谱、词云展现舆情话题的演 变,最后基于主题相似度确定主题传播路径。【结果/结论】LDA模型和信息熵可以解析出网络用户群体关注的重要 主题热点,精准识别舆情演化特征,识别主题最优传播路径进行舆论引导,对爆发的舆情实现预测和管制优化。【创 新/局限】文章创新性地构建高校学术道德舆情的LDA主题模型,有效确定微博用户群体主题、识别舆情演化特征、 分析主题间传播路径,具有普适性;进一步扩大高校师德其他舆情分析及结合网络舆情情感分析为下一步的研究 内容。  相似文献   

3.
【目的/意义】旨在从网络舆情用户信息及文本内容视角出发,构建不同维度的网络舆情主题图谱,结合主 题图谱对网络舆情进行特征演化及可视化分析,为舆情管理提供参考。【方法/过程】本文以实体抽取和关系构建技 术为基础,构建了网络舆情主题图谱模型,并以“台风利奇马”事件为例,建立了三个不同维度的主题图谱,结合用 户和文本等多维度微观数据,对网络舆情特征演化进行分析。【结果/结论】在该事件中,用户影响力节点具备多元 化、相关性、官方主导性等特点;网络舆情演化对应台风事件发展存在一定的滞后性;PC终端存在传播媒介种类少、 发博数量多且用户集中等特点,移动终端存在传播媒介种类多、发博数量少且用户分布均匀等特点。【创新/局限】 本文借助主题图谱,构建了网络舆情用户节点和文本节点及其关联关系,从用户、账户、内容三个维度系统且全面 的展示了网络舆情特征的演化规律。  相似文献   

4.
庄媛 《情报科学》2023,41(2):150-156
【目的/意义】企业和国家对网络热点话题舆情的关注度越来越高,越来越多的企业、部门和政府通过舆情信息监控系统应对网络中爆发的群体性事件和舆论压力,在此环境下对网络热点话题舆情信息进行监控可以方便舆情危机的处理。而传统的网络舆情信息监控方法为构建词项识别体系,存在监控效率低、监控效果差等问题。为此,本文对网络热点话题舆情信息监控策略进行研究。【方法/过程】构建的ISM模型对网络热点话题舆情信息监控进行相关性分析,利用建立词项识别体系,并通过K-means算法处理突发词项完成对网络热点话题舆情信息的识别,获取网络热点话题舆情信息监控影响因素集,构建舆情信息监控影响因素的直接关系矩阵,结合布尔代数运算规则和推移规律建立可达矩,从而构建出舆情信息监控影响因素关联矩阵及解释结构模型,完成网络热点话题舆情信息监控。【结果/结论】结果表明,舆情热度、舆情关注度、舆情影响力、舆情敏感度和网民情感都会对网络热点话题舆情信息的监控产生影响。在此基础上提出网络热点话题舆情信息监控策略。【创新/局限】为有效地防止网络恶性事件突发,需要全面、及时地掌握网络热点话题舆情信息的发展情况,通过分析网络热点话题舆情信息监...  相似文献   

5.
范昊  何灏 《情报科学》2022,40(6):90-97
【目的/意义】随着社交媒体的发展,各类新闻数量激增,舆情监测处理越来越重要,高效精确的识别舆情新 闻可以帮助有关部门及时搜集跟踪突发事件信息并处理,减小舆论对社会的影响。本文提出一种融合 BERT、 TEXTCNN、BILSTM的新闻标题文本分类模型,充分考虑词嵌入信息、文本特征和上下文信息,以提高新闻标题类 别识别的准确率。【方法/过程】将使用BERT生成的新闻标题文本向量输入到TEXTCNN提取特征,将TEXTCNN 的结果输入到 BILSTM 捕获新闻标题上下文信息,利用 softmax判断分类结果。【结果/结论】研究表明,本文提出的 融合了基于语言模型的 BERT、基于词向量 TEXTCNN 和基于上下文机制 BILSTM 三种算法的分类模型在准确 率、精确率、召回率和F1值均达到了0.92以上,而且具有良好的泛化能力,优于传统的文本分类模型。【创新/局限】 本文使用BERT进行词嵌入,同时进行特征提取和捕获上下文语义,模型识别新闻类别表现良好,但模型参数较多 向量维度较大对训练设备要求较高,同时数据类别只有10类,未对类别更多或类别更细化的数据进行实验。  相似文献   

6.
王曦  陈铎 《情报科学》2022,40(7):55-60
【目的/意义】为把握招生考试过程中网络舆论的基本特点和发展规律,及时发现潜在舆情隐患,本研究对 考研复试期间国内主流网络社交平台的相关话题讨论文本进行了主题演化研究。【方法/过程】使用 Python采集数 据,BTM模型对数据中的词对建模来进行主题挖掘和聚类,对各主题强度和内容随时间的演化进行分析。【结果/结 论】主题强度和内容演化结果显示,公众的关注点与招生录取进程密切相关,并呈现一定的周期和规律性,能够做 为网络舆情预测的依据。【创新/局限】BTM模型克服了短文本语料中的数据稀疏问题,能够有效进行主题挖掘,但 同时也存在语义理解不足,需要人工辅助解读的问题,需要在后续研究中进一步改进。  相似文献   

7.
闫盛枫 《情报科学》2021,39(9):146-154
【目的/意义】探测特定领域政策文本语义主题,揭示我国政策部署领域与未来发展趋势。【方法/过程】提出 一种融合词向量语义增强和DTM模型的公共政策文本时序建模与可视化方法,采用DTM模型实现政策文本的时 序切割和主题建模,利用深度学习Word2vec算法中Skip-gram词嵌入技术可以对上下文词汇进行有效预测,增强 其语义表达性和政策解释性,以更为准确地揭示我国公共政策的部署重点。【结果/结论】实验表明本文提出的方法 对于公共政策主题识别和政策文本量化具有更好的知识抽取和语义表达能力,对我国公共政策挖掘和信息揭示具 有良好的揭示。【创新/局限】提出融合词向量语义增强和DTM模型的公共政策文本时序建模方法,一定程度上提 升了政策文本的主题语义表达,未来考虑利用深度学习技术如LSTM算法、BERT模型等识别政策中的领域知识单 元和语法结构。  相似文献   

8.
郝彦辉  王曦  陈铎 《情报科学》2021,39(8):78-85
【目的/意义】教育招生考试备受社会各界关注,极易触发舆情事件。及时监测并准确研判相关网络信息传 播发展态势,发现潜在舆情并处置应对,对于保障考试安全和维护学校声誉具有重要意义。【方法/过程】采集研究 生复试期间主流媒体社交平台数据,将BERT语言训练模型同BiLSTM相结合,构建深度神经网络模型,对文本的 情感极性进行分析。用TextRank算法提取不同情感极性类属文本的热门主题词,监测潜在舆情并提出管理建议。 【结果/结论】实证结果表明,该模型能够有效挖掘不同情感极性下的热门主题信息,从而发现潜在隐患以及可能发 生的舆情焦点,为高校网络舆情管控提供了方法参考和实践依据。【创新/局限】与传统方法相比,基于BERT的预训 练语言模型可有效解决因数据量少而导致模型无法准确表示不同语句之间复杂关系的局限性,同时BERT可对文 本进行双向建模,捕获不同句子之间的关系特点,提升对文本情感主题挖掘的准确性。  相似文献   

9.
【目的/意义】监测高校网络舆情大数据信息,建立风险评估及预警系统对于快速准确识别高校网络舆情危 机风险等级,提高高校和政府相关部门对网络舆情的监管效率、应对能力以及治理水平有着极其重要的意义。【方 法/过程】在研究高校网络舆情影响因素和发展演化规律的基础上,构建舆情发布者影响力、舆情热度、舆情强度、 舆情扩散度四个维度的高校网络舆情风险评估指标体系,利用随机森林算法和熵权法进行指标筛选和权重计算, 综合运用TOPSIS法和灰色关联分析法构建高校网络舆情风险评估及预警模型,对舆情风险等级进行划分。【结果/ 结论】研究结果表明,该模型具有很好的准确性和有效性,极大简化了高校网络舆情风险评估和危机预警的识别程 序,为合理有效地处理和应对高校网络舆情提供了借鉴和参考。【创新/局限】增加风险评估指标筛选过程,两种评 估方法的有效结合使得风险评估和预警结果更加客观准确。  相似文献   

10.
【目的/意义】随着社交网络与新闻媒体的发展,大量虚假信息的滋生与传播已经引发了严重的社会问题。目前的研究主要依赖于收集谣言发生后的传播特征进行识别。为了在早期更准确地发现谣言,本文提出一种融合深度语义知识的谣言识别模型。【方法/过程】本文通过使用Transformer和Multi-head注意力抽取舆情信息深层结构的复杂特征,融合了文档结构及上下文语义知识表征,以提高早期识别虚假舆论信息准确率来及时防止谣言传播扩散。【结果/结论】本文通过在各个平台的真实数据集进行训练和识别实验,较现有基线方法的准确率最少提升了5.6%,最大提高了24.6%。结果表明,本文模型可通过对早期谣言文本的事实验证,提高模型识别谣言的准确性以在早期阶段阻断谣言传播。【创新/局限】本文谣言识别模型在BERT-Base基础上进一步结合了舆情文本语义知识特征表征,能有效提高早期谣言的识别准确度,但目前尚未考虑谣言传播者个性化特征如社会标签、行为信息等,如何融合更多传播者特征有待进一步研究。  相似文献   

11.
卢恒  张向先  闫伟 《情报科学》2022,39(1):158-165
【目的/意义】探索重大疫情中网络舆情的多属性演化规律,为重大疫情防控中的网络舆情治理实践提供参 考。【方法/过程】基于社会学视角构建了重大疫情中网络舆情多属性演化分析模型,选取湖北红十字会事件微博舆 情数据为研究对象,采用意见领袖影响力评价、LDA主题模型和Snownlp情感分析方法对重大疫情中网络舆情意见 领袖、主题分布和情感走势进行分析,从人群、内容和情绪三种社会属性揭示重大疫情中网络舆情多属性演化规 律。【结果/结论】结果表明,重大疫情网络舆情可以分为突发期、爆发期、降温期和失焦期四个阶段,各个阶段在意 见领袖、主题讨论内容和情感倾向上均有较为明显的区别,网民的情感阶段变化与舆情的主题属性演化规律相吻 合。【创新/局限】本研究提出的模型能够有效满足重大疫情网络舆情演化特征深度挖掘的要求,为重大疫情网络舆 情的治理实践提供参考。后续研究可选取更广泛的舆情事件和数据源验证该模型。  相似文献   

12.
【目的/意义】移动互联网时代,微博以其快速、便捷的优点迅速成为信息传播与共享的平台之一。在互联 网信息传播过程中,话题内容焦点会随着时间推动发生动态迁移,及时准确的发现话题内容焦点的迁移有助于了 解网络舆情的演化趋势。【方法/过程】首先,定义基于焦点特征词分布的焦点词提取公式,构造焦点特征词集合;然 后,使用Skip-gram模型在大规模语料上训练得到词向量,再通过BTM对文本建模,直接在BTM主题维上结合焦 点特征词集合构造主题词向量;最后,计算主题特征词间的相似度,将其应用到聚类算法中实现话题焦点识别。 【结果/结论】通过对新浪微博数据集上的实验结果表明,本方法能够充分利用词向量引入的语义信息,提高文本聚 类效果,有效的获取各阶段的话题焦点。  相似文献   

13.
【目的/意义】随着互联网在社会中的影响力逐渐增大,面对网络群体性事件对社会生活的冲击,需把握网 络群体性事件的演化规律,确定事件类别,提炼事件特征,基于不同类别的网络群体性事件,提出有针对性的应对 措施。【方法/过程】通过LDA主题模型与K-means算法相结合,利用LDA模型实现文本潜在语义的识别,最终运用 SVM算法进行网络群体性事件聚类分析,得到五类网络群体性事件。【结果/结论】构建的网络群体性事件动态识别 模型,通过大量的文本训练,在事件聚类数为5时具有良好的解释性,完成了网络群体性事件的客观分类,分别为: 经济型、社会型、文化型、民族型和环境型,为政府分类应对策略提供依据。【创新/局限】利用 LDA主题模型和 Kmeans算法,减少了模型的迭代次数,确定最佳主题数,提高了网络群体性事件识别结果的准确性,但是运用慧科新 闻数据库搜集到的文本数据范围有限,且分类结果反应的事件特征具有一定局限性,后续研究可进一步扩大动态 文本数据库,对分类算法进行改进和深化。  相似文献   

14.
程雅倩  黄玮  金晓祥  贾佳 《情报科学》2022,39(2):155-161
【目的/意义】由于自媒体平台中的多标签文本具有高维性和不平衡性,导致文本分类效果较差,因此通过 研究5G环境下高校图书馆自媒体平台多标签文本分类方法对解决该问题具有重要意义。【方法/过程】本文首先通 过对采集的5G环境下高校图书馆自媒体平台多标签文本进行预处理,包括无意义数据去除、文本分词以及去停用 词等;然后采用改进主成分分析方法进行多标签文本降维处理,利用向量空间模型实现文本平衡化处理;最后以处 理后的文本为基础,采用Adaboost和SVM两种算法构建文本分类器,实现多标签文本分类。【结果/结论】实验结果 表明,本文拟定的自媒体平台标签文本分类方法可以使汉明损失降低,F1值提高,多标签文本分类效果好,且耗时 较低,具有可靠性。【创新/局限】由于本研究中的数据集数量不够多,所以在测试和验证方面,得出的结果具有一定 局限性。因此在未来研究中期望利用更为丰富的数据库,对所设计的方法做出进一步的改进与创新。  相似文献   

15.
【目的/意义】网络社会充斥大量负面网络舆情,负面网络舆情风险分级和研判对提高网络治理能力和网络 社会治理成效意义重大。【方法/过程】构建负面网络舆情风险指标体系,并采用熵权法计算风险指标权重;基于加 权GRA模型计算灰色加权信息关联度,在此基础上,运用k-means聚类算法构建负面网络舆情风险分级方案,据此 对负面网络舆情进行风险预测。【结果/结论】实证分析结果表明,所建负面网络舆情风险分级模型客观性强、可靠 度高,可为负面网络舆情风险精准响应提供有效决策依据。【创新/局限】以信息关联为视角,为负面网络舆情风险 分级与预测提供了新的研究框架,但典型案例数据库有待继续完善。  相似文献   

16.
张国标  李洁  胡潇戈 《情报科学》2021,39(10):126-132
【目的/意义】社交媒体在改变新闻传播以及人类获取信息方式的同时,也成为了虚假新闻传播的主要渠 道。因此,快速识别社交媒体中的虚假新闻,扼制虚假信息的传播,对净化网络空间、维护公共安全至关重要。【方 法/过程】为了有效识别社交媒体上发布的虚假新闻,本文基于对虚假新闻内容特征的深入剖析,分别设计了文本 词向量、文本情感、图像底层、图像语义特征的表示方法,用以提取社交网络中虚假新闻的图像特征信息和文本特 征信息,构建多模态特征融合的虚假新闻检测模型,并使用MediaEval2015数据集对模型性能进行效果验证。【结果/ 结论】通过对比分析不同特征组合方式和不同分类方法的实验结果,发现融合文本特征和图像特征的多模态模型 可以有效提升虚假新闻检测效果。【创新/局限】研究从多模态的角度设计了虚假新闻检测模型,融合了文本与图像 的多种特征。然而采用向量拼接来实现特征融合,不仅无法实现各种特征的充分互补,而且容易造成维度灾难。  相似文献   

17.
徐海玲 《情报科学》2022,40(7):48-54
【目的/意义】基于事理图谱的方法对网络舆情事件进行揭示,能够准确分析舆情事件的发展趋势和脉络, 为政府部门的舆情管控和舆情引导献计献策。【方法/过程】以微博“长征5B失控”的相关主题与评论内容为研究对 象,对提取的数据进行清洗和处理、抽取和泛化,分别生成顺承事件对和因果事件对,并对其顺承关系和因果关系 进行识别,从而构建网络舆情事理图谱。【结果/结论】在网络舆情的发展过程中,可以看出因果事件的演化路径具 有时间发生短,演化路径短的特点,伴随着时间的推移,其演化的趋势也逐步降低;网络舆情顺承事件具有传播的 时间长,传播的路径多且具有多向性的传播特点,在顺承事件的传播过程中,往往伴随着因果事件,且舆情事件的 走向与网民的情绪有很大的关联。【创新/局限】构建基于事理图谱的网络舆情的演化路径,同时揭示网络舆情演化 的传播特点与现实意义,后续有必要扩大研究样本,使得研究结果具有更好地通用性。  相似文献   

18.
朱光  潘高枝  李凤景 《情报科学》2022,40(4):127-137
【目的/意义】识别信息隐私研究领域的热点主题,梳理主题演化路径。【方法/过程】针对主题识别语义杂乱 等问题,提出时序关联与结构表征视角下的主题演化分析方法。首先利用LDA(Latent Dirichlet Allocation)模型识 别多时间窗口下的文献主题,进一步运用共词分析绘制语义更为独立的主题凝聚子群。在此基础上,从时序关联 维度计算相邻窗口下主题间的相似度,梳理演化路径;从结构表征维度,设计主题新颖度、中心性、影响力等计量指 标,探寻信息隐私前沿和热点主题的演化变迁。【结果/结论】实证分析结果表明,本文方法可以深度挖掘信息隐私 领域研究主题,从宏微观两个维度全面梳理主题的演化路径。研究有利于探测信息隐私研究的前沿。【创新/局限】 综合运用LDA主题模型与共词分析方法绘制主题凝聚子群,从时序演化和结构表征两个维度探寻主题演化路径。 未来研究中有待于引入多种数据源以对比主题差异,有待于引入多元组术语改善主题识别效果。  相似文献   

19.
任妮  鲍彤  沈耕宇  郭婷 《情报科学》2021,39(11):96-102
【 目的/意义】开展面向领域的细粒度命名实体识别研究对于提升文本挖掘精度具有重要的意义,本文以番 茄病虫害命名实体为例,探索采用深度学习技术实现面向领域的细粒度命名实体识别研究方法。【目的/意义】文章 以电子书、论文、网页作为数据源,选择品种、病虫害、症状、时间、部位、防治药剂六类实体进行标注,利用BERT和 CBOW 预训练字向量分别输入 BiLSTM-CRF 模型训练,并在识别后补充规则控制实体的边界。【结果/结论】 BERT预训练的字向量和BiLSTM-CRF结合,在补充规则控制后F值达到了81.03%,优于其它模型,在番茄病虫害 领域的实体识别中具有较好的效果。【创新/局限】BERT预训练的字向量可以有效降低番茄病虫害领域实体因分 词错误带来的影响,针对不同实体的特点,补充规则可以有效控制实体边界,提高识别准确率。但本文的规则补充 仅在测试阶段,并没有加入训练过程,整体的准确率还有待提高。  相似文献   

20.
【目的/意义】从海量微博信息中提取准确的主题词,以期为政府和企业进行舆情分析提供有价值的参考。 【方法/过程】通过分析传统微博主题词提取方法的特点及不足,提出了基于语义概念和词共现的微博主题词提取 方法,该方法利用文本扩充策略将微博从短文本扩充为较长文本,借助于语义词典对微博文本中的词汇进行语义 概念扩展,结合微博文本结构特点分配词汇权重,再综合考虑词汇的共现度来提取微博主题词。【结果/结论】实验 结果表明本文提出的微博主题词提取算法优于传统方法,它能够有效提高微博主题词提取的性能。【创新/局限】利 用语义概念结合词共现思想进行微博主题词提取是一种新的探索,由于算法中的分词方法对个别网络新词切分可 能不合适,会对关键词提取准确性造成微小影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号