共查询到20条相似文献,搜索用时 375 毫秒
1.
本研究以《乘风破浪的姐姐》第三季视频微博评论区文本为研究对象,利用网络爬虫技术获取该条微博评论区评论文本数据,基于LDA主题模型和词频分析法对微博用户的评论文本特征进行挖掘,意图探索微博用户关注焦点和情感倾向。分析结果显示受众对《乘风破浪的姐姐》第三季的讨论主要集中在表达喜爱、回忆青春等方面,这种现象的背后是唱跳节目触发了受众的集体记忆,引发了一场以回忆青春为主题的媒介狂欢。 相似文献
2.
基于文本情感挖掘的企业技术竞争情报采集模型研究 总被引:1,自引:0,他引:1
3.
[目的/意义]以我国14个省级政府开放数据平台为研究对象,从多个维度对其进行比较分析,为我国政府开放数据平台的发展提供参考建议.[方法/过程]通过爬虫技术获取数据,对数据进行描述性分析,并采用Tf-idf模型进行文本挖掘.以数据层维度和平台层维度为出发点,使用定性和定量分析方式,对数据资源细粒度、领域分布、时效性、格式... 相似文献
4.
详细介绍一种生物主题爬虫的设计及实现方案, 通过优化初始种子模块、主题相关度分析模块、排序模块等四个模块的共同运行实现对网页信息的处理。用高效的主题爬虫取代传统搜索引擎中的普通爬虫, 为实现更准确的信息采集提供良好基础。 相似文献
5.
6.
7.
互联网平台的纪念账号不仅作为逝者个人数字遗产的重要载体,生者在纪念账号下的哀悼行为也已成为一种独特的媒介记忆实践,延续着生者与逝者之间的情感。本文通过爬虫获取B站平台的纪念账号数据,对文本进行语义网络分析、主题分析和情感分析。B站纪念账号的媒介记忆建构基础来源于逝者生前的媒介记忆内容,建构过程始于个体书写哀思、与逝者建立数字对话和表达情感,由此形成集体哀悼空间,用户在其中的社交互动最终将情感从负面悲伤情绪延展至正面鼓励祝福。纪念账号在实现媒介记忆功能的同时,通过延展性情感空间书写了多向度的记忆图式与情感框架,使生者在多维的媒介场景中共话死亡议题,本研究揭示了数字时代普通公众在死亡、哀悼和记忆等实践中具有复杂性和多样性。 相似文献
8.
9.
研究语音信息内容分析的特点,对比文本信息分析处理的异同,对语音信息的内容分析技术进行综述并给出内容分析技术的体系框架,并对语音识别、情感信息的识别、语音识别分类等重难点技术进行研究。 相似文献
10.
11.
12.
“躺平”作为2021年“十大网络热词”之一,引发了大量的关注和讨论。本文以新浪微博中有关“躺平”和“内卷”的内容为研究数据,基于词频统计和LDA主题模型提取主题,从文本特征透视青年亚文化的情绪表达。通过对文本数据进行分析发现,“躺平”的微博内容主要呈现出青年的“躺平原因”“内心情感”“寻求寄托”“享受生活”四个主题;而“内卷”的微博内容主要呈现出青年人视角下“内卷严重”“生活压力”“反抗内卷”“教育内卷”四个主题。“躺平”和“内卷”的话语表达折射出了当代青年人的生活现状和内心情感。对文本内容进行分析之后,本文探析了“躺平”和“内卷”流行的成因以及青年亚文化表征,并对青年亚文化的情绪表达进行思考。 相似文献
13.
基于P2P的分布式主题爬虫系统的设计与实现 总被引:1,自引:0,他引:1
本文详细叙述了一个用于信息检索的基于P2P的分布式爬虫系统的设计和实现过程.系统基于锚文本上下文进行主题相关性判定,采用P2P式的分布式结构,充分利用其动态增加新结点的特性来动态地扩展系统的规模,提高系统的整体吞吐能力,以满足现在和将来的用户对日益增长的大数据量检索需求.实验结果表明,可根据用户给定的主题对网页链接上下文进行主题相关性判定以引导爬虫的爬行路径,能够有效地获取相关主题信息. 相似文献
14.
章浩明赵樱 《大学图书情报学刊》2022,(6):107-113
以双心疾病为例揭示用户的健康信息需求及情感特征,发现在线健康社区信息服务存在的不足,为在线健康社区建设提供建议。爬取并筛选在线健康社区中双心疾病用户问诊文本,通过文本聚类、基于词表的情感分析,归纳信息需求主题和情感倾向,并对主题和情感进行相关性分析。在线健康社区的双心疾病用户存在12个信息需求主题:症状表现、体征检测、情绪心理、生活状态、医院科室、病理病因、药效与副作用、手术治疗、自我管理、并发症、家庭社会、药品与适应症。用户在线问诊表现的情感以消极情绪为主,情感在不同主题间表现出集中性和差异性。在线健康社区应加强信息分类组织,提供个性化情感支持,重视引进生物医学与精神心理学双重背景的人才。 相似文献
15.
[目的/意义] 从主题和情感的维度对国外高校图书馆在线展览进行定量化研究,有助于深入客观地了解国外高校图书馆在线展览的现状,对国内高校图书馆在线展览的建设与发展有重要的借鉴意义。[方法/过程] 利用基于LDA的主题建模技术和基于Sentiment analysis的情感分析技术以及网络爬虫方法,从语义关联、情感表达等角度对美国和英国302所高校图书馆的2 278个在线展览内容进行定量分析和可视化展示。[结果/结论] 英美高校图书馆在线展览在主题上具有明显的文化传承差异的同时又对高校的建设和发展表现了共同的关注,展览作品的年代注重历史发展特色,并且涉及战争、政治、种族等话题的作品具有强烈的情感色彩。 相似文献
16.
17.
本文以社会化问答社区为例,探究疫情期间健康信息需求的主题与用户情感变化特征,以期改进问答社区在突发事件中的应急策略,通过数据采集和清洗、文本预处理、LDA主题模型、BERT+BiLSTM情感分类模型对25540条数据进行知识挖掘和主题-情感协同分析。研究结果显示,本文使用的方案能够有效捕捉疫情期间网民需求健康信息的主题特征。在情感分类方面,BERT+BiLSTM模型的分类准确率较基线模型提升了11.75%。为更好地应对突发公共卫生事件,本文建议社会化问答社区应自行生产科学的健康信息、提高针对主题的舆情监控力度并积极引导用户认知。 相似文献
18.
传统主流媒体作为科学传播的重要主体,在科学事件报道和科学知识科普中扮演着重要角色。为更好地了解传统主流媒体在社交媒体上进行在线科学传播的特点和效果,本文探究了主流媒体科学类博文的文本特征及其对传播效果的影响。首先,本研究获取了九大官方主流媒体于2021年全年在微博平台上所发布的全部11万余条博文,根据科学传播相关的关键词筛选出6000余条科学类博文。基于LDA对文本数据集进行主题建模分析,归纳出29个一级主题和7个二级主题,得到主流媒体科学传播的整体主题分布情况。具体主题所囊括的意涵显示,主流媒体既对科学发现和科技创新进行及时且持续的报道,也生产分发与大众密切相关的社会民生、健康等知识普及类内容。其次,本文对抽样得到的样本数据集进行基于人工编码的内容分析,得到样本中每条博文的情感立场和引用源。最后,本文对主题、情感立场和引用源三个文本特征与博文的转发、点赞、评论三个传播效果表征指标之间的关系进行研究。结果显示,主题和情感立场对博文的三个传播指标均产生显著影响,引用源则并无显著影响。主题为社会民生类科学知识普及、持正向情感立场的博文的传播效果显著好于其他博文。大众对具有不同文本特征的科学类博文有着不同的传播积极性,与日常生活知识科普密切相关、更容易引起情感共鸣的内容能够获得更好的传播效果。 相似文献
19.
从主题爬虫角度看数字资源建设 总被引:2,自引:0,他引:2
数字资源建设是图书馆的一个重要研究领域,通过主题爬虫自动收集网络数字资源是数字资源建设的一种重要途径;主题爬虫是主题搜索引擎的重要组成部分,主题搜索算法是主题爬虫的核心;按照评价链接价值方式的不同,对现有的主题搜索算法进行分类,系统分析、比较了每类算法的特点和优缺点。 相似文献
20.
情感分析研究的知识结构及热点前沿探析 总被引:1,自引:0,他引:1
为了解国内外情感分析领域的研究状况,揭示该领域的知识结构、研究热点与发展动态,本文采用共被引分析、聚类分析、共词分析、战略坐标分析等方法,借助CiteSpace、UCINET、BICOMB、SPSS等软件,对Web of Science数据库收录的以情感分析为主题的相关文献进行计量分析与知识图谱绘制。分析结果表明,情感分析的应用、深度学习与神经网络、电子商务下的产品评论、事物情感特征评分、社交网络下用户生成内容、语义定向广告技术以及文本语言属性分析构建了情感分析的知识结构,产品评论与口碑、数据挖掘与人工智能、无监督学习、HadoopMapReduce与支持向量机以及神经网络与深度学习为该领域的研究热点,而顾客评论、推荐系统、极性分类、主题模型、电影评论、推特数据将是未来该领域主要研究方向。 相似文献