首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
朱芷瑶 《新闻前哨》2023,(10):57-59
本研究以《乘风破浪的姐姐》第三季视频微博评论区文本为研究对象,利用网络爬虫技术获取该条微博评论区评论文本数据,基于LDA主题模型和词频分析法对微博用户的评论文本特征进行挖掘,意图探索微博用户关注焦点和情感倾向。分析结果显示受众对《乘风破浪的姐姐》第三季的讨论主要集中在表达喜爱、回忆青春等方面,这种现象的背后是唱跳节目触发了受众的集体记忆,引发了一场以回忆青春为主题的媒介狂欢。  相似文献   

2.
基于文本情感挖掘的企业技术竞争情报采集模型研究   总被引:1,自引:0,他引:1  
在分析情感知识的技术竞争情报价值和文本信息资源的情感特性及情感化方式的基础上,围绕企业技术竞争情报获取目标与环境,结合文本情感挖掘流程构建由数据层、处理层、应用层组成的采集模型,可用于从以网络技术评论为典型代表的主观性文本信息资源中识别出情感知识作为对传统的主题式情报采集的有益补充,实现情感类技术竞争情报的智能获取。  相似文献   

3.
[目的/意义]以我国14个省级政府开放数据平台为研究对象,从多个维度对其进行比较分析,为我国政府开放数据平台的发展提供参考建议.[方法/过程]通过爬虫技术获取数据,对数据进行描述性分析,并采用Tf-idf模型进行文本挖掘.以数据层维度和平台层维度为出发点,使用定性和定量分析方式,对数据资源细粒度、领域分布、时效性、格式...  相似文献   

4.
任辉 《图书情报工作》2009,53(9):105-107
详细介绍一种生物主题爬虫的设计及实现方案, 通过优化初始种子模块、主题相关度分析模块、排序模块等四个模块的共同运行实现对网页信息的处理。用高效的主题爬虫取代传统搜索引擎中的普通爬虫, 为实现更准确的信息采集提供良好基础。  相似文献   

5.
通过对开源网络爬虫Heritrix的系统构架进行改进,设计基于关键词过滤的主题网络爬虫,并提供一种配置手段利用HTMLParser技术对抽取内容进行结构化分解。实验结果表明,这种对Heritrix改进从而实现的网络爬虫,能够有效地按关键词过滤信息内容,并对信息主体进行了结构化存储。  相似文献   

6.
通过对开源网络爬虫Heritrix的系统构架进行改进,设计基于关键词过滤的主题网络爬虫,并提供一种配置手段利用HTMLParser技术对抽取内容进行结构化分解。实验结果表明,这种对Heritrix改进从而实现的网络爬虫,能够有效地按关键词过滤信息内容,并对信息主体进行了结构化存储。  相似文献   

7.
互联网平台的纪念账号不仅作为逝者个人数字遗产的重要载体,生者在纪念账号下的哀悼行为也已成为一种独特的媒介记忆实践,延续着生者与逝者之间的情感。本文通过爬虫获取B站平台的纪念账号数据,对文本进行语义网络分析、主题分析和情感分析。B站纪念账号的媒介记忆建构基础来源于逝者生前的媒介记忆内容,建构过程始于个体书写哀思、与逝者建立数字对话和表达情感,由此形成集体哀悼空间,用户在其中的社交互动最终将情感从负面悲伤情绪延展至正面鼓励祝福。纪念账号在实现媒介记忆功能的同时,通过延展性情感空间书写了多向度的记忆图式与情感框架,使生者在多维的媒介场景中共话死亡议题,本研究揭示了数字时代普通公众在死亡、哀悼和记忆等实践中具有复杂性和多样性。  相似文献   

8.
严娜  陈满儒 《今传媒》2014,(1):96-97
网络影评作为融媒体时代的新型艺术形式,它以其独特的文化艺术形式、独特的文本制作团队、独特的文本传播媒介等特点,使网络影评从过去的单一创作媒介、单一制作团队以及单一的传播渠道脱离出来,创作出一系列文本形式丰富多彩的网络影评文本。本文分为三个章节:第一章介绍网络影评的概念;第二章介绍网络影评的三大特点,即便捷性、开放性与互动性;第三章分析中国网络影评的发展预期。  相似文献   

9.
研究语音信息内容分析的特点,对比文本信息分析处理的异同,对语音信息的内容分析技术进行综述并给出内容分析技术的体系框架,并对语音识别、情感信息的识别、语音识别分类等重难点技术进行研究。  相似文献   

10.
网络影评作为融媒体时代的新型艺术形式,它以其独特的文化艺术形式、独特的文本制作团队、独特的文本传播媒介等特点,使网络影评从过去的单一创作媒介、单一制作团队以及单一的传播渠道脱离出来,创作出一系列文本形式丰富多彩的网络影评文本。本文分为三个章节:第一章介绍网络影评的概念;第二章介绍网络影评的三大特点,即便捷性、开放性与互动性;第三章分析中国网络影评的发展预期。  相似文献   

11.
主题网络爬虫是针对某一特定领域进行信息采集的网络爬虫,本文提出将主题网络爬虫应用于数字档案馆的信息采集,以档案采集系统的设计目标为出发点,阐述了基于主题网络爬虫的档案信息采集系统的设计方案和该系统实现的相关技术。  相似文献   

12.
“躺平”作为2021年“十大网络热词”之一,引发了大量的关注和讨论。本文以新浪微博中有关“躺平”和“内卷”的内容为研究数据,基于词频统计和LDA主题模型提取主题,从文本特征透视青年亚文化的情绪表达。通过对文本数据进行分析发现,“躺平”的微博内容主要呈现出青年的“躺平原因”“内心情感”“寻求寄托”“享受生活”四个主题;而“内卷”的微博内容主要呈现出青年人视角下“内卷严重”“生活压力”“反抗内卷”“教育内卷”四个主题。“躺平”和“内卷”的话语表达折射出了当代青年人的生活现状和内心情感。对文本内容进行分析之后,本文探析了“躺平”和“内卷”流行的成因以及青年亚文化表征,并对青年亚文化的情绪表达进行思考。  相似文献   

13.
基于P2P的分布式主题爬虫系统的设计与实现   总被引:1,自引:0,他引:1  
本文详细叙述了一个用于信息检索的基于P2P的分布式爬虫系统的设计和实现过程.系统基于锚文本上下文进行主题相关性判定,采用P2P式的分布式结构,充分利用其动态增加新结点的特性来动态地扩展系统的规模,提高系统的整体吞吐能力,以满足现在和将来的用户对日益增长的大数据量检索需求.实验结果表明,可根据用户给定的主题对网页链接上下文进行主题相关性判定以引导爬虫的爬行路径,能够有效地获取相关主题信息.  相似文献   

14.
以双心疾病为例揭示用户的健康信息需求及情感特征,发现在线健康社区信息服务存在的不足,为在线健康社区建设提供建议。爬取并筛选在线健康社区中双心疾病用户问诊文本,通过文本聚类、基于词表的情感分析,归纳信息需求主题和情感倾向,并对主题和情感进行相关性分析。在线健康社区的双心疾病用户存在12个信息需求主题:症状表现、体征检测、情绪心理、生活状态、医院科室、病理病因、药效与副作用、手术治疗、自我管理、并发症、家庭社会、药品与适应症。用户在线问诊表现的情感以消极情绪为主,情感在不同主题间表现出集中性和差异性。在线健康社区应加强信息分类组织,提供个性化情感支持,重视引进生物医学与精神心理学双重背景的人才。  相似文献   

15.
吴茵茵 《图书情报工作》2021,65(20):142-150
[目的/意义] 从主题和情感的维度对国外高校图书馆在线展览进行定量化研究,有助于深入客观地了解国外高校图书馆在线展览的现状,对国内高校图书馆在线展览的建设与发展有重要的借鉴意义。[方法/过程] 利用基于LDA的主题建模技术和基于Sentiment analysis的情感分析技术以及网络爬虫方法,从语义关联、情感表达等角度对美国和英国302所高校图书馆的2 278个在线展览内容进行定量分析和可视化展示。[结果/结论] 英美高校图书馆在线展览在主题上具有明显的文化传承差异的同时又对高校的建设和发展表现了共同的关注,展览作品的年代注重历史发展特色,并且涉及战争、政治、种族等话题的作品具有强烈的情感色彩。  相似文献   

16.
文本情感摘要技术的目的是以简洁的形式准确表达文章的核心情感内容。为解决不同的文档结构及内容特征等问题对摘要结果的影响,提出了一种基于主题的SE-TextRank 情感摘要方法。通过LDA 模型自动获取收敛后的文本主题,利用余弦距离算法进行主题句子分组,使用传统多特征融合以及SE-TextRank 情感摘要算法对组内中心句抽取,最终获取目的摘要。实验表明,采用此方法能够更为高效的获取新闻文本摘要结果。  相似文献   

17.
本文以社会化问答社区为例,探究疫情期间健康信息需求的主题与用户情感变化特征,以期改进问答社区在突发事件中的应急策略,通过数据采集和清洗、文本预处理、LDA主题模型、BERT+BiLSTM情感分类模型对25540条数据进行知识挖掘和主题-情感协同分析。研究结果显示,本文使用的方案能够有效捕捉疫情期间网民需求健康信息的主题特征。在情感分类方面,BERT+BiLSTM模型的分类准确率较基线模型提升了11.75%。为更好地应对突发公共卫生事件,本文建议社会化问答社区应自行生产科学的健康信息、提高针对主题的舆情监控力度并积极引导用户认知。  相似文献   

18.
传统主流媒体作为科学传播的重要主体,在科学事件报道和科学知识科普中扮演着重要角色。为更好地了解传统主流媒体在社交媒体上进行在线科学传播的特点和效果,本文探究了主流媒体科学类博文的文本特征及其对传播效果的影响。首先,本研究获取了九大官方主流媒体于2021年全年在微博平台上所发布的全部11万余条博文,根据科学传播相关的关键词筛选出6000余条科学类博文。基于LDA对文本数据集进行主题建模分析,归纳出29个一级主题和7个二级主题,得到主流媒体科学传播的整体主题分布情况。具体主题所囊括的意涵显示,主流媒体既对科学发现和科技创新进行及时且持续的报道,也生产分发与大众密切相关的社会民生、健康等知识普及类内容。其次,本文对抽样得到的样本数据集进行基于人工编码的内容分析,得到样本中每条博文的情感立场和引用源。最后,本文对主题、情感立场和引用源三个文本特征与博文的转发、点赞、评论三个传播效果表征指标之间的关系进行研究。结果显示,主题和情感立场对博文的三个传播指标均产生显著影响,引用源则并无显著影响。主题为社会民生类科学知识普及、持正向情感立场的博文的传播效果显著好于其他博文。大众对具有不同文本特征的科学类博文有着不同的传播积极性,与日常生活知识科普密切相关、更容易引起情感共鸣的内容能够获得更好的传播效果。  相似文献   

19.
从主题爬虫角度看数字资源建设   总被引:2,自引:0,他引:2  
宋宇 《中国索引》2010,8(1):47-51
数字资源建设是图书馆的一个重要研究领域,通过主题爬虫自动收集网络数字资源是数字资源建设的一种重要途径;主题爬虫是主题搜索引擎的重要组成部分,主题搜索算法是主题爬虫的核心;按照评价链接价值方式的不同,对现有的主题搜索算法进行分类,系统分析、比较了每类算法的特点和优缺点。  相似文献   

20.
情感分析研究的知识结构及热点前沿探析   总被引:1,自引:0,他引:1  
周建  刘炎宝  刘佳佳 《情报学报》2020,39(1):111-124
为了解国内外情感分析领域的研究状况,揭示该领域的知识结构、研究热点与发展动态,本文采用共被引分析、聚类分析、共词分析、战略坐标分析等方法,借助CiteSpace、UCINET、BICOMB、SPSS等软件,对Web of Science数据库收录的以情感分析为主题的相关文献进行计量分析与知识图谱绘制。分析结果表明,情感分析的应用、深度学习与神经网络、电子商务下的产品评论、事物情感特征评分、社交网络下用户生成内容、语义定向广告技术以及文本语言属性分析构建了情感分析的知识结构,产品评论与口碑、数据挖掘与人工智能、无监督学习、HadoopMapReduce与支持向量机以及神经网络与深度学习为该领域的研究热点,而顾客评论、推荐系统、极性分类、主题模型、电影评论、推特数据将是未来该领域主要研究方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号