首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
[目的/意义] 探索微博舆情传播周期中不同传播者关注的舆情热点和传播内容的主要观点,进而发现舆情传播的特点和规律,为舆情分析与决策提供依据。[方法/过程] 以特定舆情事件的事实文本数据为来源,以生命周期理论和LDA方法为指导,设计研究流程与构建研究模型,对微博舆情事件中不同传播者的话题进行主题研究,其中包括主题抽取和结果语义标注、各阶段的不同传播者主题的语义分析、基于时间维度的舆情主题观点识别与刻画。[结果/结论] 研究发现,论文所提出的研究模型能够挖掘出舆情传播周期中不同传播者的主题结构、观点脉络以及特征,研判出分布在文字当中有关联性的、代表性的、重要的词语。同时,结论中还发现微博中的官媒、大众媒体发布信息中的话题和用户谈论的热点话题具有明显的差异性。  相似文献   

2.
基于概率图模型的科研文献主题演化研究   总被引:3,自引:2,他引:1  
学术文献的主题分析对于研究者进行思路整理及发现研究主题非常重要.通过进一步的分析,能够理解主题如何发展变化,以及如何影响研究者的行为等等.探索了基于概率图模型的科研文献主题演化问题,特别分析了主题随时间的相互影响问题,提出了基于模块化网络的方法研究主题之间的相互关系,从而理解其相互影响.首先,利用主题模型获取时间文本的主题及其强度曲线,然后利用时间序列的逐段线性表示方法去除序列中的噪音,从而有效反映趋势信息,使得利用模块化网络能够更加准确地反映主题的影响关系,实验结果及其相关分析证明了方法的有效性.  相似文献   

3.
[目的/意义]主题演化对科技前沿探测、创新战略部署具有十分重要的作用。[方法/过程]将主题演化分析过程分解为主题的表示、相似性关联和强度演化计算几个步骤,提出一种主题强度演化与预测模型,使用LDA模型进行主题的表示,提出内容、共现和趋势相似度等维度进行主题关联计算,引入基于Prophet的预测-修正模型进行主题演化趋势预测。并以干细胞领域为例,进行演化的实证分析。[结果/结论]实验表明,对每个研究主题采用Logistic增长模型进行预测R2Score都达到0.90以上,表明Prophet的Logistic增长模型与该领域主题增长趋势规律相符合,能够较好地拟合主题强度的演化趋势。提出的主题演化模型对专业领域内主题分布与演化分析有一定的借鉴意义。  相似文献   

4.
《新闻界》2016,(18)
在广告理论研究中,广告主题应该成为广告内容研究的重要内容,但是学术界对其缺乏足够的关注和深入的探究。本文通过对广告主题的界定以及广告主题研究现状的探析,结合广告发展历史的回顾,对不同时期广告主题内容及特征的表现进行探究。依据四个不同时期将其分为四种广告主题类型,这四种不同类型的广告主题,彼此联系相互融合,在企业发展的不同阶段,对广告传播策略的制定和广告理论的完善具有重要的指导意义。  相似文献   

5.
学科领域生命周期中作者研究兴趣演化分析   总被引:4,自引:3,他引:1  
关鹏  王曰芬 《图书情报工作》2016,60(19):116-124
[目的/意义]为揭示作者研究兴趣的演化特征,结合生命周期理论和Author-Topic(AT)主题模型提出作者研究兴趣演化分析框架。[方法/过程]收集CNKI数据库中锂离子电池领域的期刊论文数据,通过文献信息增长规律对学科生命周期发展阶段进行划分,利用AT主题模型抽取分析作者-主题、主题-词项以及文档-主题概率分布,通过追踪学科领域生命周期中主题强度和作者研究兴趣度的变化趋势进行演化分析。[结果/结论]实证研究选择核心作者作为分析对象,结果显示国内锂离子电池领域的核心作者的研究兴趣度普遍在成长期达到最大值,对学科发展起到促进作用。核心作者的研究兴趣演化趋势与相应的主题演化趋势一致时,能够引领该研究主题的发展。但也存在一些研究主题,其演化趋势并不同于核心作者的研究兴趣演化趋势,这部分主题往往强度值较大,涉及的研究方向比较广。  相似文献   

6.
[目的/意义]研究前沿的准确判断是国家宏观层面的战略需求,文献计量学作为一种定量研究方法广泛应用于科学主题探测和研究前沿识别中。[方法/过程]梳理研究前沿主题探测的发展历程和方法模型,引入全域微观模型的概念,详细介绍SciVal模块采用的主题创建方法,包括直接引用文献聚类、关键词主题命名和研究前沿遴选的主题显著性算法,并对SciVal创建的9.6万个主题和遴选出的前1%的研究前沿主题的特征进行实证分析。[结果/结论]全域微观模型可以同时一次识别整个科学领域的所有主题,但不同学科在研究前沿上表现存在差异,不能把主题显著性简单等同为重要性;主题论文数量与主题排名之间存在中度相关性;自动抽取的关键词术语从学科领域层和独特性上命名和描述主题;石墨烯相关前沿主题的演变趋势分析可以用于发现关键节点和新兴主题。  相似文献   

7.
[目的/意义] 基于社交媒体,探索突发事件信息生命周期中不同利益相关者的动态分类及其关注主题的演变规律,为更精准的危机信息监测与动态决策提供依据。[方法/过程] 以特定危机事件的事实文本数据为来源,以利益相关者理论和动态主题模型为指导,构建三维动态主题演化模型以对社交媒体危机事件中不同利益相关者的分类与话题关注进行主题挖掘。其中包括时间粒度划分、利益相关者的定量评估、基于时间和主体的危机主题观点识别与刻画,并利用可视化工具对该动态趋势进行表征。[结果/结论] 基于三维动态主题演化模型,利益相关者的组成与分类在不同阶段中具有明显的差异性,同时其关注主题与行为特征也体现出不同的偏好性和动态差异性。危机主体的动态与危机主题的动态有效结合,能够更加全面地表达舆情传播的特点和规律。  相似文献   

8.
微博主题的演化分析会帮助用户快速准确地理解主题脉络结构、跟踪主题发展情况,并根据主题演化做出相应的预测.本文对概率主题模型LDA (Latent Dirichlet Allocation)进行了扩展,使其适合中文微博短文本的处理,并利用LDA建模结果对微博主题进行演化分析.为了体现不同时间片中主题演化的动态性,本文在使用LDA建模之前首先对每个时间片内最优主题数目进行确定,再通过LDA主题抽取结果,追踪不同时间片内主题的变化趋势,实现主题在内容和强度两个方面的演化分析.通过在真实微博语料库上进行实验,结果表明该方法不但可以较好地分析出同一微博主题随时间的强度演化规律,还可以描述主题内容的演化趋势.  相似文献   

9.
[目的/意义]为全面、客观、高效、直观地掌握科技领域主题的发展规律和演变趋势,提出一种基于多源数据的领域主题演化路径识别和分析框架。[方法/过程]获取不同来源的科技文献数据,利用多维样本有序聚类方法辅助时间切片,基于改进的词袋构建方法,提升LDA模型主题识别效果,借助Louvain社区发现算法在主题层进行多源数据的融合,分析领域主题演化路径。[结果/结论]利用美国太赫兹研究领域基金项目、论文和专利3种来源的数据进行实证研究,结果表明,3种数据源能够清晰划分出4个时间窗口,改进的词袋构建方法能够表征更准确的领域信息内涵,主题社区有助于从多源数据复杂的演化网络中厘清主题演化脉络。  相似文献   

10.
微博主题发现研究方法述评   总被引:2,自引:1,他引:1  
[目的/意义]对现有微博主题发现的研究文献进行全面的梳理和评述,为研究人员深入开展相关研究提供借鉴。[方法/过程]针对传统的主题发现的基本原理和主要研究方法,分析微博文本的组织特征,从基于短文本特征和基于非文本特征的这两个角度对微博主题发现方法进行梳理,并对两类方法进行详细的阐述及特点分析,最后对微博主题发现研究的发展趋势进行展望。[结果/结论]目前微博主题发现的研究还处于探索阶段,未来应该继续深化理论探索、创新研究方法。  相似文献   

11.
张培晶  宋蕾 《图书情报工作》2012,56(24):120-126
在介绍概率主题模型发展过程以及概率主题模型的代表性模型LDA基本原理的基础上,分析LDA模型的特征及其用于微博类网络文本挖掘的优势;介绍和评述微博环境下现有的基于LDA模型的文本主题建模方法,并对其扩展方式和建模效果进行总结和比较;最后对微博文本主题建模的发展方向进行展望。  相似文献   

12.
[目的/意义] 为有效探测科技文献中潜在的研究热点,研究文献中关键词突发的特征条件,构建突发词识别模型对促进科研人员精确把握研究方向具有重要意义。[方法/过程] 获取各年度内关键词及词频,构建关键词-年度矩阵,将分析时间段划分为标准窗口、观察窗口和表现窗口,在观察窗口内利用多测度突发词探测模型识别具有突发特征的关键词;在表现窗口内利用LDA挖掘主题词汇作为热点词集合。设计突发词覆盖率指标,辅助滑动时间窗口法,计算不同时间窗口内突发词集合和热点词集合的覆盖率,验证模型识别准确性。[结果/结论] 3次滑动时间窗口,计算得到3次突发词覆盖率都在70%以上;与Citespace突发词的对照试验中,本模型3次覆盖率均大于前者,表明设计的突发词探测模型性能良好。  相似文献   

13.
[目的/意义]突破性创新对科技发展具有关键作用。大数据环境下,科学技术发展本身所具有的复杂、多维、不断进化等特征越发凸显。以动态视角进行突破性创新主题识别,对于为国家、企业及高校详析突破性创新领域、合理配置创新资源以及提供创新升级解决方案具有重要意义。[方法/过程]综合运用主题模型、词嵌入算法以及复杂网络分析等方法构建动态主题网络,全面考量主题在时间窗口内的结构特性以及时间窗口间的演化状态,并以其为基础结合突破性创新的新颖性、突变性、影响力和学科交叉性特征识别突破性创新主题。[结果/结论]面向区块链领域展开实证研究,识别出神经网络(Neural Network)和边缘计算(Edge Computing)两个主题的突破性创新特征最为显著。结合区块链现有研究及美国国家科学技术委员会发布的关键和新兴技术清单,验证了本文方法的可行性和有效性。但有关结果的定量验证,以及融合多源数据的突破性创新主题识别有待进一步研究。  相似文献   

14.
[目的/意义] 概率主题模型算法在不断得到改进与扩展,本文对国内外已有的利用引文构建的主题模型进行研究,分析和对比不同模型的生成过程与算法,并探讨利用引文构建的主题模型在科技文本分析中的应用与可扩展的研究方向。[方法/过程] 通过Web of Science数据库和CNKI数据库获取国内外利用引文构建主题模型的相关文献,经人工判读后筛选出具有代表性的文献,对这些文献中利用引文构建的主题模型,从建模思想、生成过程、参数估计与推断算法等方面进行对比与分析。[结果/结论] 目前国内外利用引文构建的主题模型主要包括研究主题与引文分布的主题模型、研究被引与施引主题间关系的主题模型,以及基于引用内容的引用主题模型;主题模型中引入引文信息后,能够获得更完整的主题内容和特定主题下的重要文献,并可识别施引文献和被引文献之间主题间的关系及影响;已有的模型多集中在概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)和潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型基础上进行扩展。未来可扩展研究引入引用内容的主题模型、模型的性能优化和评价方法、模型的应用研究等。  相似文献   

15.
2020年初COVID-19的突发对社会生产生活造成巨大挑战,也对政府治理能力提出重大考验。疫情期间的公众舆论在充分反映民众诉求的同时,也对政府治理起到重要的推动作用。现有关于疫情期间公众舆论的研究成果,大多从舆论的价值角度分析,缺少更深层次对民众诉求的挖掘。文章基于人民网《领导留言板》数据对新冠疫情期间民众对政府的诉求进行分析,通过隐含狄利克雷分布主题模型对民众诉求的主题进行挖掘,并分析各类主题的时空演变特征,以及演变特征与防疫政策的关联。研究发现,疫情期间民众诉求的主题可以归纳为5类:社区管理、医疗防疫、学校教育、交通物流和经济措施,不同主题的热度在时间和空间上具有明显差异,这种差异与疫情发展有关,也与不同时间发布的防疫政策相关。对民众诉求主题及其与政府政策关系的研究,可为政府部门今后应对重大公共卫生事件提供借鉴。  相似文献   

16.
[目的/意义]随着信息资源在数量和种类上的急剧增长,学科间的交叉融合不断涌现,快速主动地从海量信息资源中识别和判断研究主题的发展演化是实现科技创新的基础。[方法/过程]在相关理论调研的基础上,结合医学领域的资源特点,提出一种基于LDA模型的主题演化探测模型和相应的流程步骤。主要步骤包括医学主题词抽取、主题识别、主题关联、关键主题识别、关键主题的演化主路径识别、演化主路径上主题分裂、融合事件识别,实现深度、细致的主题演化分析。[结果/结论]选用乳腺癌治疗研究文献为实验案例,对判断模型进行试验并对结果进行分析验证,证实提出的技术方法具有一定的可靠性。  相似文献   

17.
在海量数据背景下,针对社交网站中队成员关系、话题热度及内涵的价值倾向等评价问题,提出一个基于LDA的两阶段社交网站自动量化评价模型。首先通过LDA方法将文本内容映射到主题空间,依据文本所属主题和用户特征来剔除垃圾信息;对于筛选出的信息,从用户、话题和社区三个角度提出一个新的社交网站的量化分析方法。最后,通过对西祠胡同的实验分析验证该模型的有效性和可行性。  相似文献   

18.
[目的 /意义]重大突发事件网络舆情在传播过程中往往会出现不同的主题,而微博用户对不同主题的表达和关注也会直接影响网络舆情的传播速度和规模以及舆情事件的走向。针对重大突发事件的微博用户主题演化分析有助于应急管理部门更好地理解重大突发事件的发展轨迹以及公众在不同阶段的关注点,以便采取有效应对措施。[方法 /过程]以网络舆情信息特征为立足点,辅以自然语言处理技术将舆情信息客体与本体进行剥离,结合重大突发事件特征,创新性提出以舆情客体信息为参照基线的舆情本体演化强度来反映微博主题演化趋势。[结果 /结论 ]研究结果表明,面向网络舆情信息本体的主题分析,与网络舆情实际发展演化趋势更加贴近,对主题内容的揭示也更加全面。同时研究思路也对现有网络舆情主题分析的研究方法中单一求助于自然语言处理技术的优化与更新具有一定启示意义。  相似文献   

19.
王平 《图书情报工作》2014,58(22):70-77
自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用.针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型hLDA,采用Gibbs抽样来进行模型参数估计,并运用互信息的方法对主题词进行筛选,以提取高质量的主题词.最后,利用先/后离散分析方法研究主题随时间的演化问题.实验结果验证了主题发现及演化方法的可行性及有效性.  相似文献   

20.
文章从数值和内容两个层面提出了中国科学家国际合作趋势分析方法,以中国科学家作为重点研究对象,以Web of Science为数据来源,首先借助社会网络分析,绘制国家合作网络,凸显中国科学家密切合作的国家,并构建研究贡献度计算公式,从数值层面展现中国科学家在国际合作中的研究贡献发展态势。在此基础上,使用LDA模型提取不同阶段的研究主题,并通过绘制主题演化路径图谱,从内容层面展示中国科学家参与国际合作研究的主题特征变化。最后,以公共卫生领域为例进行方法实证。结果表明,中国科学家在公共卫生领域合作的国家数量、发文期刊质量、研究贡献度方面都呈逐年递增态势;主题研究方面,主题演化呈持续研究、新兴研究和消失研究三种类型,体现了中国科学家在公共卫生领域的地位不断增强,也验证了文章所提方法对其他领域的分析具有普适性和参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号