首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
基于动态LDA主题模型的内容主题挖掘与演化   总被引:1,自引:0,他引:1  
指出文本内容主题的挖掘和演化研究对于文本建模和分类及推荐效果提升具有重要作用。从分析基于LDA主题模型的文本内容主题挖掘原理入手,针对当前网络环境下的文本内容特点,构建适用于动态文内容本主题挖掘的LDA模型,并通过改进的Gibbs抽样估计提高主题挖掘的准确性,进而从主题相似度和强度两个方面研究内容主题随时间的演化问题。实验表明,所提方法可行且有效,对后续有关文本语义建模和分类研究等具有重要的实践意义。  相似文献   

2.
张培晶  宋蕾 《图书情报工作》2012,56(24):120-126
在介绍概率主题模型发展过程以及概率主题模型的代表性模型LDA基本原理的基础上,分析LDA模型的特征及其用于微博类网络文本挖掘的优势;介绍和评述微博环境下现有的基于LDA模型的文本主题建模方法,并对其扩展方式和建模效果进行总结和比较;最后对微博文本主题建模的发展方向进行展望。  相似文献   

3.
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Allocation)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。  相似文献   

4.
[目的/意义]主题演化对科技前沿探测、创新战略部署具有十分重要的作用。[方法/过程]将主题演化分析过程分解为主题的表示、相似性关联和强度演化计算几个步骤,提出一种主题强度演化与预测模型,使用LDA模型进行主题的表示,提出内容、共现和趋势相似度等维度进行主题关联计算,引入基于Prophet的预测-修正模型进行主题演化趋势预测。并以干细胞领域为例,进行演化的实证分析。[结果/结论]实验表明,对每个研究主题采用Logistic增长模型进行预测R2Score都达到0.90以上,表明Prophet的Logistic增长模型与该领域主题增长趋势规律相符合,能够较好地拟合主题强度的演化趋势。提出的主题演化模型对专业领域内主题分布与演化分析有一定的借鉴意义。  相似文献   

5.
孙国超  徐硕  乔晓东 《情报工程》2016,2(4):020-029
随着科研人员需要处理的文献集规模的日益庞大,以LDA 为代表的主题模型能够从语义层面挖掘大规模文献集中隐含的主题,因此,LDA 主题模型的应用越来越广泛。LDA 模型仅仅关注文献集的内容,而忽略了文献其他重要的外部信息,AToT 模型在LDA 主题模型的基础上引入了文献作者和文献发表时间两个属性,使AToT 模型不仅可以挖掘文献中隐含的信息,还可以分析文献作者的研究兴趣及文献主题随时间的变化。AToT 模型对文献集建模的结果是以概率矩阵的形式呈现,不能直观、全面、清晰的呈现挖掘出来的信息,特别是对数据挖掘不熟悉的科研人员,因此,本文开发了一个基于AToT 模型的可视化系统,该可视化系统清晰、美观地展现了AToT 模型中文献、主题、作者、时间、词项间的关系。如文档中的主题分布、主题的词项分布、作者的研究兴趣分布、主题的相似主题和主题的演化趋势等。  相似文献   

6.
[目的/意义]基于健康码的社会治理模式引发了不少社会治理问题。为了帮助健康码设计者和相关政府部门了解基于健康码的社会治理模式存在的实际问题以及用户对于该社会治理模式的迫切需求,并且为今后健康码的优化以及其他以数据为基础的社会治理模式提供参考,本文针对健康码的相关社会治理问题展开了研究。[方法/过程]本文选取新浪微博平台为实验对象,通过采集新浪微博上有关健康码话题的文本数据,利用利益相关者理论、基于聚集策略的LDA模型对微博数据进行了利益相关者划分和健康码主题建模。[结果/结论]本文借鉴利益相关者理论识别划分了8类利益相关者群体,同时采用基于聚集策略的LDA模型对不同类型的利益相关者的微博推文进行主题建模,总结出4类基于健康码的社会治理问题,并挖掘了不同利益相关者对基于健康码的社会治理关注差异及其随时间的变化趋势,针对重点问题提出一些健康码优化的对策建议。  相似文献   

7.
[目的 /意义]重大突发事件网络舆情在传播过程中往往会出现不同的主题,而微博用户对不同主题的表达和关注也会直接影响网络舆情的传播速度和规模以及舆情事件的走向。针对重大突发事件的微博用户主题演化分析有助于应急管理部门更好地理解重大突发事件的发展轨迹以及公众在不同阶段的关注点,以便采取有效应对措施。[方法 /过程]以网络舆情信息特征为立足点,辅以自然语言处理技术将舆情信息客体与本体进行剥离,结合重大突发事件特征,创新性提出以舆情客体信息为参照基线的舆情本体演化强度来反映微博主题演化趋势。[结果 /结论 ]研究结果表明,面向网络舆情信息本体的主题分析,与网络舆情实际发展演化趋势更加贴近,对主题内容的揭示也更加全面。同时研究思路也对现有网络舆情主题分析的研究方法中单一求助于自然语言处理技术的优化与更新具有一定启示意义。  相似文献   

8.
融合主题与情感特征的突发事件微博舆情演化分析   总被引:1,自引:0,他引:1  
安璐  吴林 《图书情报工作》2017,61(15):120-129
[目的/意义]微博是突发事件网络舆情传播的重要媒介。面向突发事件的微博主题和情感挖掘对掌握突发事件的网络舆情、识别与预测潜在问题及风险等方面具有重要的实践意义。尝试提出一种融合主题与情感特征的突发事件微博舆情演化分析方法。[方法/过程]以寨卡事件为例,通过划分微博舆情演化的生命周期,基于word2vec技术分别提取该事件生命周期各阶段的微博主题,采用基于词典的情感分析方法,引入情感词、表情符号等多情绪源,对不同主题下的评论情感做细粒度划分,并计算情感强度,最终实现微博主题与情感的协同分析。[结果/结论]所提出的微博舆情演化分析方法能够揭示面向特定事件的微博在突发事件生命周期各阶段的主题特征、情感类型与强度,剖析网络舆情主题与情感特征的协同演化规律。  相似文献   

9.
为研究社会公众对档案的关注度和认同度,分析档案社交媒体形象,论文采集新浪微博的档案主题文本,通过高频词分析、LDA主题聚类和情感分析,揭示档案主题内容和用户情感倾向.研究结果表明:社会公众对档案的关注度较高,档案价值主体不断扩展;多数档案主题微博具有积极情感,社会公众对档案的认同度较高;少数档案主题微博具有消极情感,档案社交媒体形象有待优化.  相似文献   

10.
祝娜  王芳 《图书情报工作》2016,60(5):101-109
[目的/意义]科技创新需要快速发现特定科技领域中关键知识衍生与演化的路径,探索未来的知识创新趋势,为此,有必要对知识演化路径进行动态可视化研究。[方法/过程]从主题关联的角度入手,以3D打印领域为例,基于LDA识别出科技创新主题并进行分阶段细化分析,探测主题集群内部与外部的关联强度,识别出主题不同生命周期的演化能力及其演化类型。[结果/结论]实验结果表明,该方法从主题关联的角度入手,构建了基于时间序列的知识演化路径,丰富了知识管理和信息计量的理论研究方法,在实践上则有助于探测科技创新知识。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号