首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 625 毫秒
1.
基于共词分析的学科主题动态跟踪相似算法改进研究   总被引:1,自引:0,他引:1  
针对现有三种基于共词分析的学科主题动态跟踪相似算法都存在不能深入分析主题演化细微关系的缺陷,以Coulter的相似指数为基础对现有相似算法进行改进研究,并对改进相似算法中涉及的相关问题进行了阐释.  相似文献   

2.
[研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题的实体相似度,再取文本词向量与话题中心余弦相似度的最大值作为词向量相似度,二者结合判断文本所属话题。在聚类过程中利用时间窗口策略实现话题中心和成员文本的动态更新。同时,计算文本词熵,生成话题的词熵和列表,实现话题主题词提取和演化跟踪。实验以新冠疫情新闻为数据实现话题在线检测,并展示了话题主题词的演化和跟踪过程。[研究结论]实验表明,与传统相似度计算方法相比,组合相似度能够获得更好的聚类效果,聚类过程中提取出的话题主题词也正确地反映了原始数据的热点话题内容。  相似文献   

3.
本文利用CNKI数据库通过词频分析法结合共词分析法对2005-2016年我国"科学数据"领域的研究主题进行演化分析。选取2005-2016年"科学数据"领域发表于北大中文核心期刊和CSSCI来源期刊的547篇期刊论文作为数据来源,通过对数似然值结合相对变化率判断关键词词频的相对增长、平稳和下降趋势,识别不同研究时段"科学数据"领域的核心词、突变词和新生词,并结合共词分析法揭示"科学数据"领域相关文献研究主题的动态演化趋势。研究结果表明:2005-2016年我国"科学数据"领域的相关研究从以技术层面的研究主题为主逐渐过渡到管理层面、服务层面和政策层面的研究主题,图书情报领域已逐渐成为我国"科学数据"相关研究的主要学科领域。  相似文献   

4.
【目的/意义】共词分析法是文献情报分析的重要方法,对促进学科领域等的研究和发展具有重要作用。针 对共词分析法中存在的文献层面和词层面“同量不同质”问题、高频孤立词问题等,提出一种基于文献多属性加权 的共词分析方法。【方法/过程】该方法利用文献发表时间、被引次数和下载量等属性来度量文献时效性和被关注 度,以表征文献层面的权重;利用文献标题和摘要等属性对文献关键词的差异性进行度量;综合文献权重和词差异 性权重对共词分析词频次及共词对频次进行加权处理,然后依据二者加权后的频次确定共词分析用词集合及构建 共词矩阵。【结果/结论】以CNKI数据库有关主题模型研究的核心期刊论文为数据源,对该领域的研究主题热点进 行分析,从共词分析用词选择和聚类分析等方面与一般共词分析法进行对比,验证了本文所提加权方法具有一定 的合理性和有效性。  相似文献   

5.
总结了基于信息熵方法、基于词频分析方法、基于突发词共词分析方法、引文分析方法等4种主题演化分析方法的研究现状,并分析目前主题演化研究中存在的问题。  相似文献   

6.
揭示学科的演化规律一直是人们关注的焦点,以管理科学为研究对象,通过分析国家自然科学基金资助项目的文献,研究管理科学领域的研究前沿主题及其演化趋势。基于层次Dirichlet过程模型和主题相似度映射算法,分析研究前沿主题的时序演化,绘制学科知识演化图谱。该研究对于发现科学的前沿和新生长点,完善学科演化分析方法和情报分析方法具有重要意义,为制定科技政策、推动科研创新等提供重要参考。  相似文献   

7.
[研究目的]新兴领域由于发展时间不长,相关研究的文本量不够充足,先切分文本后关联主题的演化方法可能会导致各时间窗主题重复等问题,因此提出一种先整体识别热点,后切片分析演化的方法,解决新兴领域演化分析中文本量不足的问题。[研究方法]以制氢领域的核心中文期刊文献为数据源,通过构建指标体系先对整体语料库进行热点主题识别,再进行时间切片。对每个时间窗口的文本进行LDA主题抽取,并利用Word2Vec训练词向量,通过相似度计算进行热点主题的子话题关联及其主路径的词汇关联,从而分析各热点主题的结构演化和内容演化。[研究结论]绘制了各热点主题的结构演化图,并以热点主题光催化剂性能及其制备为例,揭示了其在各时间窗内的热点转移关系;同时绘制了其内容演化图,揭示了其各时间窗内的研究重点。实现了演化研究方面的精细化表达,为文本量不够充足的新兴领域演化分析提供了有效可行的思路。  相似文献   

8.
网络热点话题检测与跟踪已成为舆情分析领域的前沿研究课题,具有广阔应用前景。本文研究基于主题演化图的网络论坛(BBS)热点跟踪问题。在采用共词分析和bisecting K-means聚类算法检测BBS热点话题基础上,提出了一个综合考虑话题帖子篇数与帖子热度的热点话题关注度计算方法。然后给出了一个基于相对熵的热点话题语义距离计算方法。最后通过构造主题演化图实现BBS热点话题的自动跟踪。在由实际BBS论坛数据构成的测试集上的实验表明,本文提出的方法是有效的。  相似文献   

9.
基于共词分析的学科主题演化方法改进研究   总被引:2,自引:0,他引:2  
学科主题演化是情报分析人员采用一定的信息技术方法观察主题在时间维度上的发展、变化趋势以及不同主题之间的交互作用,它已成为情报研究的一项重要内容。基于词频或共现词频的共词分析方法难以反映主题词对间更层次的语义关系,针对这一情况,提出一种改进的共词分析方法,该方法体现主题词、主题和文档间的层次语义关系,以更微观、精确的语义层面展现主题演化过程。  相似文献   

10.
一种基于关键词加权的共词分析方法   总被引:1,自引:0,他引:1  
基于关键词的共词分析是文献计量中常见的一种研究方法,该方法是利用论文关键词在文献数据库中成对出现的统计学特征来分析关键词之间的亲疏关系,从而揭示这些关键词所代表的主题之间的关联结构。本文分析了传统的关键词共词分析法中存在的忽视关键词之间的重要性问题,探讨了其中基于关键词加权的合理性和必要性。本文还提出了一种基于关键词加权的共词分析方法,通过在关键词词频统计和词对相似度计算两个步骤中使用的改进的加权算法,从而实现了基于关键词重要性的加权。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号