首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
[目的/意义]随着信息资源在数量和种类上的急剧增长,学科间的交叉融合不断涌现,快速主动地从海量信息资源中识别和判断研究主题的发展演化是实现科技创新的基础。[方法/过程]在相关理论调研的基础上,结合医学领域的资源特点,提出一种基于LDA模型的主题演化探测模型和相应的流程步骤。主要步骤包括医学主题词抽取、主题识别、主题关联、关键主题识别、关键主题的演化主路径识别、演化主路径上主题分裂、融合事件识别,实现深度、细致的主题演化分析。[结果/结论]选用乳腺癌治疗研究文献为实验案例,对判断模型进行试验并对结果进行分析验证,证实提出的技术方法具有一定的可靠性。  相似文献   

2.
[目的/意义]主题演化对科技前沿探测、创新战略部署具有十分重要的作用。[方法/过程]将主题演化分析过程分解为主题的表示、相似性关联和强度演化计算几个步骤,提出一种主题强度演化与预测模型,使用LDA模型进行主题的表示,提出内容、共现和趋势相似度等维度进行主题关联计算,引入基于Prophet的预测-修正模型进行主题演化趋势预测。并以干细胞领域为例,进行演化的实证分析。[结果/结论]实验表明,对每个研究主题采用Logistic增长模型进行预测R2Score都达到0.90以上,表明Prophet的Logistic增长模型与该领域主题增长趋势规律相符合,能够较好地拟合主题强度的演化趋势。提出的主题演化模型对专业领域内主题分布与演化分析有一定的借鉴意义。  相似文献   

3.
王平 《图书情报工作》2014,58(22):70-77
自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用.针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型hLDA,采用Gibbs抽样来进行模型参数估计,并运用互信息的方法对主题词进行筛选,以提取高质量的主题词.最后,利用先/后离散分析方法研究主题随时间的演化问题.实验结果验证了主题发现及演化方法的可行性及有效性.  相似文献   

4.
祝娜  王芳 《图书情报工作》2016,60(5):101-109
[目的/意义]科技创新需要快速发现特定科技领域中关键知识衍生与演化的路径,探索未来的知识创新趋势,为此,有必要对知识演化路径进行动态可视化研究。[方法/过程]从主题关联的角度入手,以3D打印领域为例,基于LDA识别出科技创新主题并进行分阶段细化分析,探测主题集群内部与外部的关联强度,识别出主题不同生命周期的演化能力及其演化类型。[结果/结论]实验结果表明,该方法从主题关联的角度入手,构建了基于时间序列的知识演化路径,丰富了知识管理和信息计量的理论研究方法,在实践上则有助于探测科技创新知识。  相似文献   

5.
[目的/意义]为全面、客观、高效、直观地掌握科技领域主题的发展规律和演变趋势,提出一种基于多源数据的领域主题演化路径识别和分析框架。[方法/过程]获取不同来源的科技文献数据,利用多维样本有序聚类方法辅助时间切片,基于改进的词袋构建方法,提升LDA模型主题识别效果,借助Louvain社区发现算法在主题层进行多源数据的融合,分析领域主题演化路径。[结果/结论]利用美国太赫兹研究领域基金项目、论文和专利3种来源的数据进行实证研究,结果表明,3种数据源能够清晰划分出4个时间窗口,改进的词袋构建方法能够表征更准确的领域信息内涵,主题社区有助于从多源数据复杂的演化网络中厘清主题演化脉络。  相似文献   

6.
[目的/意义] 基于主题关联相似度揭示主题汇聚及变异过程,识别学科交叉主题及交叉模式,归纳学科主题的演化趋势及演化路径模式。[方法/过程] 获取情报学学科科研论文的高频主题词,构造主题词共词矩阵,利用网络社区演化分析工具生成学科主题演化网络图,结合指标数据对学科主题演化过程进行分析。[结果/结论] 总体上看,情报学学科的研究主题虽然在反复地变化,但核心主题一直存在;扩张、收缩和合并是研究主题最普遍的变化态势,分裂现象较少,产生和消亡现象存在;有3条特定社区演化轨迹清晰地贯穿始终,活跃度相对稳定,反映了3类核心研究主题;3类核心研究主题的演化路径呈现出升华吸纳、共融迭新和辐射推进3种演化模式。研究结果显示,基于主题关联学科主题演化路径的多模式识别方法既能从宏观层面呈现学科主题演化形式,也能从微观层面分析学科主题交叉模式,结合二者可揭示学科主题的继承或创新,预测学科交叉主题的发展方向。  相似文献   

7.
[目的/意义]从主题时序视角出发,以中国图书馆学会年会主题和年会论文集题录为研究样本,进行相关主题词的分布和演化分析,梳理中国图书馆界近十年来理论与实践发展脉络。[方法/过程]获取2007-2017年间中国图书馆学会年会的相关主题词,从中选择高频词,利用Excel构造主题词共词矩阵,利用Ucinet和SPSS工具进行主题词静态分布分析,结合"流行研究热点权值(PRHW)"指标对主题词进行动态演化分析。通过词频、中心性、聚类对比分析相关主题词的静态分布特征;通过词频时序和共词时序分析主题词的动态演化特征,并采用PRHW指标进行识别和演绎;从7个类团中抽取两个典型主题词构筑全主题词的共词时序网络。[结果/结论]相关主题词的静态分布特征表现为:年会主题词和论文集主题词高频词一致性较好,论文主题词更微观具体;二者都不具备显著的中心性;聚类结果根据相近原则归并出7个具体类团。主题词的动态演化特征表现为:分长期关注、早期关注、近来关注上升和近来关注下降四类,相关主题的微观演化特征得到了精细化呈现。  相似文献   

8.
学科领域生命周期中作者研究兴趣演化分析   总被引:4,自引:3,他引:1  
关鹏  王曰芬 《图书情报工作》2016,60(19):116-124
[目的/意义]为揭示作者研究兴趣的演化特征,结合生命周期理论和Author-Topic(AT)主题模型提出作者研究兴趣演化分析框架。[方法/过程]收集CNKI数据库中锂离子电池领域的期刊论文数据,通过文献信息增长规律对学科生命周期发展阶段进行划分,利用AT主题模型抽取分析作者-主题、主题-词项以及文档-主题概率分布,通过追踪学科领域生命周期中主题强度和作者研究兴趣度的变化趋势进行演化分析。[结果/结论]实证研究选择核心作者作为分析对象,结果显示国内锂离子电池领域的核心作者的研究兴趣度普遍在成长期达到最大值,对学科发展起到促进作用。核心作者的研究兴趣演化趋势与相应的主题演化趋势一致时,能够引领该研究主题的发展。但也存在一些研究主题,其演化趋势并不同于核心作者的研究兴趣演化趋势,这部分主题往往强度值较大,涉及的研究方向比较广。  相似文献   

9.
[目的/意义] 由于传统科技创新主题概率识别方法忽略文本内容语义理解,为了更加准确地识别出主题,科技创新主题语义识别势在必行。[方法/过程] 提出一种基于LDA的科技创新主题语义识别方法,利用语义角色标注技术对科技文献中的科技创新内容进行语义标引,构建LDA主题语义识别模型,根据表征科技创新内容的关键词语义角色对应的上位词的概率识别出科技创新主题。[结果/结论] 通过以3D打印领域数据为对象进行实验,证明该方法能够更加准确地识别出科技创新主题,形成科技创新主题-主题词-科技文献的混合分布聚类集群,减少研究背景等无关数据干扰,避免语义含义相同的科技创新主题词重复统计问题。  相似文献   

10.
[目的/意义]分析中国国内基于主题模型的科技文献主题发现及演化研究进展,以期为相关研究人员提供参考借鉴及研究思路。[方法/过程]选取中国知网(CNKI)数据库及万方数据知识服务平台作为文献来源,检索并筛选相关文献,通过人工判读提炼出基于主题模型的科技文献主题发现及演化研究的分析流程,并采用文献分析法对流程中国内研究人员所使用到的策略、方法、分析手段等进行归纳和总结。[结果/结论]研究已初具规模,形成较为完整的分析流程,同时各个流程环节上所涉及到的策略、方法和分析手段较为多样化。另外,也存在着一些问题:主题模型方法在科技文献领域的应用尚且不成熟,主题数目固定,缺少对主题模型应用效果的评价方法与准则。  相似文献   

11.
��[Purpose/significance] The identification results of the LDA model is sometimes unsatisfactory due to some meaningless topics mixed together. Therefore, it's quite necessary to establish an effective topic filtering method to eliminate these noise topics and to ensure the accuracy of subsequent evolution analysis.[Method/process] Based on the co-occurrence relationship between keywords, keywords relevance index (KRI) was constructed. Taking the field of single cell research as an example, KRI values of the distribution of theme-keywords were calculated and compared with the results of manual interpretation.[Result/conclusion] Experimental results show that this method can effectively eliminate meaningless noise topics in the LDA model recognition results, which can improve the accuracy of topic recognition and the subsequent topic evolution analysis. It also helps to reduce the dependence on manual interpretation in the process of topic identification through the topic model method.  相似文献   

12.
[目的/意义] 针对当前非正式信息交流主题演化研究在分析层次和测度指标两方面存在的局限,提出一种具有通用性的演化分析方法,从微观和中观层面探究主题演化特征与规律。[方法/过程] 引入会话分析理论,以新浪微博和知乎为例,通过对主题和主题簇运行过程进行分析,从会话内容和讨论方式两个维度揭示非正式信息交流演化特征与规律。同时,设计主题持续性计算判定方法,丰富主题演化的衡量标准。[结果/结论] 主题演化分析结果显示新浪微博和知乎意见群体的发文主题存在明显偏重,且表明了意见群体参与社会焦点事件讨论中观点的主要切入角度;主题簇演化分析发现了新浪微博意见群体在一定范围内发散探索多元主题、知乎意见群体始终关注聚焦核心主题的讨论特点。两个社交媒体中意见群体在会话内容和讨论方式方面的区别,喻示了新浪微博和知乎在网络环境的非正式信息交流中主要承担的角色差异。  相似文献   

13.
��[Purpose/significance] This paper proposes the identification of the core research topics and their evolution path visualization methods, in order to provide reference for the field subject evolution analysis research, which has certain significance for revealing the evolution characteristics and development laws of the core topics.[Method/process] Using the LDA model for topic recognition and combining multi-dimensional scaling analysis and visualization techniques to map LDA topic recognition results to two-dimensional space. The topic similarity algorithm was used to detect the association between adjacent time topics, a new visual display method was proposed. We constructed cross-evolution paths of different types of research topics to reveal the dynamic changes of core topics and secondary topics in the evolution process.[Result/conclusion] Taking the medical health information field in China as an example, the research results show that the core research topics in the field of medical and health information in China mainly include electronic health records and Internet medical treatment. Among them, core themes such as health management and smart medical treatment show a good development trend.  相似文献   

14.
[目的/意义]学术文献影响力评价指标不断推陈出新,但尚缺乏在研究主题层面对文献影响力的评价,为发现不同研究主题内具有高影响力和引用价值的文献,本研究给出一种基于研究主题的文献影响力评价方法。[方法/过程]以Web of Science数据库中2011年-2015年间情报学领域500篇高被引文献为样本,利用LDA模型对样本文献进行主题建模,将主题对文献的支持度与文献被引频次相结合,计算特定主题文献的被引频次(specific topic cited frequency,简称STCF),并根据每篇文献在相应主题内的STCF值对文献进行影响力排序。[结果/结论]结果表明,STCF值能反映文献的主题内容、细粒度体现文献的学术地位、呈现文献研究主题的多元性,能够有效弥补被引频次、Altmetrics指标的不足。  相似文献   

15.
[目的/意义]分析与研究科学文献传播网络发展趋势,为揭示科研新成果、把握科技发展脉络以及发现学科领域内前沿发展动态提供参考借鉴。[方法/过程]阐述知识进化理论及其应用,探讨知识进化视角下的科学文献传播网络预测方法可行性,通过对科学文献传播网络的演化机制分析,构建科学文献传播网络预测模型,并以科学文献关键词网络进行实证分析。[结果/结论]通过科学文献数据实证分析表明,提出的知识进化视角下科学文献传播网络演化与趋势预测方法具有可行性和有效性,可以为科学文献传播网络的趋势发展分析提供新的研究思路。  相似文献   

16.
[目的/意义] 作者合作是科学计量领域的重要研究内容,从作者研究兴趣视角出发研究作者在选择合作伙伴时关于研究兴趣相似性的倾向差异具有重要理论意义。[方法/过程] 在对合著情形进行分析和划分基础上,通过计算合著作者研究兴趣相似性,对不同学科、不同产量的合著作者研究兴趣频率分布模式进行可视化。[结果/结论] 研究结果发现,合著氛围迥异的学科合著作者研究兴趣相似性分布趋于相同,高产作者往往寻找研究兴趣较为相似的作者进行合著。  相似文献   

17.
[目的/意义]共享住宿与酒店预定平台可能同时存在替代性和互补性,但这种替代性和互补性分别体现在哪些产品和服务上当前文献还缺乏探讨,需要进一步开展跨平台的比较研究。[方法/过程]选取携程酒店预定平台和小猪短租平台为实验对象,采集北京市相关房源的86635条用户评论文本,结合LDA模型、主题社会网络和主题情感分析方法对用户文本评论进行跨平台比较分析。[结果/结论]研究发现两大平台用户在评论主题、主题社会网络和主题情感上的异同之处,从微观用户评论角度解释了两大平台在产品和服务上的替代性和互补性。本文结果为平台管理者进行住宿产品和服务的开发和改进提供重要的实践借鉴。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号