首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 337 毫秒
1.
[目的/意义] 提出3种主题演化模式:主题全局演化、主题团簇演化和主题协同演化,以期梳理学科知识结构的演化模式,进一步丰富揭示学科知识结构的研究范式。[方法/过程] 以Web of Science中2001-2015年间图书情报学领域的核心期刊文献数据为研究对象,以"计量学"为研究主题,基于时序分析、主题-关键词共现分析构建2-模网络,利用NetDraw对各主题演化模式进行可视化呈现。[结果/结论] 通过深入比较3种演化模式得出:主题全局演化可以直观、系统把握学科的历史轨迹和研究路径;以"团簇状"为子网络单元的主题团簇演化模式,可以更为细粒度、挖掘深度更高、更全面系统、真实具体地仿真主题演化;而主题协同演化,结合全局演化和团簇演化的优势,能以"联系与发展"的视角揭示主题在演化过程中彼此之间的关联程度及其融合与独立趋势。  相似文献   

2.
微博主题的演化分析会帮助用户快速准确地理解主题脉络结构、跟踪主题发展情况,并根据主题演化做出相应的预测.本文对概率主题模型LDA (Latent Dirichlet Allocation)进行了扩展,使其适合中文微博短文本的处理,并利用LDA建模结果对微博主题进行演化分析.为了体现不同时间片中主题演化的动态性,本文在使用LDA建模之前首先对每个时间片内最优主题数目进行确定,再通过LDA主题抽取结果,追踪不同时间片内主题的变化趋势,实现主题在内容和强度两个方面的演化分析.通过在真实微博语料库上进行实验,结果表明该方法不但可以较好地分析出同一微博主题随时间的强度演化规律,还可以描述主题内容的演化趋势.  相似文献   

3.
王平 《图书情报工作》2014,58(22):70-77
自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用.针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型hLDA,采用Gibbs抽样来进行模型参数估计,并运用互信息的方法对主题词进行筛选,以提取高质量的主题词.最后,利用先/后离散分析方法研究主题随时间的演化问题.实验结果验证了主题发现及演化方法的可行性及有效性.  相似文献   

4.
使用基于《中图法》知识库的中文信息自动标引和自动分类系统,对中文图书进行自动标引与自动分类的实验,以测试该系统对图书的适用性。实验通过对中文图书进行计算机自动标引与自动分类、人工打分测评、测试结果统计分析,得出中文图书的各标引源主题表达能力依次为:书名、内容提要、两级目次、参考文献、一级目次,在此基础上对标引源进行加权设计,权值设为5:3:2:2。实验证明该系统用于中文图书的自动标引与自动分类是可行的。表6。参考文献9。  相似文献   

5.
一种基于共词网络社区的科研主题演化分析框架   总被引:3,自引:0,他引:3  
共词网络在一定程度上可以表示特定学科领域的知识结构。为分析主题演化过程,将网络社区的演化分为6种类型,分别为产生、消亡、分裂、合并、扩张与收缩。在此基础上,利用Z-value算法和社区相似度算法,构建一个科研主题演化分析模型。与传统的基于词频的分析思路相比,所提出的基于共词网络社区演化分析的框架不强调词频的变化,而是强调词间关系的变化,试图通过中观层面的网络社区的演化分析揭示科研主题发展规律。  相似文献   

6.
基于概率图模型的科研文献主题演化研究   总被引:3,自引:2,他引:1  
学术文献的主题分析对于研究者进行思路整理及发现研究主题非常重要.通过进一步的分析,能够理解主题如何发展变化,以及如何影响研究者的行为等等.探索了基于概率图模型的科研文献主题演化问题,特别分析了主题随时间的相互影响问题,提出了基于模块化网络的方法研究主题之间的相互关系,从而理解其相互影响.首先,利用主题模型获取时间文本的主题及其强度曲线,然后利用时间序列的逐段线性表示方法去除序列中的噪音,从而有效反映趋势信息,使得利用模块化网络能够更加准确地反映主题的影响关系,实验结果及其相关分析证明了方法的有效性.  相似文献   

7.
基于共词分析的主题类型划分方法比较研究   总被引:2,自引:0,他引:2  
主题类型划分是主题演化分析的重要环节.本文从学科主题演化概述入手,介绍了主题类型划分原理,研究了DT法中主题类型划分方法、社会网络分析法和关联强度算法三种主题类型划分方法,通过比较分析得出只有关联强度算法能很好地体现主题网络中核心主题和次要主题的本质特征.  相似文献   

8.
中文OA期刊影响力调查分析   总被引:1,自引:0,他引:1  
OA期刊是基于网络方式下开放获取出版模式的期刊。近几年我国的中文OA期刊得到了长足的发展,本文为了调研中文OA期刊的发展状况,通过获取大量的实际数据,从中文OA期刊的学术影响力和网络影响力两个方面对中文OA期刊的影响力进行分析评价。  相似文献   

9.
基于语义联想的中文图像搜索引擎——构想与实验*   总被引:5,自引:1,他引:4  
在分析了目前主流中文图像搜索引擎研究和开发的优点和缺点基础上,结合实际开发经验,提出一个基于语义联想的中文图像搜索引擎的构想。在图像内容信息表示上充分利用相关的文本信息。系统通过分析用户的检索行为记录,自动发现词间关系,并用知识库的方式来组织和存储图像信息,达到语义联想的功能。  相似文献   

10.
主题检索一直是信息检索系统也是信息检索研究的重点,但文献的非主题特征的研究与利用没有受到足够的重视.文献的非主题特征指与文献相关,但与其主题内容或语义没有直接或必然联系的特征.笔者尝试较系统地归纳文献的非主题特征,并基于信息需求研究、信息查找与利用行为研究的有关理论,分析非主题特征对于信息检索理论与实践的意义,并通过基于非主题特征的网络中文学术文献识别系统(NSIRS)的设计与评价,验证其可行性与效果,分析了当前一些信息检索系统的非主题检索功能与特色.  相似文献   

11.
梁爽  刘小平 《图书情报工作》2022,66(13):138-149
[目的/意义]梳理国内外基于文本挖掘的科技文献主题演化相关研究,对主题演化分析中使用的各种方法进行分类、归纳与总结,并提出现有研究存在的不足,为主题演化研究提供新的思路与借鉴意义。[方法/过程]依照国内外学者进行主题演化研究的一般流程,对数据集选取与对象分析、主题识别研究、主题演化研究(主题演化时序分析、主题强度演化分析、主题内容演化分析)3个分析层面中所使用的各类模型、指标与方法进行梳理比较与优缺点总结,提出现有研究的局限性并对未来发展做出展望。[结果/结论]当前研究已具有一定规模和较为成熟的分析体系,但仍存在以下不足:数据来源较为单一;LDA及相关扩展模型存在的弊端需进一步克服;缺乏对其他机器学习及深度学习算法的探索应用;演化分析方法需相互结合、互补互融。未来应针对以上问题做出相应改进与深入探究。  相似文献   

12.
[目的/意义]借助信息扩散研究方法,对伴随文化内容传播的社交媒体热点这一特殊类型事件中的民族文化演化扩散规律进行探究,为解释民族文化扩散规律、推动民族文化传播提供新视角。[方法/过程]以微博平台“丁真事件”发布文本为数据来源。基于LDA主题模型、民族文化符号识别与情感分析构建主题—民族文化符号—情感关联网络,对热点事件中不同主题传播伴随的民族文化演化扩散动态进行情境还原。量化不同类型用户的民族文化传播影响力,探究热点事件中不同主体的民族文化传递接力过程。[结果/结论]结果表明,从主题—民族文化符号—情感关联网络构建与传播主体影响力两大层次分析社交媒体情境下民族文化扩散路径规律,可帮助人文学者精准把握文化传播细节及其动态交互特征。  相似文献   

13.
[目的/意义]借助信息扩散研究方法,对伴随文化内容传播的社交媒体热点这一特殊类型事件中的民族文化演化扩散规律进行探究,为解释民族文化扩散规律、推动民族文化传播提供新视角。[方法/过程]以微博平台“丁真事件”发布文本为数据来源。基于LDA主题模型、民族文化符号识别与情感分析构建主题—民族文化符号—情感关联网络,对热点事件中不同主题传播伴随的民族文化演化扩散动态进行情境还原。量化不同类型用户的民族文化传播影响力,探究热点事件中不同主体的民族文化传递接力过程。[结果/结论]结果表明,从主题—民族文化符号—情感关联网络构建与传播主体影响力两大层次分析社交媒体情境下民族文化扩散路径规律,可帮助人文学者精准把握文化传播细节及其动态交互特征。  相似文献   

14.
科学引文网络反映了科学知识的动态演化,作为一个复杂的网络系统已得到广泛研究。针对引文网络中主题不明确和热点问题不易跟踪的问题,提出了引文网络中的舆论评价计算方法和网络社区主题提取与表示方法。首先采用正则表达式和模板匹配方法提取元数据;并计算文献作者对参考文献的舆论评价,建立带有舆论评价权值的文献引用网络,并对网络中的突现语义进行描述;然后以此网络结构为基础,结合信息熵和网络中文献重要性权重改进TDIDF算法,计算得到每个社区主题的关键词概率描述,从而得到社区主题。本文的方法和实验对解释引文网络的演化、社区主题发现、文献的共享等有借鉴意义。  相似文献   

15.
[目的/意义] 在大数据时代面对海量的数据用户有时会束手无策。因此,越来越多的学者们开始关注互联网热点话题发现的算法,帮助用户快速获取热点话题。[方法/过程] 基于DBSCAN算法,通过动态调整参数来优化算法,实现热点话题发现。根据句法结构与句间关系分析构建热点话题过滤模型,过滤包含热点词项的一般话题。[结果/结论] 采用主流网站新闻数据集进行实验,利用错检率、漏检率等评价指标对算法的有效性进行检验,实验结果证明改进算法性能有所提升,能够为信息用户提供科学研究网络数据的高效途径。  相似文献   

16.
k-clique社区知识创新演化方法研究   总被引:3,自引:0,他引:3  
提出一种基于k-clique社区的知识创新演化揭示方法。首先,构建科技文献时序关键词共词网络。然后,将共词网络划分为n个最大完整子网络Gs,在Gs中寻找k-clique(2 < k < s)。最后,在给定阈值k的情况下,计算k-clique社区的演化情况,从而揭示知识创新情况。该方法不仅能够有效揭示知识创新演化过程,而且能够通过k-clique社区的关键节点,揭示知识创新过程中的共性知识以及不同知识创新领域的互相影响情况。通过对碳纳米管研究领域2008-2012年SCI数据库论文数据的实验证明,该方法能准确识别出该领域知识创新主要方向,并能准确反映其演化情况。  相似文献   

17.
[目的/意义] 基于主题关联相似度揭示主题汇聚及变异过程,识别学科交叉主题及交叉模式,归纳学科主题的演化趋势及演化路径模式。[方法/过程] 获取情报学学科科研论文的高频主题词,构造主题词共词矩阵,利用网络社区演化分析工具生成学科主题演化网络图,结合指标数据对学科主题演化过程进行分析。[结果/结论] 总体上看,情报学学科的研究主题虽然在反复地变化,但核心主题一直存在;扩张、收缩和合并是研究主题最普遍的变化态势,分裂现象较少,产生和消亡现象存在;有3条特定社区演化轨迹清晰地贯穿始终,活跃度相对稳定,反映了3类核心研究主题;3类核心研究主题的演化路径呈现出升华吸纳、共融迭新和辐射推进3种演化模式。研究结果显示,基于主题关联学科主题演化路径的多模式识别方法既能从宏观层面呈现学科主题演化形式,也能从微观层面分析学科主题交叉模式,结合二者可揭示学科主题的继承或创新,预测学科交叉主题的发展方向。  相似文献   

18.
[目的/意义]分析中国国内基于主题模型的科技文献主题发现及演化研究进展,以期为相关研究人员提供参考借鉴及研究思路。[方法/过程]选取中国知网(CNKI)数据库及万方数据知识服务平台作为文献来源,检索并筛选相关文献,通过人工判读提炼出基于主题模型的科技文献主题发现及演化研究的分析流程,并采用文献分析法对流程中国内研究人员所使用到的策略、方法、分析手段等进行归纳和总结。[结果/结论]研究已初具规模,形成较为完整的分析流程,同时各个流程环节上所涉及到的策略、方法和分析手段较为多样化。另外,也存在着一些问题:主题模型方法在科技文献领域的应用尚且不成熟,主题数目固定,缺少对主题模型应用效果的评价方法与准则。  相似文献   

19.
[目的/意义]从主题时序视角出发,以中国图书馆学会年会主题和年会论文集题录为研究样本,进行相关主题词的分布和演化分析,梳理中国图书馆界近十年来理论与实践发展脉络。[方法/过程]获取2007-2017年间中国图书馆学会年会的相关主题词,从中选择高频词,利用Excel构造主题词共词矩阵,利用Ucinet和SPSS工具进行主题词静态分布分析,结合"流行研究热点权值(PRHW)"指标对主题词进行动态演化分析。通过词频、中心性、聚类对比分析相关主题词的静态分布特征;通过词频时序和共词时序分析主题词的动态演化特征,并采用PRHW指标进行识别和演绎;从7个类团中抽取两个典型主题词构筑全主题词的共词时序网络。[结果/结论]相关主题词的静态分布特征表现为:年会主题词和论文集主题词高频词一致性较好,论文主题词更微观具体;二者都不具备显著的中心性;聚类结果根据相近原则归并出7个具体类团。主题词的动态演化特征表现为:分长期关注、早期关注、近来关注上升和近来关注下降四类,相关主题的微观演化特征得到了精细化呈现。  相似文献   

20.
[目的/意义] 学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法/过程] 提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果/结论] 通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号