首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
[目的/意义]分析技术主题演化过程可以梳理技术发展脉络,对于发展创新、预测技术发展趋势具有重要意义,但是从语义角度分析技术主题演化轨迹的研究较少。因此,从语义的角度出发,分析技术主题演化过程。[方法/过程]提出基于非负矩阵分解的改进的动态非负矩阵分解模型对专利文本进行动态主题建模,并利用TextRank算法抽取名词短语进行标注,增强所抽取技术主题的可解释性。在此基础上,利用词向量的方式计算技术演化轨迹,并进行可视化展示。[结果/结论]对2002年、2005年、2008年、2011年和2014年的五方专利进行实证分析,识别出65个技术主题及其演化轨迹,表明方法的可行性。  相似文献   

2.
利用专利文献数据识别技术领域的技术主题演化发展路径并分析其发展趋势,对于科技界、企业界进行专利技术创新具有重要的意义。首先,使用Open IE 5.1进行SAO (subject-action-object)三元组抽取,基于LDA (latent Dirichlet allocation)模型进行主题识别,根据TRIZ技术创新思想,基于action语义词典将技术主题划分到四个维度;然后,通过计算SAO三元组之间的相似度来测度技术主题之间的语义关联构建技术主题创新演化路径,并利用可视化技术构建技术主题创新演化路径可视化图谱,利用该图谱辅助分析技术主题演化脉络及其发展趋势。最后,通过石墨烯超级电容器(集流体)领域的实证,对该领域的技术问题(problem to problem,P-P)主题、技术功能(solution to solution,S-S)主题、解决方案(problem to solution,P-S)主题和技术效果(solution to problem,S-P)主题的创新演化路径进行解读分析,验证了本研究提出方法的可行性和有效性。  相似文献   

3.
[目的/意义]随着信息资源在数量和种类上的急剧增长,学科间的交叉融合不断涌现,快速主动地从海量信息资源中识别和判断研究主题的发展演化是实现科技创新的基础。[方法/过程]在相关理论调研的基础上,结合医学领域的资源特点,提出一种基于LDA模型的主题演化探测模型和相应的流程步骤。主要步骤包括医学主题词抽取、主题识别、主题关联、关键主题识别、关键主题的演化主路径识别、演化主路径上主题分裂、融合事件识别,实现深度、细致的主题演化分析。[结果/结论]选用乳腺癌治疗研究文献为实验案例,对判断模型进行试验并对结果进行分析验证,证实提出的技术方法具有一定的可靠性。  相似文献   

4.
基于共词分析法的学科主题演化研究方法的构建   总被引:1,自引:0,他引:1  
唐果媛 《图书情报工作》2017,61(23):100-107
[目的/意义]相比于以单纯的关键词统计排序为主的词频分析法,和以文献作为分析对象、需要庞大的引文索引作为基础的共引分析法,共词分析法具有一定的优势。因此,基于共词分析法来研究学科主题演化规律。[方法/过程]构建基于共词分析法的学科主题演化研究方法,包括4个模块,分别是:数据准备、演化阶段划分、主题识别和主题演化分析。[结果/结论]在主题识别阶段改进了词频g指数来选取共词分析的对象;在主题演化分析模块,提出从静态和动态两个角度来分析学科主题的演化情况,构建三维战略坐标来进行静态分析,并构建学科主题演化现象识别模型来进行动态分析。  相似文献   

5.
[目的/意义]为全面、客观、高效、直观地掌握科技领域主题的发展规律和演变趋势,提出一种基于多源数据的领域主题演化路径识别和分析框架。[方法/过程]获取不同来源的科技文献数据,利用多维样本有序聚类方法辅助时间切片,基于改进的词袋构建方法,提升LDA模型主题识别效果,借助Louvain社区发现算法在主题层进行多源数据的融合,分析领域主题演化路径。[结果/结论]利用美国太赫兹研究领域基金项目、论文和专利3种来源的数据进行实证研究,结果表明,3种数据源能够清晰划分出4个时间窗口,改进的词袋构建方法能够表征更准确的领域信息内涵,主题社区有助于从多源数据复杂的演化网络中厘清主题演化脉络。  相似文献   

6.
微博主题的演化分析会帮助用户快速准确地理解主题脉络结构、跟踪主题发展情况,并根据主题演化做出相应的预测.本文对概率主题模型LDA (Latent Dirichlet Allocation)进行了扩展,使其适合中文微博短文本的处理,并利用LDA建模结果对微博主题进行演化分析.为了体现不同时间片中主题演化的动态性,本文在使用LDA建模之前首先对每个时间片内最优主题数目进行确定,再通过LDA主题抽取结果,追踪不同时间片内主题的变化趋势,实现主题在内容和强度两个方面的演化分析.通过在真实微博语料库上进行实验,结果表明该方法不但可以较好地分析出同一微博主题随时间的强度演化规律,还可以描述主题内容的演化趋势.  相似文献   

7.
梁爽  刘小平 《图书情报工作》2022,66(13):138-149
[目的/意义]梳理国内外基于文本挖掘的科技文献主题演化相关研究,对主题演化分析中使用的各种方法进行分类、归纳与总结,并提出现有研究存在的不足,为主题演化研究提供新的思路与借鉴意义。[方法/过程]依照国内外学者进行主题演化研究的一般流程,对数据集选取与对象分析、主题识别研究、主题演化研究(主题演化时序分析、主题强度演化分析、主题内容演化分析)3个分析层面中所使用的各类模型、指标与方法进行梳理比较与优缺点总结,提出现有研究的局限性并对未来发展做出展望。[结果/结论]当前研究已具有一定规模和较为成熟的分析体系,但仍存在以下不足:数据来源较为单一;LDA及相关扩展模型存在的弊端需进一步克服;缺乏对其他机器学习及深度学习算法的探索应用;演化分析方法需相互结合、互补互融。未来应针对以上问题做出相应改进与深入探究。  相似文献   

8.
[目的/意义]主题演化对科技前沿探测、创新战略部署具有十分重要的作用。[方法/过程]将主题演化分析过程分解为主题的表示、相似性关联和强度演化计算几个步骤,提出一种主题强度演化与预测模型,使用LDA模型进行主题的表示,提出内容、共现和趋势相似度等维度进行主题关联计算,引入基于Prophet的预测-修正模型进行主题演化趋势预测。并以干细胞领域为例,进行演化的实证分析。[结果/结论]实验表明,对每个研究主题采用Logistic增长模型进行预测R2Score都达到0.90以上,表明Prophet的Logistic增长模型与该领域主题增长趋势规律相符合,能够较好地拟合主题强度的演化趋势。提出的主题演化模型对专业领域内主题分布与演化分析有一定的借鉴意义。  相似文献   

9.
掌握融合出版领域前沿技术的应用现状与趋势,为融合出版领域的技术应用提供参考。选择2006—2022年融合出版领域的专利、新闻、公众号、学术论文数据,采用joiNLP算法提取关键短语,利用BERTopic模型进行主题提取,并基于all-MiniLM-L6-v2模型将主题向量化作为余弦相似度计算的依据,以分析2006—2022年融合出版技术主题与应用主题的强度演化与内容演化趋势,最终构建演化主路径。以多源数据为研究对象,揭示融合出版领域热点技术可归纳为区块链、人工智能、虚拟现实、增强现实,并指出未来融合出版将在元宇宙世界具有更广泛的应用空间。使用主题模型从文本语义层面提取技术主题,结果具有高准确性和强可解释性,对探究技术的演化规律与趋势具有创新意义。  相似文献   

10.
本文旨在构架基金项目研究主题挖掘与动态演化分析的情报研究流程,通过对表征基金项目标题、摘要与学部的数据进行关联建模和挖掘,从项目内容层面上探究基金资助领域研究涉及的主题特点、范围侧重、发展方向及演化脉络。首先利用RAKE (rapid automatic keyword extraction)关键词抽取算法从基金数据中的标题和摘要中抽取关键词,通过术语切分等方式获得核心关键词;然后,采用Google的word2vec深度学习工具对核心关键词进行词向量建模,并使用k-means算法对生成的词向量进行聚类,挖掘相应的研究主题;进而对主题分布进行统计分析,且通过WMD (word mover’s distance)算法计算主题之间的相似度,以分析研究主题演化趋势,并识别出演化主路径。实证研究发现,以美国NSF (National Science Foundation)数据中AI (artificial intelligence)领域为例,所提方法流程能够识别出AI领域的多个主题,且能识别出不同学部的主题侧重;在发展过程中,研究主题演化呈现出大量分裂与融合的复杂态势,演化路径明晰,侧重点突出,...  相似文献   

11.
随着社会化媒体的发展,识别海量高质量的用户生成内容在电子商务等领域具有很多的实际意义。本文将主题模型应用到高质量用户生成内容的识别,从语义层面挖掘高质量用户生成内容所具有的特征。本文首先通过对社交平台用户评论特征的分析,构建了基于LDA的用户生成内容主题模型,对主题模型计算结果,采用TFIDF识别高概率主题词的权重,探讨高质量用户生成内容的主题分布特征。最后通过亚马逊网上书店的网络用户评论进行试验,分析了高质量用户评论的主题分布特征。  相似文献   

12.
[目的/意义]基于大量专利文献数据的核心技术主题识别有助于识别某技术领域的关键技术、分析关键技术的发展方向,是进行技术创新的基础情报工作,对于研究人员、企业乃至国家层面都具有一定的意义。[方法/过程]提出基于Chunk-LDAvis的核心技术主题识别方法,首先基于经典LDA模型进行主题识别,然后利用名词组块对初始LDA主题识别结果进行标注,构建Chunk-LDA主题识别结果,提高其可解读性;然后基于社会网络分析方法构建主题网络,识别核心技术主题;基于R语言的LDAvis工具包绘制可交互的Chunk-LDAvis核心技术主题关联分析图谱,发现核心技术主题的隐含联系,辅助进行核心技术主题识别。[结果/结论]通过对纳米农业领域进行实证研究,验证了本文提出方法的准确性和可行性。  相似文献   

13.
黄颖  叶冬梅  丁凤  徐畅  张琳 《图书情报工作》2022,66(22):142-154
[目的/意义] 开展面向特定技术领域的技术演化路径识别,有助于梳理技术发展脉络进而对未来的技术发展方向做出合理预测,对识别科技优先领域、合理配置科技资源具有重要意义。[方法/过程] 在梳理技术演化与技术演化路径的相关内涵的基础上,简要辨析了技术演化路径相关概念;进而从专利文献中的不同信息出发,从专利分类、专利引文、专利文本以及融合多种字段信息来总结技术演化路径识别研究的主要进展,并进一步归纳出该主题的整体发展趋势。[结果/结论] 技术演化路径识别研究主要趋势包括:数据来源从单一数据转向多源异构数据融合,研究方法从注重定量转向定性与定量相结合,关注视角从历史演化路径识别转向未来演化路径预测,应用场景由一般性技术到颠覆性技术转变。  相似文献   

14.
吴帼帼 《情报工程》2023,(1):92-101
[目的 /意义]信息素养与生活学习工作密切相关,探究信息素养的发展脉络和研究主题分布以及演化关系,对促进信息素养培育发展以及指导信息素养能力提升具有积极作用。[方法 /过程]基于近五年SCI、SSCI中的信息素养相关研究数据集合,使用LDA模型挖掘各个年代下相关研究的主题分布以及主题间的演化规律,与此同时基于替代计量学指标找到近五年高社会影响力的具体文章。[局限]未将信息素养相关的中文期刊文献等数据包含其中。[结果 /结论 ]近五年信息素养研究主要集中于信息素养、学术图书馆、信息素养教育、数字数据素养、虚假信息以及健康素养等方面。且主题之间相似度较高,主题衍生关系和延续性较强。  相似文献   

15.
[目的/意义] 根据基金项目数据的特点,提出基于基金项目数据的研究前沿主题探测方法,以期识别出前瞻价值更高的研究前沿,为研究前沿识别相关研究提供借鉴思路。[方法/过程] 首先,基于PLDA模型识别蕴含在基金项目文本中的研究主题;然后基于主题-文档矩阵建立主题和基金项目文档的映射关系,在此基础上,利用主题的资助时间、资助金额和中心性指标进行研究前沿主题探测,从而识别出值得关注的研究前沿主题;最后,利用主题演化可视化分析方法,对研究前沿主题进行演化分析,以预测其发展趋势。[结果/结论] 研究结果表明,该方法可以根据基金项目数据的特点识别出蕴含在其中的研究前沿主题,并且能够分析研究前沿主题的分裂、融合等演化过程。  相似文献   

16.
刘俊婉  庞博  徐硕 《情报学报》2023,(12):1395-1411
基于专利的弱信号探测模型与技术颠覆性潜力测度体系相结合的方法,开展颠覆性技术早期识别,为颠覆性技术的早期识别提供一套有效的方法和思路。利用专利信息进行领域弱信号探测,利用LDA (latent Dirichlet allocation)主题模型从领域专利内容中抽取主题,基于弱函数对主题进行过滤得到包含弱信号的主题集合,进一步通过预兆函数对弱信号主题包含的术语进行过滤,得到该研究领域弱信号术语集合及其对应的专利集合。基于技术颠覆性潜力测度指标体系,对包含弱信号术语的专利进行颠覆性潜力测度,最终得到目标领域具有颠覆性潜力的技术,为该领域颠覆性技术的早期识别提供参考。以incoPat专利数据库中2008—2019年基因编辑领域的专利数据作为研究对象,结合弱信号探测模型与技术颠覆性潜力测度体系,对该领域具有颠覆性潜力的技术进行早期识别,通过与基于关键词识别的弱信号结果对比,并利用CRISPR/Cas9技术对上述颠覆性技术识别结果进行验证,证明了本文方法的可行性和有效性。  相似文献   

17.
本文在档案学学科主题快速发展变化的背景下,分析一定时间国内档案学的主题结构及演化状况,梳理国内档案学科近20年来的发展脉络。获取1998-2017年间档案学核心期刊的关键词,根据关键词共现关系分时段构建主题网络,展现不同时期档案学的主题结构;根据相似度判断主题之间的演化情况,勾勒出档案学科研究内容的动态变化。根据主题的演化情况得出7条演化路径并归纳出演化的规律;引发学科主题变化的原因有经济、文化、社会科技形态与现代信息技术的影响等;预测未来数字档案、档案文化、档案公共服务、档案信息资源开发利用及整合等仍是学科的研究重点,更加重视面向公众提供档案信息服务和知识服务,与其他学科进一步交叉融合,跨学科范围越来越广泛。研究结果有利于档案学领域学者把握学科的发展脉络,更好地发现新的学科增长点。  相似文献   

18.
[目的/意义] 学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法/过程] 提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果/结论] 通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。  相似文献   

19.
基于动态LDA主题模型的内容主题挖掘与演化   总被引:1,自引:0,他引:1  
指出文本内容主题的挖掘和演化研究对于文本建模和分类及推荐效果提升具有重要作用。从分析基于LDA主题模型的文本内容主题挖掘原理入手,针对当前网络环境下的文本内容特点,构建适用于动态文内容本主题挖掘的LDA模型,并通过改进的Gibbs抽样估计提高主题挖掘的准确性,进而从主题相似度和强度两个方面研究内容主题随时间的演化问题。实验表明,所提方法可行且有效,对后续有关文本语义建模和分类研究等具有重要的实践意义。  相似文献   

20.
在分析文献在不同研究阶段用词时间特征的倾向性基础上,提出一种基于主题模型的研究发展阶段识别方法。重点阐述该方法的构建过程,包括时间特征抽取、发展阶段界定、主题冷热变化分析等步骤。为验证该方法的有效性,针对词频统计法和主题模型方法在主题演化分析中的效果进行比较分析。结果表明,该方法能在识别主题热点和发展趋势的同时,有效地区分不同主题所反映的研究发展阶段。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号