首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 578 毫秒
1.
为尽早发现颠覆性技术,同时全面监测各个子领域中具有颠覆性潜力的新兴和热点主题,提出一种融合属性计量、LDA模型与网络中心性指标的颠覆性技术识别方法。首先,从技术突破性和市场潜力两个维度设计评价指标,筛选出具有高颠覆性潜力的技术文献;其次,基于LDA模型将技术文献划分为不同子领域;最后,采用中心性指对分类网络中技术节点的影响力进行识别,基于特征向量中心性得到颠覆性主题子网,综合度中心性、中介中心性和接近中心进一步区分颠覆性热点主题和新兴主题。基于类脑智能领域的专利实证研究表明,分类网络可以很好地识别不成熟子领域中颠覆性技术的热点主题和新兴主题,这是对全局网络识别结果的补充和完善。  相似文献   

2.
【目的/意义】基于Rao-Stirling 指数和LDA模型进行领域学科交叉主题识别,并以纳米科技为例验证将 Rao-Stirling 指数和LDA模型用于领域学科交叉主题识别的有效性和适用性。【方法/过程】基于Rao-Stirling 指数 测度领域文献学科交叉程度,设定阈值发现高度学科交叉文献。基于LDA模型对筛选出的学科交叉文献进行主题 识别,发现学科交叉点和学科交叉研究主题。【结果/结论】基于Rao-Stirling 指数从引文的角度进行领域文献学科 交叉测度可以有效地发现与某领域相关的学科交叉文献,且有利于大数据集的学科交叉文献发现研究的实现。基 于LDA模型进行学科交叉主题识别可以有效地发现学科交叉主题。两方法的组合应用为发现某领域学科交叉主 题研究提供一种新视角。  相似文献   

3.
江秋菊 《情报科学》2019,37(6):96-100
【目的/意义】本文综合考虑文献的主题、被引频次和发文时间,从三维视角出发,提出一种文献影响力指数 (Influence Index of Document,IIOD)计算方法,在主题分类的基础上对文献的影响力进行评价。【方法/过程】以 中国引文数据库中2013-2017年情报学领域9本期刊的10523篇文献为样本,利用LDA模型进行主题提取,并将 LDA与K-means算法结合实现文本分类,进而计算特定主题下文献的影响力指数,根据文献影响力指数对文献进 行排名。【结果/结论】文献影响力指数综合考虑了文献的主题特征、被引频次和时效性,其排名结果更加全面合理, 为评价文献的影响力提供了一种新的视角。  相似文献   

4.
【目的/意义】构建主题-主题关联的学科知识网络,从主题之间语义关联角度度量主题在学科知识网络中 的影响力,分析学科知识结构演化规律,为热点、前沿主题探测提供方法支撑。【方法/过程】基于 LDA主题模型抽取 学科领域研究主题,利用主题在科学文献中的共现关系构建主题-主题关联的学科知识网络,并提出主题影响力概 念和度量方法;基于复杂网络结构分析方法对学科领域生命周期内主题-主题关联的学科知识网络进行演化分 析。【结果/结论】实证分析表明主题的网络影响力是主题强度、被学者关注度等外部特征指标的有力补充,可用来 探测热点、前沿主题。同时,学科知识结构随着学科领域的发展表现出较强的小世界网络特征。  相似文献   

5.
王静茹  陈震 《情报科学》2018,36(1):102-107
【目的/意义】目前LDA模型在文本数据挖掘方法中占有重要的地位,已成为数据挖掘领域的研究热点。 为了进一步提高LDA模型在文本挖掘中的应用效果,有必要对LDA模型文本主题提取效果进行对比研究。【方法/ 过程】本文提出了一种基于LDA模型的不同类型文本数据主题提取效果对比评价方法,先通过LDA模型对文本数 据进行主题挖掘;再通过定量的主题提取效果评价方法进行对比研究。【结果/结论】本文以期刊论文、网络舆情事 件话题、微博文本、调查问卷为文本数据源,实验结果表明LDA模型在处理语义信息明确逻辑关系合理的长文本数 据时,主题提取效果较好。这为提高LDA模型的挖掘效率提供了一定的理论依据。  相似文献   

6.
大科学时代科研仪器与高端科研成果产出存在紧密的联系,科研仪器作为探索自然规律的重要工具,在科研领域的作用不容忽视。本研究从文献计量视角对我国科研仪器研究文献展开分析,通过可视化工具及LDA模型进行文本挖掘揭示科研仪器研究的知识结构。分析发现以科研仪器为主题的文献数量增长迅速,作者合作密度较低,科研仪器研究主题覆盖范围在逐渐扩大,结合人工编码及LDA文本挖掘确定科研工作、科研基础、科研设备以及科研人员4个主题,其中科研工作与科研基础主题在我国科研仪器研究知识结构中占比较多,科研设备与科研人员主题的研究力量薄弱。  相似文献   

7.
[目的/意义] 通过文献和专利进行文本挖掘获取技术热点主题的方法已逐步成熟,但相关研究未充分考虑社会公众对技术未来发展方向的影响。以社交媒体微信公众平台作为数据源,嵌入社会公众感知,可从更全面的视角识别技术热点主题并分析其发展态势。提出基于微信公众平台的技术热点主题识别与发展态势分析框架,弥补了现有方法未考虑社会公众对技术主题变化影响的不足。[方法/过程] 首先,通过微信传播指数(WCI)筛选可用于技术热点主题识别的微信公众平台。其次,采用文本挖掘的方法,应用LDA主题模型提取技术主题。然后,结合社会感知识别技术热点,并利用IPA分析法分析技术主题的发展态势。最后,以石墨烯技术为例进行实证分析以检验方法的可实施性和效果。[结果/结论] 识别出2015-2018年石墨烯技术热点,并结合社会感知视角定位出当前处于优势区、维持区、机会区、改进区的技术主题,实现对石墨烯技术热点的发展态势的分析与评价。  相似文献   

8.
朱光  潘高枝  李凤景 《情报科学》2022,40(4):127-137
【目的/意义】识别信息隐私研究领域的热点主题,梳理主题演化路径。【方法/过程】针对主题识别语义杂乱 等问题,提出时序关联与结构表征视角下的主题演化分析方法。首先利用LDA(Latent Dirichlet Allocation)模型识 别多时间窗口下的文献主题,进一步运用共词分析绘制语义更为独立的主题凝聚子群。在此基础上,从时序关联 维度计算相邻窗口下主题间的相似度,梳理演化路径;从结构表征维度,设计主题新颖度、中心性、影响力等计量指 标,探寻信息隐私前沿和热点主题的演化变迁。【结果/结论】实证分析结果表明,本文方法可以深度挖掘信息隐私 领域研究主题,从宏微观两个维度全面梳理主题的演化路径。研究有利于探测信息隐私研究的前沿。【创新/局限】 综合运用LDA主题模型与共词分析方法绘制主题凝聚子群,从时序演化和结构表征两个维度探寻主题演化路径。 未来研究中有待于引入多种数据源以对比主题差异,有待于引入多元组术语改善主题识别效果。  相似文献   

9.
[目的]从海量微博舆情信息中准确、高效地发现和挖掘当下的热点主题,以期为政府和企业监控和管理舆情动态提供有价值的参考。[方法]研究首先从维度、特征和度量三方面综合考虑构建"帖子-主题"二模网络模型,其次选择词频、主题权重和词频增长率3个特征来抽取模型所需的有效关键词,然后选取社会网络分析法中的社区发现方法进行基于关键词的主题社区发现,最后综合考虑用户影响力和传播影响力两个属性,通过热度分析确立主题热度,识别热点主题。[结果]实验表明,该方法能有效挖掘网络舆情中的热点主题,检测出的主题结果均正确,验证了本文方法的可行性和有效性。在此基础上,研究还选取实例进一步对主题的热度迁移和情感倾向进行了分析,具备一定的预警作用。  相似文献   

10.
【目的/意义】探析一个学科领域中学术文献的研究内容与研究方法之间的潜在关系,对科学研究和科研 管理均具有一定的指导意义。为此,本文给出一种“内容-方法”共现分析方法。【方法/过程】选取Web of Science数 据库中国际著名的17 种情报学期刊文献共12082 篇,利用LDA模型提取文献主题;通过人工识别对提取的主题分 别标注为研究内容和研究方法;通过自编程序,建立学术文献研究内容与研究方法的共现关系;最后通过2-模网络 实现共现关系的可视化。【结果/结论】研究结果表明,“内容-方法”共现分析不仅能够从内容和方法两个视角了解 学科领域的研究态势,而且能够发现学科领域研究内容与研究方法之间的潜在关系。  相似文献   

11.
王婧  武帅 《情报探索》2024,(2):1-11
[目的/意义]现有学科研究主题的梳理多为领域专家的定性分析和学科学者的文献梳理,一定程度会由于研究思维的局限性和获取知识的片面性造成学科研究主题误判,为有效避免漏判误判现象的发生,提出识别模型。[方法/过程]首先,运用传统LDA模型分析主题特征词;其次,结合上下文语义信息进行中文分词,形成学科主题词库;最后,结合隐含位置聚类算法发现潜在社区,提高主题识别效果。[结果/结论]提出的方法一定程度上优化了主题挖掘算法在识别短文本主题的效果,消除主观意愿。由计算机自行分类并实现科学研究前沿主题的预测,揭示前沿领域的研究热点,为致力于研究前沿学科的新兴学者提供参考价值。  相似文献   

12.
【目的】为深入了解旱地农业这一特定领域内科技期刊发展和分布的特点,探索学科热点主题发展与期刊发展之间的联系,以旱地农业领域文献数据为基础,提出基于隐含狄利克雷分布(LDA)模型的科技期刊发展分析的方法和框架。【方法】从LDA模型提取的旱地农业领域热点主题入手,自定义期刊热点主题追随度指数、领域重点期刊的遴选标准和分类标准,对不同类型的期刊进行热点主题追随度分析,并对学科领域期刊的分布和中国期刊发展概况进行多方位的数据提取和展示。【结果】整个旱地农业领域研究的发展和重要期刊发展相互促进,不同类型期刊热点主题特点不一。发展速度快的重点期刊(包括顶级期刊、最快发展和较快发展重点期刊)中,所有旱地农业热点主题的相对增长率>0;非较快发展重点期刊和非重点期刊,其各个热点主题的增长率均<0。最快发展重点期刊紧随规模大且发展速度快的热点主题;顶级期刊和较快发展重点期刊则紧随旱地农业领域中发展速度相对快的方向。旱地农业领域发文期刊集中,77%以上论文出版于美国、荷兰、英国、瑞士、德国,仅4.3%的中国作者论文在本土出版。中国主要SCI期刊的期刊指数居中,刊出热点主题与全球一致性高。【结论】...  相似文献   

13.
专属性主题是创新研究的重要议题,对其进行全面量化比较分析具有重要学术价值。本文基于Web of Science核心合集数据库(1986-2017年)和中文CSSCI数据库(1998-2017年)中专属性研究文献,运用文献计量和内容分析方法,借助CiteSpace软件呈现专属性主题中英文文献引文共被引聚类和关键词共现图谱,结合图谱中重要节点文献深度挖掘,揭示并比较中英文文献所承载的专属性研究的发展机理、共性与差异。结果表明:专属性主题中英文研究有着各自的知识结构、知识基础及范式;在研究逻辑、主题涵盖和研究方法等方面具有共性;研究内容侧重和相似主题的研究视角存在差异,同时也存在不同的研究热点;关于理论渊源与主题形成,在原创性、连续性、系统性等方面存在水平差异。本文对于深入认识专属性问题研究特点、促进学术交流和创新实践、建设中国情境下的专属性理论体系具有重要启示。  相似文献   

14.
[研究目的]为细粒度发现相近学科间的知识关联,推动学科间知识交流,通过抽取方法知识元,探析不同学科领域研究方法的交流态势。[研究方法]以情报学和计算机科学学为例,首先,编写方法知识元抽取规则,基于规则抽取两学科领域大样本文献的方法知识元,构建学科领域方法知识元库;再利用LDA模型抽取两学科领域代表性期刊的方法知识元;以此为基础,对比分析两学科领域的高频研究方法、已交流的研究方法、存在交流潜力的研究方法。[研究结论]研究发现,两学科已交流的研究方法有:聚类分析、LDA模型、BP神经网络、支持向量机、主成分分析、协同过滤、文献计量等;具有交流潜力的研究方法有:提高准确率的分类算法(AdaBoost算法、XGBoost算法、SMOTE算法)、图卷积神经网络、自然语言处理模型GloVe模型等。该研究不仅能为情报学研究者选择计算机科学学领域的研究方法提供参考,而且也为学科交叉研究提供了一种新思路。  相似文献   

15.
【目的/意义】基于文献数据的领域知识图谱构建有助于探测某学科领域的主要研究内容及其发展方向,是 进行技术创新的基础情报工作,对于研究人员、企业都具有一定的意义。【方法/过程】提出基于交互式可视化技术 的知识图谱构建方法,首先基于经典LDA模型进行主题识别,然后基于社会网络分析方法构建领域主题网络识别 关键主题词;最后,基于JS(D3 工具)绘制可交互的关键主题词关联与检索知识图谱,发现关键主题词的隐含联系, 辅助进行领域知识挖掘与分析。【结果/结论】通过对我国医疗健康信息领域进行实证研究,验证了本文提出方法的 准确性和有效性。  相似文献   

16.
基于主题模型(LDA)的查新辅助分析系统设计研究   总被引:1,自引:0,他引:1  
马林山  郭磊 《现代情报》2018,38(2):111-115
文章概述了主题概率模型(LDA)的计算原理和方法,以及开源R语言中lda程序包采用快速压缩吉普抽样算法分析语料库的处理流程。设计了基于LDA模型的查新辅助分析系统设计功能框架,对其功能、编程实现思路和工作流程做了描述。最后结合课题查新实例,详述了采用LDA模型通过相关文献关键词进行潜在主题挖掘,对比分析课题研究内容,对课题给出客观评价的过程。结果表明,基于主题模型的查新辅助分析系统可以快速有效挖掘相关文献主题,降低查新员对相关文献的分析难度,提高课题评价的客观性,整体辅助分析效果良好。  相似文献   

17.
【目的/意义】网络舆情潜在主题指的是那些具备一旦发表就能吸引媒体和网民关注,进而引发热议或成为 热点这种潜在影响力的网络舆情主题。为发现网络舆情潜在主题,本文提出了一种基于社会网络视角的网络舆情 潜在主题发现方法。【方法/过程】该方法包括基于用户行为关系网络的关键微博挖掘和基于关键词共现网络的潜 在主题抽取两部分。【结果/结论】实验结果证明,该方法不仅能有效挖掘网络舆情中的潜在主题,且识别出的部分 潜在主题会随时间推移逐渐演变为热点主题,起到了一定的预警作用。同时,基于实验结果,总结了医疗领域网络 舆情主题演化模式,为政府、企业应对该领域的网络舆情事件提供了有价值的参考。  相似文献   

18.
[研究目的]新兴领域由于发展时间不长,相关研究的文本量不够充足,先切分文本后关联主题的演化方法可能会导致各时间窗主题重复等问题,因此提出一种先整体识别热点,后切片分析演化的方法,解决新兴领域演化分析中文本量不足的问题。[研究方法]以制氢领域的核心中文期刊文献为数据源,通过构建指标体系先对整体语料库进行热点主题识别,再进行时间切片。对每个时间窗口的文本进行LDA主题抽取,并利用Word2Vec训练词向量,通过相似度计算进行热点主题的子话题关联及其主路径的词汇关联,从而分析各热点主题的结构演化和内容演化。[研究结论]绘制了各热点主题的结构演化图,并以热点主题光催化剂性能及其制备为例,揭示了其在各时间窗内的热点转移关系;同时绘制了其内容演化图,揭示了其各时间窗内的研究重点。实现了演化研究方面的精细化表达,为文本量不够充足的新兴领域演化分析提供了有效可行的思路。  相似文献   

19.
探索性活动与利用性活动之间存在知识冲突与需求张力,如何从旨在长期获益的探索性活动和着眼于短期利益的利用性活动之间找寻平衡,是学术和管理实践迫切需要解决的难题。自1991年March提出探索与利用张力以来,相关研究迅速蔓延到组织的许多领域。本文以WOS中1991-2016年间"探索与利用"研究的施引文献为研究对象,从关键词共现、作品共被引、关键路径3个层次进行分析,挖掘该领域的研究热点,知识基础及关键路径,以期为学者提供文献分析的便利。基于上述分析发现,当今"双元性(Ambidexterity)"是该领域的热门研究主题,与"知识管理"、"动态能力"等研究紧密相连;本研究的样本文献从基础理论,"探索与利用"张力相关研究话题,研究方法论3个方面构建了该领域的知识基础;该领域研究存在着"探索与利用"张力的表现形式及解决办法两条关键发展路径,未发现转折点。  相似文献   

20.
LDA模型在专利文本分类中的应用   总被引:1,自引:0,他引:1  
对传统专利文本自动分类方法中,使用向量空间模型文本表示方法存在的问题,提出一种基于LDA模型专利文本分类方法。该方法利用LDA主题模型对专利文本语料库建模,提取专利文本的文档-主题和主题-特征词矩阵,达到降维目的和提取文档间的语义联系,引入类的类-主题矩阵,为类进行主题语义拓展,使用主题相似度构造层次分类,小类采用KNN分类方法。实验结果:与基于向量空间文本表示模型的KNN专利文本分类方法对比,此方法能够获得更高的分类评估指数。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号