首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 718 毫秒
1.
[目的/意义] 学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法/过程] 提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果/结论] 通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。  相似文献   

2.
[目的/意义] 在科学研究中,从不同来源的科技文献中识别挖掘科研热点对于开展科研工作具有指导意义。旨在通过本研究提出的模型方法,快速准确地识别蕴含在多源文本中的热点主题,为科研创新提供支撑服务。[方法/过程] 提出一种基于LDA2vec模型的多源文本下科研热点识别的方法并针对科研热点识别构建模型,该方法融合LDA主题模型对隐含语义挖掘的优势和Word2Vec词向量模型对于上下文关系把握的优势。以机器学习领域的科技文献为例,利用模型困惑度和主题一致性两个指标对LDA2vec的在本领域应用的可行性和有效性进行验证,并与LDA的主题提取效果进行对比。[结果/结论] 实验结果表明,提出的方法在面对多源数据情况下,进行科研热点识别挖掘是可行的,且在一定程度上有效果的提升,对利用单一数据源进行主题分析的不足进行补充,对多数据源融合的实践应用进行丰富。  相似文献   

3.
基于主题模型的科技报告文档聚类方法研究   总被引:1,自引:0,他引:1  
[目的/意义]探索实践以科技报告为文献载体形式的融合主题模型的文本聚类方法,拓展基于科技文献进行技术监测服务的新领域,提出基于科技报告进行语义分析的新方法。[方法/过程]以国家科技报告服务系统中的科技报告为数据源,首先基于LDA主题模型对经过文本预处理的科技报告进行主题挖掘,再基于Ward与K-means相结合的聚类算法对包含主题分布信息的文本向量进行聚类分析,尝试提出一种适合科技报告文档聚类的文本挖掘新方法。[结果/结论]实验结果表明,LDA主题模型能有效准确挖掘科技报告中的主题信息,所提出的Ward与K-means相结合的聚类算法对科技报告的聚类效果也优于其它传统聚类算法。  相似文献   

4.
[目的/意义] 由于传统科技创新主题概率识别方法忽略文本内容语义理解,为了更加准确地识别出主题,科技创新主题语义识别势在必行。[方法/过程] 提出一种基于LDA的科技创新主题语义识别方法,利用语义角色标注技术对科技文献中的科技创新内容进行语义标引,构建LDA主题语义识别模型,根据表征科技创新内容的关键词语义角色对应的上位词的概率识别出科技创新主题。[结果/结论] 通过以3D打印领域数据为对象进行实验,证明该方法能够更加准确地识别出科技创新主题,形成科技创新主题-主题词-科技文献的混合分布聚类集群,减少研究背景等无关数据干扰,避免语义含义相同的科技创新主题词重复统计问题。  相似文献   

5.
[目的/意义]基于当前技术演化分析方法的发展现状,提出一种能够在微观层次上突出既定领域中主要技术发展脉络的多主路径方法。[方法/过程]将专利文本挖掘和动态规划方法应用于专利引文网络,以路径上所有专利对的语义相似度总和最优作为启发策略进行路径搜索,以获取若干能够分别聚焦于特定主题的主路径,供研究者总览既定技术领域中主要技术主题的发展脉络及其相互关系。[结果/结论]实证结果表明,将该方法应用于硬盘驱动器磁头领域,可以有效抽取其中主要技术主题的演化轨迹。  相似文献   

6.
[目的/意义] 根据基金项目数据的特点,提出基于基金项目数据的研究前沿主题探测方法,以期识别出前瞻价值更高的研究前沿,为研究前沿识别相关研究提供借鉴思路。[方法/过程] 首先,基于PLDA模型识别蕴含在基金项目文本中的研究主题;然后基于主题-文档矩阵建立主题和基金项目文档的映射关系,在此基础上,利用主题的资助时间、资助金额和中心性指标进行研究前沿主题探测,从而识别出值得关注的研究前沿主题;最后,利用主题演化可视化分析方法,对研究前沿主题进行演化分析,以预测其发展趋势。[结果/结论] 研究结果表明,该方法可以根据基金项目数据的特点识别出蕴含在其中的研究前沿主题,并且能够分析研究前沿主题的分裂、融合等演化过程。  相似文献   

7.
[目的/意义]以主题短语识别为研究对象,提出基于PhraseLDA模型的主题短语挖掘方法,为快速理解文本内容、准确抽取文本主题提供借鉴思路。[方法/过程]对低频词进行量化定义,提出一种合理的短语重要度计算方法,最终利用PhraseLDA主题模型推理出主题短语。[结果/结论]实验结果表明该方法在多种数据集中挖掘出的主题短语质量较高,主题一致性较强。  相似文献   

8.
[目的 /意义]需求导向既是科技战略情报研究的宗旨,也是科技发展战略规划的指导原则,在我国脑计划正式启动之际,分析预见脑科学未来发展需求,为我国脑科学发展规划提供战略情报服务。[方法 /过程]收集全球已发布的204份脑科学相关发展战略规划报告,构建基于战略规划文本挖掘的需求预见方案,利用深度学习算法实现战略规划报告全文的需求信息挖掘,从战略规划视角分析预见脑科学未来发展需求,并对比分析主要发达国家/组织在该领域采取的战略措施。[结果 /结论 ]研究构建脑科学战略信息库,基于该信息库从需求主体、战略需求、行动需求3个方面分析预见脑科学未来不同时期的发展需求,为我国脑科学长期发展及其战略规划提供参考建议。  相似文献   

9.
[目的/意义]随着战略型新兴技术产业的迅猛发展,如何识别具有潜在协同效应的技术创新组合、厘清组合中核心的创新关系,是有效规划产业发展路线、提升产业竞争优势的重要前提。[方法/过程]在技术组合进化理论的指导下,结合深度学习、SAO语义挖掘和CFDP算法,提出一种基于专利数据的技术创新组合与演化关系的识别方案。该研究方案共分为3个步骤:首先基于关键词与专利分类号构建领域检索策略,并实现对获取数据的清洗和分词。随后,通过Word2Vec构建领域技术主题的词向量语义网络,并利用CFDP算法识别出潜在创新要素及组合方式。最后,深入挖掘各组合中核心的SAO结构,通过LSTM深度学习算法对其演化关系进行分类,挖掘技术的核心创新方式,进而有效甄别领域潜在的技术机会。[结果/结论]以语音识别领域为例,通过对该领域DII专利文本数据的深入挖掘,识别并追踪5个潜在的技术创新组合及核心创新方式。研究发现,当前我国语音识别领域在智能芯片设计、语音识别算法、新场景和应用等方面有较大的创新潜力。  相似文献   

10.
[目的/意义]面对世界范围内各种思想文化交流、交融、交锋的新形势,深入挖掘国际传媒研究热点,对促进我国传媒领域的学术发展与学科体系完善具有重要意义。[方法/过程]本文以Web of Science数据库中2015—2019年传媒类期刊文献数据为基础,结合概率主题模型、文献计量方法以及自然语言处理技术对文档内容和元数据进行联合建模,构建国家-主题分布矩阵,较为全面地挖掘了近五年来国际传媒研究的地理分布与知识结构,最终落脚于国内传媒领域研究的热点主题分析。[结果/结论]研究结果表明,数字技术推动新媒体蓬勃发展,不断刺激传媒领域的产业升级与文化重塑。我国部分主题在理论研究、产学交流、学科融合等方面仍存在探索与提升的空间,需要在重视理论研究与应用研究、基础学科与新兴学科协同发展的基础上,开展符合国内需求、具有国际视野的传媒研究,为传媒领域的持续深入发展添砖加瓦。  相似文献   

11.
[目的 /意义]面向语义信息以层次渐进的方式识别技术演化轨迹,有助于加强对技术细节的理解并提升轨迹识别的准确性.[方法/过程]首先,提取专利和科技论文的SAO结构,依据语义信息确定研究主题,并利用S曲线分析技术生命周期.其次,借助机器学习算法与社会网络分析指标,分不同周期,通过多层次提取,筛选技术演化轨迹.最后,以造血...  相似文献   

12.
陈忻  房小可  孙鸣蕾 《山西档案》2021,(1):80-87,79
【目的/意义】目前针对社会记忆构建的具体方法较少,尚不足以揭示红色记忆中的细粒度关系,利用自然语言处理技术与主题挖掘方法可以挖掘红色档案编研成果中的细粒度关系,有利于红色记忆的重构并对社会记忆构建方法实现有效补充。【方法/过程】本文选取北京香山革命纪念馆红色档案编研成果作为研究对象,对其进行预处理;立足于语义层面及主题层面,通过LDA模型对其展示成果中的五个红色篇章分别深入进行主题挖掘;通过命名实体识别及主题相似度计算的方法抽取其概念、关系与属性,最后构建篇章本体进行可视化展示。【结果/结论】文章利用主题模型对红色档案编研成果进行细粒度挖掘,进而进行本体构建,从而体现其中细粒度关联,实现社会记忆构建,力求实现记忆的映射和更好的呈现以加强档案资源的开发与利用。  相似文献   

13.
[目的 /意义]重大突发事件网络舆情在传播过程中往往会出现不同的主题,而微博用户对不同主题的表达和关注也会直接影响网络舆情的传播速度和规模以及舆情事件的走向。针对重大突发事件的微博用户主题演化分析有助于应急管理部门更好地理解重大突发事件的发展轨迹以及公众在不同阶段的关注点,以便采取有效应对措施。[方法 /过程]以网络舆情信息特征为立足点,辅以自然语言处理技术将舆情信息客体与本体进行剥离,结合重大突发事件特征,创新性提出以舆情客体信息为参照基线的舆情本体演化强度来反映微博主题演化趋势。[结果 /结论 ]研究结果表明,面向网络舆情信息本体的主题分析,与网络舆情实际发展演化趋势更加贴近,对主题内容的揭示也更加全面。同时研究思路也对现有网络舆情主题分析的研究方法中单一求助于自然语言处理技术的优化与更新具有一定启示意义。  相似文献   

14.
[目的/意义]非物质文化遗产资源具有重要的社会价值,将主题图技术应用于非物质文化遗产数字资源的整合中,能够更好地实现非物质文化遗产数字资源的传承与保护。[方法/过程]在分析非物质文化遗产数字资源的主题、关联关系和资源标引的基础上,构建非物质文化遗产数字资源主题图并实现其可视化。[结果/结论]研究结果显示,主题图技术的应用可以为非物质文化遗产数字资源提供基于语义的整合,并将主题之间的关联直观地展示给用户,为用户提供可视化导航。  相似文献   

15.
[目的/意义]主题排序不仅是信息检索、信息组织研究的基础性问题,也是图书馆学科服务的重要工作,对学科领域研究主题进行有效排序能够帮助科研人员和科研管理部门有效把握学科领域的研究态势,准确定位科研方向,快速做出科研决策。[方法/过程]基于趋势分析提出一种学科研究主题优先级排序算法。首先,在主题提取的基础上,根据发文趋势和引文趋势将每个研究主题按研究等级分为贫乏主题、热点主题、冷点主题、过热主题4个子类。然后,分别对各子类下的主题词进行优先级排序。[结果/结论]在情报学领域的实验表明:本文提出的优先级排序算法能够全方位、细粒度、深层次地展示学科领域研究主题的发展等级,该方法可为从时间维度实现动态情报分析提供新的视角。  相似文献   

16.
黄颖  叶冬梅  丁凤  徐畅  张琳 《图书情报工作》2022,66(22):142-154
[目的/意义] 开展面向特定技术领域的技术演化路径识别,有助于梳理技术发展脉络进而对未来的技术发展方向做出合理预测,对识别科技优先领域、合理配置科技资源具有重要意义。[方法/过程] 在梳理技术演化与技术演化路径的相关内涵的基础上,简要辨析了技术演化路径相关概念;进而从专利文献中的不同信息出发,从专利分类、专利引文、专利文本以及融合多种字段信息来总结技术演化路径识别研究的主要进展,并进一步归纳出该主题的整体发展趋势。[结果/结论] 技术演化路径识别研究主要趋势包括:数据来源从单一数据转向多源异构数据融合,研究方法从注重定量转向定性与定量相结合,关注视角从历史演化路径识别转向未来演化路径预测,应用场景由一般性技术到颠覆性技术转变。  相似文献   

17.
基于自然语言词对法的文献主题新颖性探测研究   总被引:1,自引:0,他引:1  
[目的/意义] 提出一个全新的量化指标--文档主题新颖度,通过自然语言词对方法对文献主题内容的新颖性进行探测研究,并探讨其可行性和优缺点以及新颖度与F1000推荐文献和引文指标之间的关系。[方法/过程] 以F1000为基础,选取hematology主题近一个月内推荐的文献,在Pubmed中查找并获取该推荐文献发表之前6个月内密切相关的文献,构成整个文献集。定义自然语言法新颖度的概念、计算公式并利用Oracle数据库PL/SQL语言进行编程,通过MetaMap软件提取自然语言词汇进行文献主题新颖度的运算。[结果/结论] 自然语言法在文献主题新颖性探测的运算上具有一定的可行性;文档主题新颖度与F1000推荐文献、引用情况并非成等价关系,分属于科技论文评价的不同维度、不同范畴,不可一概而论。应将文档主题新颖度这一新指标与同行评议情况和文献计量学等其他相关论文评价指标结合起来对文献进行综合评价分析,选取优质文献给予推荐。  相似文献   

18.
[目的/意义] 技术主题图是进行技术布局分析、技术路线跟踪的有效方法之一。为提高技术主题图绘制效率,增强技术主题图表现形式,丰富科技情报分析人员选择技术主题图绘制工具范围。[方法/过程] 提出一种简易的技术主题图绘制方法,融合Fruchterman-Reingold layout和VosMapping算法进行主题词的平面布局,建立平面像素点密度函数,依据密度值进行色彩渲染,得到技术主题图。[结果/结论] 基于该方法设计软件工具,分为数据处理模块、节点布局模块、图形渲染模块、人机交互模块。将该方法应用于3D打印中国论文数据进行实证应用,结果表明该方法简单有效。  相似文献   

19.
宁子晨  魏来 《图书情报工作》2020,64(12):106-117
[目的/意义] 专利文献与学术论文分别表现了技术创新与科学研究的新进展,通过专利主体将二者结合进行技术主题演化分析,对进一步发现专利技术与科学研究间的关系有一定的参考意义。[方法/过程] 以数据挖掘领域的学术型发明人为纽带,从专利主体-关键词耦合、IPC耦合以及IPC-关键词共现3个角度,提出关联方法并构建研究框架,分析不同时间段下主体、技术及主题多维关联关系的演化,探究数据挖掘领域内专利文献与学术论文的主体、主题关联关系。[结果/结论] 学术型发明人在数据挖掘技术创新中的作用越来越重要,大多主体的技术主题是相近的,部分甚至呈现高度的统一,但是也存在少数技术与主题不直接相关,差异度较大,但不论技术与主题是否直接相关,数据挖掘相关技术发明与科学研究都已经实现了较为深入的相互渗透。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号