首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
[目的/意义] 学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法/过程] 提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果/结论] 通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。  相似文献   

2.
[目的/意义]随着战略型新兴技术产业的迅猛发展,如何识别具有潜在协同效应的技术创新组合、厘清组合中核心的创新关系,是有效规划产业发展路线、提升产业竞争优势的重要前提。[方法/过程]在技术组合进化理论的指导下,结合深度学习、SAO语义挖掘和CFDP算法,提出一种基于专利数据的技术创新组合与演化关系的识别方案。该研究方案共分为3个步骤:首先基于关键词与专利分类号构建领域检索策略,并实现对获取数据的清洗和分词。随后,通过Word2Vec构建领域技术主题的词向量语义网络,并利用CFDP算法识别出潜在创新要素及组合方式。最后,深入挖掘各组合中核心的SAO结构,通过LSTM深度学习算法对其演化关系进行分类,挖掘技术的核心创新方式,进而有效甄别领域潜在的技术机会。[结果/结论]以语音识别领域为例,通过对该领域DII专利文本数据的深入挖掘,识别并追踪5个潜在的技术创新组合及核心创新方式。研究发现,当前我国语音识别领域在智能芯片设计、语音识别算法、新场景和应用等方面有较大的创新潜力。  相似文献   

3.
为支持科技知识创新,科技创新路径识别已经成为情报学研究的热点主题。在梳理科技创新路径识别研究的数据源、研究方法以及可视化工具研究现状的基础上,重点分析基于关键词或者主题词识别和基于引文全文的语义分析识别两种主要的科技创新路径识别方法,并对Sci2、HistCite、CiteSpace以及VOSviewer 4种可视化工具进行比较分析,进而指出基于引文分析的科技创新路径识别研究面临的挑战并展望其在数据集、研究方法、研究技术以及研究结果方面的未来发展趋势,以期为科技创新路径识别研究提供支持和帮助。  相似文献   

4.
祝娜  王芳 《图书情报工作》2016,60(5):101-109
[目的/意义]科技创新需要快速发现特定科技领域中关键知识衍生与演化的路径,探索未来的知识创新趋势,为此,有必要对知识演化路径进行动态可视化研究。[方法/过程]从主题关联的角度入手,以3D打印领域为例,基于LDA识别出科技创新主题并进行分阶段细化分析,探测主题集群内部与外部的关联强度,识别出主题不同生命周期的演化能力及其演化类型。[结果/结论]实验结果表明,该方法从主题关联的角度入手,构建了基于时间序列的知识演化路径,丰富了知识管理和信息计量的理论研究方法,在实践上则有助于探测科技创新知识。  相似文献   

5.
[目的/意义]改善现有专利技术主题分析方法主题辨识度低、主题词二义性、无法识别技术信息中的"问题"与相应"解决方案"等问题。[方法/过程]本文通过抽取专利文本中的SAO结构,并从SAO结构中识别"问题和解决方案"(P&S)模式,基于"bag of P&S"假设,构建基于"主语-行为-宾语"(subject-action-object,SAO)结构的LDA主题模型,实现对专利文献主题结构的识别和分析。[结果/结论]案例研究表明,该方法能够有效识别主题分布,并在主题辨识度和语义消岐方面较传统LDA模型具有较大优势。  相似文献   

6.
[目的/意义]分析技术主题演化过程可以梳理技术发展脉络,对于发展创新、预测技术发展趋势具有重要意义,但是从语义角度分析技术主题演化轨迹的研究较少。因此,从语义的角度出发,分析技术主题演化过程。[方法/过程]提出基于非负矩阵分解的改进的动态非负矩阵分解模型对专利文本进行动态主题建模,并利用TextRank算法抽取名词短语进行标注,增强所抽取技术主题的可解释性。在此基础上,利用词向量的方式计算技术演化轨迹,并进行可视化展示。[结果/结论]对2002年、2005年、2008年、2011年和2014年的五方专利进行实证分析,识别出65个技术主题及其演化轨迹,表明方法的可行性。  相似文献   

7.
面向TRIZ的领域专利技术挖掘系统设计与实践   总被引:1,自引:0,他引:1  
[目的/意义] 针对面向TRIZ的专利技术深度、精准挖掘的需求,设计并开发一套领域专利技术挖掘系统。[方法/过程] 首先,归纳面向TRIZ的专利技术挖掘的具体需求,分析现有工具的不足。其次,提出领域专利技术挖掘系统的体系结构,总结其关键技术及解决方案。最后,开发一套面向TRIZ的领域专利技术挖掘原型系统,并进行大口径光学元件(LAOE)领域专利技术挖掘实践。[结果/结论] 该系统基于SAO(subject-action-object)三元组与简单知识对象,集成文本挖掘技术构建细粒度、多维度的领域技术索引,实现领域知识棱镜、面向TRIZ的语义检索与专利可视化分析功能,可以支持深度、精准的专利技术挖掘应用。  相似文献   

8.
[目的/意义] 由于传统科技创新主题概率识别方法忽略文本内容语义理解,为了更加准确地识别出主题,科技创新主题语义识别势在必行。[方法/过程] 提出一种基于LDA的科技创新主题语义识别方法,利用语义角色标注技术对科技文献中的科技创新内容进行语义标引,构建LDA主题语义识别模型,根据表征科技创新内容的关键词语义角色对应的上位词的概率识别出科技创新主题。[结果/结论] 通过以3D打印领域数据为对象进行实验,证明该方法能够更加准确地识别出科技创新主题,形成科技创新主题-主题词-科技文献的混合分布聚类集群,减少研究背景等无关数据干扰,避免语义含义相同的科技创新主题词重复统计问题。  相似文献   

9.
[目的/意义] SAO是一种能够表示主题信息和主题间关系的3元组结构,是文献计量学领域一个快速发展的研究方向。为了获得“满足文献计量分析需求的SAO结构”,需要解决现有SAO结构识别方法遭遇的3个问题:查全和查准率低、所识别SAO结构和领域主题相关性不强以及矩阵稀疏性。[方法/过程] 提出一种面向文献计量分析的基于语法树的SAO结构识别方法,首先基于共现算法和“主题词簇”方法(term clumping)识别SAO核心组件,然后利用基于语法树的抽取算法实现SAO结构的逐层抽取。[结果/结论] 案例研究发现,该方法的平均查准率为0.805 8,平均查全率为0.844 6,所识别SAO结构与领域主题关系较强,且矩阵稀疏性也得到较好改善,可有效应用于相关文献计量分析。  相似文献   

10.
林杰  苗润生 《情报学报》2020,39(1):68-80
专业社交媒体中主题图谱的内容包括论坛中的主题及主题之间的关系,其具有挖掘专业产品创新方向、构建专业知识索引等重要应用价值。本文基于深度学习技术与文本挖掘技术,提出了专业社交媒体中的主题图谱构建方法。首先,使用专业社交媒体中的文本训练Skip-Gram模型,利用该模型的隐藏层权重与模型输出的预测结果,分别获取词语间的语义相似度与上下文关联度。其次,基于该语义相似度与上下文关联度,对已有领域种子本体词汇进行扩充,将语义相似或上下文相邻近的词汇纳入本体词汇,为主题抽取提供高质量的领域词汇。然后,基于扩充的专业本体词汇,使用结合本体词汇的LDA主题模型从专业社交媒体文本中抽取主题与主题词。最后,利用语义相似度与上下文关联度,定义关联度权重,通过图模型与谱聚类,获取主题间与主题词的关联关系与层次结构。本文使用汽车论坛语料进行主题图谱生成实验。实验结果表明,本文方法获取的主题词纯净度相比单独使用LDA模型提升了20.2%,且能够清晰合理地展现主题之间的关系。  相似文献   

11.
[目的 /意义]面向语义信息以层次渐进的方式识别技术演化轨迹,有助于加强对技术细节的理解并提升轨迹识别的准确性.[方法/过程]首先,提取专利和科技论文的SAO结构,依据语义信息确定研究主题,并利用S曲线分析技术生命周期.其次,借助机器学习算法与社会网络分析指标,分不同周期,通过多层次提取,筛选技术演化轨迹.最后,以造血...  相似文献   

12.
文章首先辨析了数字资源保存的概念,介绍了数字资源保存的发展史和国内外研究现状。然后利用CitespaceⅡ可视化分析工具和方法构建领域知识基础(指引文)的时间序列演化图谱和时区演化图谱,并结合绘制的领域发展趋势图,分析了数字资源保存的研究进展。同时利用CitespaceⅡ可视化分析工具和方法绘制术语与关键词的混合共现网络和引文共被引聚类知识图谱,识别出数字资源保存的研究热点U,并利用爆发词或突变词探测方法探测数字资源保存的研究前沿。最后针对图书情报与档案管理学科关注最多的研究热点——数字资源长期保存,从研究主题、最佳实践、保存周期、保存技术和方法、保存策略等几个重要方面解读数字资源长期保存的研究进展。  相似文献   

13.
[目的/意义]为全面、客观、高效、直观地掌握科技领域主题的发展规律和演变趋势,提出一种基于多源数据的领域主题演化路径识别和分析框架。[方法/过程]获取不同来源的科技文献数据,利用多维样本有序聚类方法辅助时间切片,基于改进的词袋构建方法,提升LDA模型主题识别效果,借助Louvain社区发现算法在主题层进行多源数据的融合,分析领域主题演化路径。[结果/结论]利用美国太赫兹研究领域基金项目、论文和专利3种来源的数据进行实证研究,结果表明,3种数据源能够清晰划分出4个时间窗口,改进的词袋构建方法能够表征更准确的领域信息内涵,主题社区有助于从多源数据复杂的演化网络中厘清主题演化脉络。  相似文献   

14.
杨中楷 《情报工程》2016,2(2):008-017
通过获取混合动力汽车驱动系统技术领域的专利属性数据和引用关系数据,应用前期研究所形成的识别算法与可视化方法体系,绘制专利引文网络可视化图谱并从中识别技术演进路径,综合数据资料对技术演进路径图谱进行解读,展示混合动力汽车驱动系统技术发展的历史脉络,识别新技术演进路径的产生可能性与发展方向.对我国相关领域的发展战略提供决策参考.  相似文献   

15.
赵华茗  钱力  余丽 《图书情报工作》2020,64(11):108-115
[目的/意义] 探索科研命名实体及其关系的识别与抽取,提升其在长句等复杂情况下的识别效果,为进一步的应用提供参考与借鉴。[方法/过程] 以依存句法特征分析为基础,提出一种科研命名实体关系抽取方法,过程包括:①使用Standford Tagger工具对目标文本进行词性标注;②基于标注结果,围绕核心谓词和SAO结构,将目标文本分割为结构规范的语义片段;③通过依存句法分析,找出与核心谓词语义相关的主语和宾语,构成(实体,关系,实体)三元组。[结果/结论] 与Ollie、Reverb等主流算法进行的对比测试表明,该方法可以有效提升科研命名实体识别的准确性。  相似文献   

16.
[目的/意义] 从数字人文视角出发,实现敦煌吐鲁番医药文献的数字化及知识组织与可视化,为敦煌吐鲁番医药文献的传承、普及与智能化服务做出贡献。[方法/过程] 采用自顶向下方法,参考BIBFRAME书目模型及中医药学语言系统(TCMLS)构建敦煌吐鲁番医药文献本体模型,利用哈工大语言技术云平台LTP实现词性标注与三元组自动抽取,构建敦煌吐鲁番医药文献知识图谱。[结果/结论] 利用所构建的本体及知识图谱可实现敦煌吐鲁番医药文献知识组织工作,知识图谱能够实现语义查询,为敦煌吐鲁番医药文献的智能化理解奠定基础。  相似文献   

17.
[目的/意义]识别领域发展路径对于科技创新具有重要意义,但现有方法如专家访谈、引文分析等不能适应文献爆发性增长的现状,针对这一问题,提出一种基于主题变迁的领域发展路径识别方法。[方法/过程]该方法可以自动从Aminer平台获取数据,通过构建关键词-学者矩阵,综合使用KMeans++和谱聚类算法识别出研究主题和相关学者;通过相似度计算实现不同主题之间的关联,最终获得研究领域的发展路径并进行可视化展示。[结果/结论]通过对人工智能领域的实证分析,结果表明该方法能够有效反映领域研究主题的变迁,有助于研究者快速定位领域的研究热点和重点,丰富领域发展路径相关的研究方法。  相似文献   

18.
[目的/意义]随着信息资源在数量和种类上的急剧增长,学科间的交叉融合不断涌现,快速主动地从海量信息资源中识别和判断研究主题的发展演化是实现科技创新的基础。[方法/过程]在相关理论调研的基础上,结合医学领域的资源特点,提出一种基于LDA模型的主题演化探测模型和相应的流程步骤。主要步骤包括医学主题词抽取、主题识别、主题关联、关键主题识别、关键主题的演化主路径识别、演化主路径上主题分裂、融合事件识别,实现深度、细致的主题演化分析。[结果/结论]选用乳腺癌治疗研究文献为实验案例,对判断模型进行试验并对结果进行分析验证,证实提出的技术方法具有一定的可靠性。  相似文献   

19.
探测、识别某学科领域研究主题的演化过程并进行可视化分析,对于掌握研究现状和发展趋势具有重要意义。学科主题演化是一个复杂过程,存在多种变量,如主题强度、结构和内容等,目前研究主要以单一维度进行可视化分析,信息负荷过大,存在感知局限性。本文提出多维度视角下学科主题演化可视化分析方法:通过人工标注方法对  相似文献   

20.
文章明晰技术功效间的多种语义联系,设计技术实现路径的自动化构建方法,实现其即时更新和可视化。结合专利数据特点,基于规则从专利标题中抽取技术词,利用BiLSTM-CRF深度学习模型从专利摘要中抽取专利功效短语,并设计规则从功效短语中自动识别出功效词以及表示技术功效间语义联系的关系词,构建“技术词-关系词-功效词”结构的技术功效语义关联,通过计算实体间语义相似度实现技术词对齐和功效词对齐,优化技术功效关联,依此构建技术实现路径,并以知识网络的形式对其进行可视化。在5G技术领域的实证结果表明,该方法能有效揭示技术功效间的多种语义联系和自动构建技术实现路径,并实现路径的即时更新和清晰展示。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号