首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 515 毫秒
1.
许鑫  李倩  衣春波  樊亚鑫 《图书馆杂志》2023,(9):103-112+128+136-137
科技竞争时代,技术机会的识别和挖掘为科技研发方针和政策的制定奠定重要基础。本文提出基于链接预测的量化方法,将技术机会识别任务转化为技术元素之间是否能产生共现联系的二分类问题,为技术机会识别提供详细的数据辅助和支撑。获取隐私保护领域的专利数据,构建IPC共现网络并训练图神经网络模型GraphSAGE,得到链接预测分数后分别从强化型、新生型和衰退型链接3个角度识别持续发展的技术机会、突破创新的技术机会以及寻求转型的技术机会,最后基于识别得到的技术机会展开分析并提出建议。  相似文献   

2.
[目的 /意义]技术机会识别是企业技术创新活动得以顺利开展的重要前提,及时发现和把握有价值的技术机会对技术创新突破意义重大。[方法 /过程]从主题挖掘与专利评估的视角提出一种技术机会识别方法,首先应用主题模型识别技术领域涵盖的技术主题并进行专利聚类;其次在技术主题层面展开细粒度分析,综合考虑技术机会应具备前沿性、价值性和时效性的重要特性,采用突变级数法和离群因子算法评估技术主题中的高价值专利和离群专利形成核心专利集,并计算每个技术主题的专利平均年龄;最后,将技术主题中的核心专利占比和专利平均年龄作为核心指标绘制技术机会识别地图,用于识别技术机会。[结果 /结论 ]以智慧农业领域为例,对所提方法进行实证,识别智慧农业领域的5个技术机会,为创新主体的技术研发提供决策支持。但识别结果的定量验证以及融合多源数据进行技术机会识别有待进一步探索。  相似文献   

3.
考察特定领域文本中蕴含的细粒度知识实体的使用情况,对知识实体的评估和选择具有重要意义。学术文本中的细粒度知识实体通常具有多个类型、多种关联关系,挖掘知识实体的同质与异质关联关系,有助于深入了解特定领域知识实体的实际使用情况。目前相关研究大多针对学术文本中单一知识实体的抽取和评估,缺乏对知识实体间关系的关注,在一定程度上限制了基于实体抽取进行知识发现的能力。文章以自然语言处理领域为例,对学术论文全文中的细粒度知识实体关联数据进行挖掘,并通过可视化方式揭示关联数据中蕴含的信息。主要是选取全国计算语言学会议2009-2018年间收录的中文论文为原始语料,人工标注论文中使用的知识实体,并针对NLP特点将其细分为“指标实体”“工具实体”“资源实体”“方法实体”4种类型;结合关联规则挖掘算法Apriori和复杂网络分析软件构建知识实体关联网络,揭示该领域常用的知识实体,以及这些知识实体的使用相关性。  相似文献   

4.
基于知识元的科技文本内容描述框架研究   总被引:1,自引:0,他引:1  
[目的/意义] 从细粒度角度深化科技文本的内容语义描述,弥补目前文本知识对象特征描述粒度较粗且缺乏语义的不足,为知识重组与挖掘,提供精细化的用户知识服务给予一种思路。[方法/过程] 以知识元理论为基础,通过对科技文本内部属性的语义分析,尝试构建细粒度的科技文本内容描述框架,给出两个实例并讨论。[结果/结论] 该内容描述框架实现了检索结果从海量的文献单元聚焦到精准化的知识元的转变。  相似文献   

5.
当前,针对知识网络的链路预测主要是基于网络拓扑结构的相似性,很少考虑作者的研究领域,导致信息利用不充分等问题,因此本文提出了双层知识网络的链路预测框架hypernet2vec。双层知识网络,即作者合著关系网络和学术领域关系网络,利用网络表示学习,分别将两层网络中的节点映射到低维的向量空间,再输入到专门设计的卷积神经网络中计算并进行链路预测。与经典的链路预测指标如RA指标、LP指标和LRW指标等相比,hypernet2vec模型预测的AUC(area under curve)值取得了显著的提升,平均提升幅度达11.17%。文章还从情报产生层面和复杂系统层面,对模型发生作用的深层机理进行了探讨。  相似文献   

6.
传统编目分类和规则匹配方法存在工作效能低、过度依赖专家知识、缺乏对古籍文本自身语义的深层次挖掘、编目主题边界模糊、较难实现对古籍文本领域主题的精准推荐等问题。为此,本文结合古籍语料特征探究如何实现精准推荐符合研究者需求的文本主题内容的方法,以推动数字人文研究的进一步发展。首先,选取本课题组前期标注的古籍语料数据进行主题类别标注和视图分类;其次,构建融合BERT (bidirectional encoder representation from transformers)预训练模型、改进卷积神经网络、循环神经网络和多头注意力机制的语义挖掘模型;最后,融入“主体-关系-客体”多视图的语义增强模型,构建DJ-TextRCNN (DianJi-recurrent convolutional neural networks for text classification)模型实现对典籍文本更细粒度、更深层次、更多维度的语义挖掘。研究结果发现,DJ-TextRCNN模型在不同视图下的古籍主题推荐任务的准确率均为最优。在“主体-关系-客体”视图下,精确率达到88.54%,初步实现了对古籍文本的精准...  相似文献   

7.
技术机会识别对于研发组织的创新管理具有重要意义,本文以人工智能领域2013—2015年的专利数据为例,提出了一种识别领域内技术机会的新方法。借鉴RFM(recency,frequency,monetary)模型的思路,使用K均值聚类法基于平均出现时间长度、出现频率和组合能力三个指标对知识元素进行聚类,进而发现了能够反映领域内技术发展方向的四个趋势性知识元素。使用随机行动者导向模型对知识网络的演化进行分析,在此基础上提出了发现知识元素的新技术机会的公式,并使用该公式识别出了趋势性知识元素潜在的技术机会。本研究利用人工智能领域2016—2018年的专利数据验证了所提出的方法的有效性,应用3D打印领域2014—2018年的专利数据验证了所提方法的稳健性。  相似文献   

8.
为了丰富专利分类的网络和文本语义表示,实现两者更有效的语义融合,提高技术融合预测效果,提出基于专利分类序列和文本语义表示的技术融合预测方法。首先,综合考虑专利分类位置及其上下文语境,直接对专利分类序列进行语义表示,提出基于专利分类序列语义表示的技术融合预测方法;其次,根据专利分类在序列中的重要性排序研究专利分类文本分配方法,形成基于专利分类文本语义表示的技术融合预测方法;在此基础上,设计多种特征融合方法,提出融合专利分类序列结构和文本内容语义表示的技术融合预测方法;最后,基于链路预测的理论和方法对提出的多种技术融合预测方法进行定量评价。在无人机领域的实验证实,专利分类序列语义表示模型的效果明显优于其他网络表示学习方法;依据重要性排序的专利分类文本赋予方式优于文本平均分配方式,基于此的专利分类文本语义表示能更好地进行技术融合预测;“SVM (support vector machine)+哈达玛积”的特征融合方法在所有方法中表现最优,较单一方法均有提高。本文提出的方法能够提高技术融合预测的效果,更好地为技术布局、技术研发提供借鉴和参考。  相似文献   

9.
[目的/意义]在日趋激烈的国际竞争背景下,颠覆性技术被认为是引领技术和产业发展方向、助推企业和产业实现“弯道超车”的绝佳机会窗口。为此,预测和部署颠覆性技术对于国家抢占科技制高点、重塑价值链均具有重大战略意义。[方法/过程]结合深度学习和离群点检测算法,构建基于离群点视角的颠覆性专利预测框架。该研究框架包括五个关键步骤:首先,利用BERT模型和TF-IDF算法将专利文本和专利分类号转化为可计算的高维向量表示,并结合PCA算法进行降维和特征融合;其次,采用三种离群点检测算法,以增量迭代的方式识别离群专利;再者,通过数据集修正,从离群专利中保留新技术专利;在此基础上,通过深度剖析新技术形式颠覆性专利的核心特征,构建有效的测度指标体系;最后,利用深度学习DNN模型拟合专利指标和颠覆性专利标签之间的关联关系,从而实现从大量的新技术专利中对潜在颠覆性专利的有效预测。[结果/结论 ]以人工智能为例,验证了该方法的有效性。结果共预测出411条颠覆性专利,这些专利主要涉及六大颠覆性方向:多模态预训练大模型、增强现实、生成式AI、自动驾驶、图像识别与处理和智能通信。这些技术的推广和应用,将对未来的科技和...  相似文献   

10.
运用图示法自动提取中文专利文本的语义信息   总被引:1,自引:0,他引:1  
姜春涛 《图书情报工作》2015,59(21):115-122
[目的/意义]提出利用图结构的表示法自动挖掘中文专利文本的语义信息,以为基于文本内容的专利智能分析提供语义支持。[方法/过程] 设计两种运用图结构的模型:①基于关键词的文本图模型;②基于依存关系树的文本图模型。第一种图模型通过计算关键词之间的相似性关系来定义;第二种图模型则由句中所提取的语法关系来定义。在案例研究中,借助频繁子图挖掘算法,对所建图模型进行子图挖掘, 并构建以子图为特征的文本分类器,用来检测所建图模型的表达性和有效性。[结果/结论]将所建的基于图模型的文本分类器应用于4个不同技术领域的专利文本数据集,并与经典文本分类器的测试结果相比较而知:前者在使用明显较少的特征数的基础上,分类性能较后者提升2.1%-10.5%。由此而推断,使用图结构的表达法并结合图挖掘技术从专利文本中所提取的语义信息是有效的,有助于进一步的专利文本分析。  相似文献   

11.
面向网络信息资源聚合搜索的细粒度聚合单元元数据研究   总被引:1,自引:0,他引:1  
由于相关信息片段分散分布在海量且复杂多样的网络信息资源中,用户往往需要花费大量时间浏览、查询和收集所需信息。面向聚合搜索的细粒度聚合单元元数据可以深入揭示信息特征及其关联关系,促进知识发现并提升知识服务效率。因此,有必要构建细粒度聚合单元的元数据描述框架。本文以图书情报领域开放获取期刊论文、在线百科、博客等网络信息资源为数据源,采用逻辑结构分析和形式结构分析方法建立聚合单元划分框架,包括篇章层级的标题、著者等外部特征,以及节段、句群、图表单元中的话语意图和语义功能等特征;通过分析聚合单元的属性特征及复用DC、LOM元数据元素,构建描述聚合单元访问信息、物理信息和语义信息的元数据框架;设计检索数据库并采用实验法对聚合单元元数据框架进行验证。实验表明,该元数据框架可支持多类型网络信息资源、各层级细粒度聚合单元的检索,可为细粒度信息聚合与搜索提供理论基础与实践指导。图7。表6。参考文献58。  相似文献   

12.
国家系列政策的颁布再次强调了知识产权服务工作的重要性,以及"双创"环境下高校在知识产权服务中的重要地位。同时,在人工智能和自然语言处理技术创新发展的推动下,文本挖掘技术为分析和把握专利文本所包含深层次知识要素与技术理念提供了技术手段。本文提出了"双创"环境下高校图书馆专利挖掘服务的内涵及特征,分析了"双创"环境下高校图书馆专利挖掘服务机理框架,对专利挖掘服务组成要素及关系进行剖析,构建了"双创"环境下高校图书馆专利挖掘服务的4种模式,最终提出了服务改进和优化策略:为高校知识创新、科技成果转化创造提供良好环境,更好地发挥高校服务知识产权工作的功能作用,为产学研协同体系的形成与发展提供有效保障,提升我国科技创新水平。  相似文献   

13.
科学知识网络中的链路预测研究述评   总被引:2,自引:1,他引:1  
本文以“科学知识网络中的链路预测”为主要对象,对链路预测的类型、研究思路和方法等相关理论进行了回顾,将知识网络划分为同质网络和异质网络两种类型,从合作网络、引证网络和二分网络三个方面对同质网络的研究进行梳理,并介绍了一些异质网络中的链路预测方法。认为:针对这方面的研究近年来有成为图书情报学领域研究热点的趋势;已有研究多是描述各种链路预测指标在不同类型知识网络中的预测效果,未来应当利用链路预测量化和评价演化模型,识别和分析异常链路,以发现知识热点和创新趋势,将知识网络的研究提升到应用层次。图5。表2。参考文献68。  相似文献   

14.
面向TRIZ的领域专利技术挖掘系统设计与实践   总被引:1,自引:0,他引:1  
[目的/意义] 针对面向TRIZ的专利技术深度、精准挖掘的需求,设计并开发一套领域专利技术挖掘系统。[方法/过程] 首先,归纳面向TRIZ的专利技术挖掘的具体需求,分析现有工具的不足。其次,提出领域专利技术挖掘系统的体系结构,总结其关键技术及解决方案。最后,开发一套面向TRIZ的领域专利技术挖掘原型系统,并进行大口径光学元件(LAOE)领域专利技术挖掘实践。[结果/结论] 该系统基于SAO(subject-action-object)三元组与简单知识对象,集成文本挖掘技术构建细粒度、多维度的领域技术索引,实现领域知识棱镜、面向TRIZ的语义检索与专利可视化分析功能,可以支持深度、精准的专利技术挖掘应用。  相似文献   

15.
[目的/意义]基于网络招聘文本和学科数据,提出"行业-岗位-知识-学科"的人才需求及供给分析框架,以人工智能领域为例进行挖掘与分析,同时对其他领域的人才供需分析也具有借鉴意义。[方法/过程]采集招聘网站中与人工智能相关的职位招聘公告,综合对比CRF、BiLSTM-CRF、BERT-BiLSTM-CRF、BERT模型对招聘文本的实体抽取效果,并运用社会网络分析方法与学科数据进行关联分析。[结果/结论]BERT-BiLSTM-CRF实体抽取实验效果最佳,分别构建"行业-岗位""岗位-知识"以及"知识-学科"3种关系网络,得到与人工智能领域联系最紧密的行业、岗位、知识及学科。该框架能充分地挖掘人才需求现状,并能较精准地将需求定位到人才培养的学科,对于国家发展战略以及高等院校人才培养计划的制订具有现实意义。  相似文献   

16.
目前,专利技术功效图与技术应用图的构造方法主要通过专家或学者的主观判断来对技术、功效或应用进行分类,因此比较耗费人力,结果也不够全面。针对以上问题,提出一种基于文本挖掘的、相对客观的解决方案,首先对专利信息进行文本挖掘并从中提取专利文献中涉及的技术、应用和功效,再由专家对文本挖掘后的结果进行评估以确定较全面、准确的技术、功效、应用的特征,得到的特征将能直接用于统计其对应包含文献数量并最终构造技术功效图与技术应用图。实验结果表明,得到的技术功效等特征比专家预想的特征更全面、准确,技术功效图与技术应用图更加完整。  相似文献   

17.
使用专利文献构建产学研合作网络,有助于识别产学研潜在合作关系,助力各创新主体的有效协同。在网络中引入链路预测和以专利权人专利手工代码(Manual Codes,MC)为单位的耦合分析方法,使用链路预测中的相似性指标计算专利权人的路径相似性,使用余弦距离计算专利权人专利的内容相似性,构建融合路径相似性和内容相似性的加权融合指标。使用AUC (Area Under Curve)确定融合指标权重,在2014—2018年生物制药产业产学研合作网络中进行指标效果检验。实证发现,路径相似性和内容相似性在融合指标中约为1∶9时预测效果最佳,使用最优算法预测出的潜在合作结果可用于支持生物制药产业产学研创新主体对未来合作关系的决策。  相似文献   

18.
文书档案主要以文本形式存储,挖掘这些文本档案潜在的知识价值,是政务服务背景下档案工作的重要任务。论文分析了知识聚合在文书档案知识服务中的价值以及进行预处理的必要性,构建了由文本分解层、关联聚合层和服务应用层组成的文书档案知识聚合模型。依据该模型可实现文书档案由粗粒度的文本分解为细粒度的档案知识元,并由档案知识元聚合为可计算的档案数据集,实现文书档案知识服务的提质增效。  相似文献   

19.
为提高专利价值预测的准确性,促进专利权的转让,围绕如何以专利权转移过程中的专利定价客观评价专利价值,构建了针对单项专利可定量评估的指标体系,克服了专利价值评估中的主观性,使用邻域粗糙集方法排除冗余属性,进行特征选择,采用果蝇算法优化BP神经网络,降低了BP神经网络容易陷入局部极小的风险。通过实证研究发现,构建的专利价值指标体系可对单项专利进行定量评价,果蝇算法优化后的BP神经网络具有比较快速和准确的预测能力,在实际预测中具有良好的泛化能力和有效性。  相似文献   

20.
为提高专利价值预测的准确性,促进专利权的转让,围绕如何以专利权转移过程中的专利定价客观评价专利价值,构建了针对单项专利可定量评估的指标体系,克服了专利价值评估中的主观性,使用邻域粗糙集方法排除冗余属性,进行特征选择,采用果蝇算法优化BP神经网络,降低了BP神经网络容易陷入局部极小的风险。通过实证研究发现,构建的专利价值指标体系可对单项专利进行定量评价,果蝇算法优化后的BP神经网络具有比较快速和准确的预测能力,在实际预测中具有良好的泛化能力和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号