共查询到19条相似文献,搜索用时 203 毫秒
1.
基于本体的专利摘要知识抽取* 总被引:4,自引:0,他引:4
采用知识工程的方法,对“新能源汽车”中文专利摘要进行研究分析,提出了一个基于本体的中文专利摘要抽取模型。通过构建相应的本体、收集相关的词表、撰写相应的规则,并利用这些规则对专利摘要进行知识抽取结果,抽取结果辅助完成专利知识库的自动构建。即就如何组织非结构化信息以及如何自动构建知识库的进行尝试,验证了基于本体对专利摘要进行知识抽取的可行性。 相似文献
2.
3.
文章明晰技术功效间的多种语义联系,设计技术实现路径的自动化构建方法,实现其即时更新和可视化。结合专利数据特点,基于规则从专利标题中抽取技术词,利用BiLSTM-CRF深度学习模型从专利摘要中抽取专利功效短语,并设计规则从功效短语中自动识别出功效词以及表示技术功效间语义联系的关系词,构建“技术词-关系词-功效词”结构的技术功效语义关联,通过计算实体间语义相似度实现技术词对齐和功效词对齐,优化技术功效关联,依此构建技术实现路径,并以知识网络的形式对其进行可视化。在5G技术领域的实证结果表明,该方法能有效揭示技术功效间的多种语义联系和自动构建技术实现路径,并实现路径的即时更新和清晰展示。 相似文献
4.
目前,专利数量快速增长,单纯依靠人工进行专利查阅,很难及时获取专利中的创新资源。实体作为知识的一种,是目前最能直接体现专利的知识。实体识别除了专利独有的技术词、功效词抽取,还有在其他领域通用的命名实体等信息的提取。并且随着计算机技术的创新,大量学者将现代科学技术方法投入到专利文本知识挖掘中。因此,如何从海量专利文本中挖掘有价值的知识成为专利领域研究的新契机。旨在总结专利文本实体种类以及其抽取方法,并从研究对象、技术过程等角度来阐述现状,探索专利文本实体识别工作的新方向。 相似文献
5.
6.
目前,专利技术功效图与技术应用图的构造方法主要通过专家或学者的主观判断来对技术、功效或应用进行分类,因此比较耗费人力,结果也不够全面。针对以上问题,提出一种基于文本挖掘的、相对客观的解决方案,首先对专利信息进行文本挖掘并从中提取专利文献中涉及的技术、应用和功效,再由专家对文本挖掘后的结果进行评估以确定较全面、准确的技术、功效、应用的特征,得到的特征将能直接用于统计其对应包含文献数量并最终构造技术功效图与技术应用图。实验结果表明,得到的技术功效等特征比专家预想的特征更全面、准确,技术功效图与技术应用图更加完整。 相似文献
7.
李昕 《中国科技资源导刊 (中国信息导报)》2008,40(2):52-56
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识),它提供了一条从浩瀚信息堆积中抽取出与用户相关信息的一条思路。本文分析了信息抽取的主要概念、信息抽取的现状及类型,提出了在数字图书馆的建设中,信息抽取技术在数字内容的自动标引、数据获取、数据挖掘、情报研究分析、参考咨询等方面发挥重要的作用。 相似文献
8.
李昕 《中国科技资源导刊》2008,40(2)
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识),它提供了一条从浩瀚信息堆积中抽取出与用户相关信息的一条思路.本文分析了信息抽取的主要概念、信息抽取的现状及类型,提出了在数字图书馆的建设中,信息抽取技术在数字内容的自动标引、数据获取、数据挖掘、情报研究分析、参考咨询等方面发挥重要的作用. 相似文献
9.
从信息分析的实际需求出发,对与电动汽车相关的5 405条专利数据进行术语抽取、生僻术语识别和字段比较研究。结果显示关键短语抽取的方法可行,互信息抽取的术语所在文档的平均文档长度更接近集合的平均文档长度;摘要和First Claim字段的术语存在一定差别,但对分类或聚类同等重要;生僻术语识别算法能够发现生僻词和高频词的对应关系。研究结论可以为专利文本挖掘和专利信息分析提供结果和方法,并为信息分析工作提供所需的参考术语。 相似文献
10.
基于深度标引的专利文本挖掘框架研究 总被引:1,自引:1,他引:0
专利文献中的文摘、权利要求项、全文等文本信息蕴涵了重要技术细节和技术保护等内容,从这些专利文本内容中挖掘具有技术价值、商业价值的潜在信息是当前专利信息应用领域的研究热点.文章研究将面向分析目标的专利文本深度标引应用到专利文本挖掘中,在数据预处理阶段就将分析目标作为知识抽取的基础,专利分析人员可依据分析需求,在文本挖掘时只提取标引结果的某一部分进行分析和处理,这不仅可提高专利文本挖掘的数据预处理质量,也可提高后期文本分析的效率.该文为<数字图书馆论坛>2008年第11期本期话题"科技创新中的专利应用研究"的文章之一. 相似文献
11.
[目的/意义] 以数据集成过程中异构信息的集成为研究目标,在保证文献综合集成系统对信息提取的准确性要求的基础上,以资源环境学科为例,提出一种异构信息的标准化处理方式。[方法/过程] 采用团队自建的资源环境学科知识本体为依据,通过对资源环境学科异构信息在地理空间、时间单位及属性提取中的标准化分析,提出异构信息标准化处理的思路,指导搭建实现信息集成、支持综合集成的人机交互的文献综合集成平台。[结果/结论] 最终主要针对不同数据格式、不同来源的文献进行知识格式化提取及处理,完成文献综合集成的数据准备阶段的工作。异构信息标准化处理仅仅是知识发现过程的起点,后续将重点关注标准化的信息统计分析及可视化展示,完整实现文献综合集成的知识发现过程。 相似文献
12.
信息抽取在竞争情报中的应用研究 总被引:1,自引:1,他引:1
简要介绍信息抽取的特点和抽取的信息类型,概述信息抽取技术在竞争情报中的应用;在此基础上,提出基于信息抽取技术的竞争情报系统的体系架构,主要包括信息抽取引擎、数据转换与集成、数据清洗、数据装载等,研究信息抽取引擎中封装器的实现方式,并从系统采用的机制和方式、系统功能侧重点、系统的自动化程度等方面分析国外基于信息抽取技术的竞争情报系统的特点。 相似文献
13.
14.
信息抽取技术及其在数字图书馆中的应用前景分析 总被引:18,自引:1,他引:18
张智雄 《现代图书情报技术》2004,20(6):1-5
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识) , 它提供了一条从浩瀚的信息堆积中抽取出与用户相关的信息的一条思路。文章分析了信息抽取的主要概念、主要研究活动、信息抽取的类型和信息抽取系统的一般结构, 并提出在数字图书馆的建设中, 信息抽取技术能够在数字内容的自动标引、元数据获取、数据挖掘、情报研究分析、大型知识库数值库建设、参考咨询等方面发挥重要的作用。 相似文献
15.
大数据背景下发掘档案社会化媒体信息资源,既是档案信息化建设中的战略性步骤,也是有效开发与利用的必然选择。档案社会化媒体的信息组织和信息服务值得探讨:对档案社会化媒体信息组织的元数据构建开展研究,建立档案社会化媒体信息的元数据及分类设计方法,构建档案社会化媒体信息整合的元元数据设计;对档案社会化媒体数据集成的整合系统架构开展研究,组成采集工具、分析工具、检索引擎和数据信息展示平台的档案社会化媒体信息整合系统架构,优化整合中的信息抽取、重复性分析和关联度分析技术。 相似文献
17.
Web抽取技术在数字图书馆中的应用 总被引:2,自引:0,他引:2
从Web页面中挖掘有价值的信息是数字图书馆技术应用的一个重要方式。目前Web页面信息描述大多教是用XML表示的,Web数据抽取技术是Web信息挖掘的关键,文章提出了一种面向HTML或XML描述的web页面的web数据抽取模型并阐述了实现过程。 相似文献
18.