首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
典型关系抽取系统的技术方法解析   总被引:3,自引:0,他引:3  
实体关系抽取是信息抽取领域中的一项重要任务.文章在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:以模式构造和匹配为主线进行关系抽取、以词典驱动关系抽取、运用机器学习算法进行关系抽取、借助Ontology进行关系抽取以及多种方法有机结合进行关系抽取.从技术应用特点、核心模块的实现细节以及系统评测结果等方面深入分析了典型的关系抽取系统,它们包括EEES关系抽取系统、SVM关系抽取系统、T-Rex关系抽取系统、KMI语义网络门户的混合关系抽取系统,旨在为进一步构建实体关系抽取系统提供良好借鉴.该文为2008年第9期本期话题"知识抽取"的文章之一.  相似文献   

2.
生物医学领域文献指数级增长亟需快速识别出领域内核心且关键的语义关系,开展领域知识发现研究。本文借鉴DisGeNET基于规则的关系得分方法设计思想,在专家咨询基础上,提出生物医学领域语义关系具有可靠性、重要性和新颖性3种属性,设定每种属性对应的指标及定量计算方法。通过分析结直肠癌领域关系计算结果,验证本文所提关系得分方法在关系重要性排序方面的有效性。该方法考虑维度更加全面,为生物医学领域知识图谱构建、知识发现等提供有益参考。  相似文献   

3.
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。  相似文献   

4.
基于关联数据的知识组织深度序化机制研究   总被引:1,自引:0,他引:1  
戎军涛 《图书情报工作》2015,59(13):134-141
[目的/意义] 从关联数据在知识组织与控制中的应用为切入点,进一步揭示基于关联数据的知识组织深度序化机制,促进关联数据技术在知识组织、知识发现领域的应用。[方法/过程] 通过系统分析法提出"三位一体"的语义组织框架,分析基于关联数据的知识组织语义序化机制,并以机构知识库关联数据的构建发布为例说明语义序化机制具体实现路径。[结果/结论] 本体与关联数据驱动的语义检索服务体现了基于关联数据的知识组织深度序化机制。研究表明,关联数据作为轻量级的语义网实现方式,为知识组织的深度序化提供了语义化的技术、方法、工具和实现路径,为知识发现、知识推理提供了基础。  相似文献   

5.
[目的/意义]文章对科技政策隐性扩散路径自组织方法进行研究,挖掘科技政策文本包含深层语义信息,将隐性知识显性化,为科研人员拓展和丰富政策扩散路径研究提供参考。[方法/过程]本文结合科技政策篇章文本的形式语义和内容语义两个方面对政策文本结构化处理和深度挖掘,对政策文本资源全解析,抽取科技政策文本中包含的特征,其中包括概念和关系自动获取与标引技术、网络表示学习,挖掘科技政策文本中的隐含结构信息,利用BiLSTM-CRF模型的深度学习方法实现概念的自动获取和自动标引关系。将得到多篇科技政策文本的概念和关系组成概念关系对的形式,借助于表示学习的方法发现每个节点稠密的向量表示。[结果/结论]通过实验验证,证明了本文借助隐性路径特征的科技政策扩散隐性路径自组织方法的有效性,在一定程度上拓展了政策研究的方法,为科研人员在政策扩散研究上提供了参考。  相似文献   

6.
实体关系抽取的技术方法综述*   总被引:3,自引:0,他引:3  
对实体关系抽取研究以MUC和ACE评测为主线的发展进行总结,并指出实体关系抽取任务普遍存在的三个问题是特定领域标引数据集的获取、模式的获取以及共指消解。在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:基于模式匹配的关系抽取、基于词典驱动的关系抽取、基于机器学习的关系抽取、基于Ontology的关系抽取以及混合抽取方法,旨在为进一步构建实体关系抽取系统提供良好借鉴。  相似文献   

7.
在跨学科知识范式下,数字人文的研究范畴随着自身学科体系的拓展而不断泛化,采取关键语义技术解析文化对象中的人文内涵与情感知识对于重拾学科“人文性”与“计算性”特质具有重要意义。本文以古诗文本为例,面向汉语诗文及其鉴赏实现大规模人文情感术语的自动化抽取与分析。首先在无标注集环境下提出一种基于“冷启动”的字序列自动标引方法来获取学习语料,随后在字向量(Char2Vec)指导下将汉字特征(部首、拼音等)和BERT语言学模型分别引入机器学习与深度学习模型,并从知识发现的角度定义新术语识别规则。研究发现,将现代鉴赏融入古诗原文显著优化了情感知识的广度与深度,领域术语能够被有效标引。训练的BERT-BiLSTM-CRFs深度学习模型的效果明显优于CRFs机器学习,最佳F1与F1_distinct可分别达到9563%和8543%;同时汉字特征的引入也有效提升了传统CRFs效果,以领域特征和基于“竖心旁”“心字底”部首约束特征为最优。相较于机器学习抽取出的长篇幅新术语,深度学习能够拓展出更多寄托情感知识的新意象词。源于诗文与鉴赏的情感术语为文学信息资源的情感分析与知识服务提供了参考(人文性),基于汉字语言特征的抽取方案为中文领域自然语言处理技术的深化提供了启迪(计算性)。图11。表6。参考文献30。  相似文献   

8.
针对传统的竞争情报分析方法无法实现对目标信息进行深入挖掘分析,获取企业所需的深层情报知识,本文将数据挖掘技术融入竞争情报分析之中,构建了基于数据挖掘的企业竞争情报分析模型.该模型利用竞争情报领域本体指导目标信息的采集、语义分析和信息抽取,实现竞争情报信息的语义组织和存储;并在此基础上利用基于语义的数据挖掘、学习和推理技术,实现竞争情报语义挖掘和智能分析,提升情报分析的深度和广度,获取高质量的深层情报内容.实验结果表明,该模型取得了很好的预期效果,显著提高了情报分析的准确率和效率.  相似文献   

9.
为深入理解图书情报学学术论文中所使用的研究方法的语义功能,为用户提供基于知识单元的细粒度知识服务,文章首先基于体裁理论来分析引文分析法、田野研究法、共词分析法、实验法、比较分析法和问卷调查法的知识单元构成。其次采用文本分析法,检索CSSCI图书情报学领域的18种期刊中使用以上6种研究方法的论文,进行知识单元层次的深度标引,作为知识库构建的语料。再次采用系统设计法,开发具有4种功能的学术论文研究方法学习系统。最后采用实验法,招募30位研究生使用系统,并根据用户体验对其可用性进行评价。结果表明:研究方法的体裁分析能较好地表示使用该方法开展研究的论文的语义功能,解释研究方法使用过程各部分的语义特征,为深入到知识单元层面的标引提供了基础,也为用户提供了基于知识单元的细粒度的检索点,知识库具有很好的可用性。文章揭示了论文研究方法使用过程各部分的语义特征,基于知识单元构成而设计的学术论文研究方法知识库能有效帮助用户学习研究方法,为学术论文研究方法内容的深度语义标引和本体开发奠定了基础,也为用户提供细粒度、多维度的论文研究方法内容的检索服务,对面向知识发现的知识组织研究具有参考意义。  相似文献   

10.
动态竞争情报是企业在复杂多变的竞争环境中取得成功的关键.针对传统的竞争情报分析模型无法有效地对信息资源进行深层次的多维分析,获取语义层面的动态竞争情报,本文构建了基于联机分析挖掘的动态竞争情报多维语义分析模型.该模型利用竞争情报领域本体指导目标信息的采集与监控和实体与关系的抽取,实现竞争情报的语义组织和存储;设计了一种基于语义的多维关联分析算法进行语义层面的数据挖掘、学习和推理,实现竞争情报多维语义挖掘和知识发现.实验结果表明,该模型取得了很好的预期效果,显著提高了情报分析的深度与广度和情报分析的准确率与效率.  相似文献   

11.
文章通过学习扩展的机器学习和深度学习,提出针对非物质文化遗产项目语料的术语抽取及新词发现方法,形成领域术语库并探讨在数字人文领域的应用。首先使用自然语言处理方法对非遗陶瓷语料进行预处理,结合领域术语词表对语料进行标注;然后针对Random-CRFs模型,研究词表特征(DICT)、词性特征(POS)、部首特征(Radical)、拼音特征(Pinyin)对术语抽取效果的影响,再对比Random-CRFs、Random-BiLSTM、Random-BiLSTM-CRFs、BERT-BiLSTMCRFs等4个模型对术语抽取效果的影响;最后使用训练完成的模型对测试集语料进行新词识别,对抽取出的候选词进行人工判断,构建包含1,173个术语的非物质文化遗产陶瓷工艺领域术语库,将其应用于非遗项目画像、非遗陶瓷工艺知识图谱和非遗陶瓷工艺术语检索。  相似文献   

12.
基于NLP的知识抽取系统架构研究*   总被引:1,自引:0,他引:1  
在参考自然语言处理平台及知识抽取系统的系统结构的基础上,提出一个基于NLP的知识抽取系统的详细设计方案。自然语言处理过程包括分词、词性标注、句法分析、语义分析等8大模块;知识抽取过程包括论文类型分析、篇章结构分析、知识抽取、知识表示4大模块。通过对基于NLP的知识抽取系统架构的研究,明确自然语言处理与知识抽取的关系,分析出知识抽取的系统流程及关键技术。  相似文献   

13.
对利用关键动词(即语义关系动词)进行关系抽取的研究进行回顾,并对生物医学语义关系抽取的常用方法进行详细介绍。认为目前关系抽取研究中所利用的关键动词主要是人工选取的,涉及的主观因素较多,影响关键动词选取的客观性、准确性和全面性。因此,如何自动化地找到这些动词可能会成为今后关系挖掘的一项关键任务。  相似文献   

14.
当前对客观知识体系中语义关系组合方面的研究相对较少,且目前都无法为任意两个相邻语义关系的组合提供判断依据.由于现有的客观知识体系中偶然存在着大量的有组合结果的语义关系组合样本数据的存在,使本文采用分类模型来研究语义关系的组合问题成为可能.此外,本文将语义域引入语义关系组合分类模型,为语义关系组合模型研究提供了一个新的途径.所以,本文从特征项抽取构造和模型构造两方面入手来建立基于语义域的语义关系组合模型,并从整体准确率、各个组合结果的准确率和前人结论的准确率三个方面对实验结果进行分析,归纳出了基于语义域的语义关系组合规律和研究的局限性.  相似文献   

15.
从多个RDFS本体中抽取子本体   总被引:4,自引:0,他引:4  
RDFS本体提供了用于表达语义信息的通用框架,是语义网的基础。本体规模的增大使得对于特定领域知识利用的效率降低,从中抽取领域子本体可解决此问题。单个本体中包含的领域知识有限,从多个本体中抽取子本体可获取更多的领域知识。将RDFS本体抽象为图模型,根据RDFS推理规则和本体间映射,生成多个RDFS源本体的联合闭包。应用图理论构建抽取算法,生成以领域概念为节点的子图,得到所需的领域本体。该方法对于RDFS层次的领域本体抽取有一定的适用性,可快速有效地构建领域本体。  相似文献   

16.
情感分析研究的知识结构及热点前沿探析   总被引:1,自引:0,他引:1  
周建  刘炎宝  刘佳佳 《情报学报》2020,39(1):111-124
为了解国内外情感分析领域的研究状况,揭示该领域的知识结构、研究热点与发展动态,本文采用共被引分析、聚类分析、共词分析、战略坐标分析等方法,借助CiteSpace、UCINET、BICOMB、SPSS等软件,对Web of Science数据库收录的以情感分析为主题的相关文献进行计量分析与知识图谱绘制。分析结果表明,情感分析的应用、深度学习与神经网络、电子商务下的产品评论、事物情感特征评分、社交网络下用户生成内容、语义定向广告技术以及文本语言属性分析构建了情感分析的知识结构,产品评论与口碑、数据挖掘与人工智能、无监督学习、HadoopMapReduce与支持向量机以及神经网络与深度学习为该领域的研究热点,而顾客评论、推荐系统、极性分类、主题模型、电影评论、推特数据将是未来该领域主要研究方向。  相似文献   

17.
绘画作品是艺术领域的重要图像资源,对绘画作品进行知识关联和语义描述研究,能够深度揭示绘画作品语义信息和关联关系,提高其语义检索效率。以明代“元绘画”作品为例,首先从物理表现层、逻辑表现层和语义表现层3个方面描述图像特征,并从图形意义、场景布局、故事情节、人物角色、画中之画和作者审美情感6个方面揭示“元绘画”作品蕴含的语义信息;然后,进一步提出“元绘画”作品的元数据框架,并在此基础上构建作品本体;最后,基于关联数据理论构建作品的知识关联组织模型。本文能够揭示“元绘画”作品的语义信息,进一步整合与“元绘画”作品相关的其他知识和资源;同时,本文是对绘画作品智慧化研究的一次尝试,能够对现有艺术领域的知识关联和语义描述研究进行补充,并为后续研究提供一定借鉴。  相似文献   

18.
基于语义模型的数字图书馆知识组织信息抽取策略   总被引:1,自引:1,他引:0  
简述语义模型是实现数字资源语义关系形式化描述的方式,是数字图书馆知识组织语义互联的重要影响因素。作为数字图书馆知识组织语义互联的重要环节,信息抽取需要本体提供语义知识依据,同时产生的文档也可以作为设计和丰富本体的知识资源。构建数字图书馆知识组织语义互联的语义模型以“元数据、领域本体、桥本体、本体解析体系”为核心要素,在此基础上探讨信息抽取的策略。  相似文献   

19.
本文提出基于"主语-谓语-宾语(Subject-Predication-Object,SPO)"三元组的生物医学领域知识发现框架,对该框架的关键技术和实施流程进行研究。首先,基于UMLS语料库,利用Sem Rep工具从生物医药文献中抽取SPO三元组;其次,基于领域知识组织体系,结合自定义词表和清洗规则对SPO进行清洗和筛选;再次,利用Net Miner分别绘制以Subject和Object为中心节点,Predication为边的语义网络图;最后,结合专家解读,实现领域知识发现。本文以诱导多能干细胞领域为例进行实证研究。结果显示,SPO三元组可细粒度地揭示科技文献的知识内容,基于SPO的语义网络能直观地支持领域知识发现,该框架具有兼容、高效、易实施等优点。  相似文献   

20.
[目的/意义]动态语义出版是BBC提出的新兴出版模式,已成功应用到体育、新闻等多个领域。通过对动态语义出版模式进行研究,为动态数字出版的发展提供思路。[方法/过程]在论述动态语义出版内涵和架构的基础上,从基础架构、应用环境、出版模式、作用效果4个维度对比分析动态语义出版与一般数字出版。[结果/结论]BBC动态语义出版模式在系统架构具有一定的创新性,其动态性、语义性和互动性有利于进一步提升科研人员的知识发现与创新效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号