期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

徐健张智雄吴振新《现代图书情报技术》2008,24(8):18-23

对实体关系抽取研究以MUC和ACE评测为主线的发展进行总结,并指出实体关系抽取任务普遍存在的三个问题是特定领域标引数据集的获取、模式的获取以及共指消解。在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为：基于模式匹配的关系抽取、基于词典驱动的关系抽取、基于机器学习的关系抽取、基于Ontology的关系抽取以及混合抽取方法,旨在为进一步构建实体关系抽取系统提供良好借鉴。相似文献

2.

非结构化文本中内容对象抽取的技术方法综述

张智雄吴振新赵琦洪娜徐健刘建华《数字图书馆论坛》2008,(9):1-12

近年来,知识抽取技术在非结构化文本的处理中起到很重要的作用.文章在对当前知识抽取的相关文献、系统和项目分析研究的基础之上,提出了当前知识抽取研究中的主要抽取内容对象的分类,并对这些主要内容对象抽取的相关技术方法进行综述.主要总结了Web对象识别和集成、术语识别和抽取、主题发现和识别、概念层次关系的抽取、非概念层次关系的抽取、事实抽取、观点抽取和倾向识别等7种内容对象抽取的技术方法.并在此基础之上,对未来知识抽取的发展趋势进行了分析.该文为2008年第9期本期话题"知识抽取"的文章之一. 相似文献

3.

Chinese Relation Extraction Based on Ensemble Kernel

Li Lishuang Dang Yanzhong Zhang Jing Wang Min 《情报学报》2012,31(7)

将基于特征向量的平面核和基于句法分析树的结构核组合,进行中文实体关系抽取.首先进行特征选择实验,为构造平面核中的特征向量选择最优特征集合,特征包括实体大类、实体子类、实体类别等实体信息以及实体对在句子中的前后词信息.在定义结构核函数时,从包含两个实体的句子中提取最短路径包含树(shortest path tree,SPT),然后使用卷积树核函数来计算两棵SPT树的相似度.在ACE RDC 2005中文语料库上进行实体关系大类的抽取实验,其F值达到了68.50%,比两个单独核函数的方法分别提高4.36%和17.37%.同时,在组合核中也进行了特征选择实验,得到了最好关系抽取性能的F值为70.58%,说明单独平面核的最优特征集在组合核中未必最优.结果表明,本文利用实体语义信息构造平面核并与结构核组合,对于中文实体关系抽取具有较好的性能. 相似文献

4.

维基百科中的实体关系抽取研究

李斌马宁蒋平郭玉良《信息系统工程》2011,(5):142-144,146

本文介绍了一种在维基百科文档中进行实体关系抽取的方法。首先根据维基百科文档中的超链接特征识别相关的实体,然后抽取文档中关于实体的类别信息、消歧信息、关键词等特征,并采用向量空间模型来表示。最后通过计算待测实体对与训练实体对的相似度,得出待测实体对所属的关系类别。我们分别对实体关系抽取进行了封闭测试和开放测试实验,并取得了较好的测试结果。相似文献

5.

医学文献集合的主题抽取和主题聚类实践 总被引：1，自引：0，他引：1

殷蜀梅张智雄《数字图书馆论坛》2008,(9):32-36

文献中的重要关键词能够反映其核心主题,因此对文献主题的发现和抽取问题就转化为对文献中的重要关键词集合的抽取.文章在调研了国外在主题抽取和聚类方面采用的技术方法的基础上,提出了在医学学科领域从文本信息资源中抽取主题并进行主题领域判断的技术方案,并详细阐述了其中的主题聚类的技术环节.为了验证该技术方案的有效性,文章以骨关节炎领域为例,对文中提出的技术方案进行实践验证.验证的结果表明文章提出的技术方案有着实际的有效性.该文为2008年第9期本期话题"知识抽取"的文章之一. 相似文献

6.

依存句法特征的科研命名实体识别算法

赵华茗钱力余丽《图书情报工作》2020,64(11):108-115

[目的/意义] 探索科研命名实体及其关系的识别与抽取，提升其在长句等复杂情况下的识别效果，为进一步的应用提供参考与借鉴。[方法/过程] 以依存句法特征分析为基础，提出一种科研命名实体关系抽取方法，过程包括：①使用Standford Tagger工具对目标文本进行词性标注；②基于标注结果，围绕核心谓词和SAO结构，将目标文本分割为结构规范的语义片段；③通过依存句法分析，找出与核心谓词语义相关的主语和宾语，构成（实体，关系，实体）三元组。[结果/结论] 与Ollie、Reverb等主流算法进行的对比测试表明，该方法可以有效提升科研命名实体识别的准确性。相似文献

7.

领域本体的关系抽取研究 总被引：3，自引：0，他引：3

何琳《现代图书情报技术》2008,3(4):35-38

利用机器学习和自然语言处理技术中的有关方法,研究从语料中抽取概念关系为领域本体构建服务。对等级关系以及领域关系的抽取方法作详细阐述,并通过实验证明该方法是有效的。相似文献

8.

基于关系抽取的企业竞争情报获取与融合框架 总被引：3，自引：1，他引：2

赵洁《情报学报》2010,29(2)

网页蕴含了大量的企业竞争情报.然而,现有的企业竞争情报获取系统还缺乏直接从网页中获取竞争情报的能力.本文提出了一个基于网页实体关系抽取与融合的企业竞争情报获取系统框架.该系统通过对网页内容的抽取与融合,最终形成可信的企业竞争情报数据.论文首先讨论面向Web的企业竞争情报自动获取系统的总体结构,并重点阐述了其中的企业竞争情报获取方法、企业竞争情报融合机制等问题及其解决方案.本文的工作为进一步建立实用的Web竞争情报获取与融合系统奠定了基础. 相似文献

9.

面向技术机会发现TOD的专利信息抽取*——韩国科学技术信息研究院KISTI语义服务

下载免费PDF全文

周雷李颖石崇德《情报工程》2015,1(2):031-037

技术机会发现(TOD,Technology Opportunity Discovery)是面向新技术进行监测,并提供机会的一种服务;所谓“基于专利的信息”是指采用自然语言技术对专利进行抽取的结果。本研究的目标资源覆盖过去20年间发表的所有专利,目标信息则是其中产品名称及其部分-整体关系(Part-of relations)。应用基于词典和相似度的命名实体识别、基于模式的关系抽取、以及基于机器学习的信息过滤几项技术,本研究取得了令人鼓舞的效果。相似文献

10.

生物医学语义关系抽取方法综述北大核心CSSCI

李芳刘胜宇刘峥《图书馆论坛》2017,(6):61-69

深度学习在自然语言处理方面取得了显著成效,为生物医学领域的信息抽取带来新的研究范式。本研究旨在系统调研生物医学语义关系抽取方法、分析其发展历程,为深度学习方法的进一步运用提供基础和启示。通过检索Pub Med、Web of Science和IEEE数据库,以及Bio Creative、Sem Eval等重要测评网站,遴选出具有代表性的抽取方法,并从目的、方法、数据集和效果四个维度进行分析。经过系统梳理,可将生物医学语义关系抽取方法分为三个阶段:基于知识、传统机器学习和深度学习。将先验知识和领域资源恰当地融入到深度学习模型中,是进一步提升语义关系抽取效果的探索方向。相似文献