首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 734 毫秒
1.
为充分发挥知识组织在企业专利战略中的作用,在分析专利文献的基础上,根据中文专利文献句法描述的特点,利用最大串频匹配、蚁群聚类、多层KMeans聚类、改进关联规则计算、基于规则和CRFs的术语关系抽取等算法,设计出一套领域本体的半自动构建系统,包括术语抽取、分类关系抽取、非分类关系抽取、本体形式化等模块,初步实现结构化数据和非结构化文本的本体半自动构建。  相似文献   

2.
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。  相似文献   

3.
石泽顺  肖明 《图书情报工作》2017,61(17):139-148
[目的/意义]对LISTA数据库收录的图情学科学术文献、期刊、作者的题录数据进行关联数据发布研究,并利用可视化软件RelFinder进行多角度的语义关系发现实验,以期揭示不同学术单元数据之间的隐含关系和一些潜在的规律。[方法/过程]首先,选取图情学科为研究领域,抓取LISTA数据库666种期刊、5 075位核心作者以及1 073篇学术文献的题录数据并导入MYSQL数据库。接着,构建轻量级任务本体对数据进行规范化描述,利用开源软件D2RQ转换为RDF三元组,并结合语义仓储软件Virtuoso发布为关联数据。最后,使用RDF可视化软件RelFinder进行图情学科学术单元之间的语义关系发现,对直接关系、一次间接关系、二次间接关系以及多次间接关系的发现过程进行总结。[结果/结论]RelFinder能较好地发现图情学科学术文献、期刊、作者之间隐含的深层次关系,对检索学术文献、揭示学术脉络和发现学术领域知识都有重要意义。  相似文献   

4.
领域本体的关系抽取研究   总被引:3,自引:0,他引:3  
利用机器学习和自然语言处理技术中的有关方法,研究从语料中抽取概念关系为领域本体构建服务。对等级关系以及领域关系的抽取方法作详细阐述,并通过实验证明该方法是有效的。  相似文献   

5.
[目的/意义]学术全文本下的关系抽取是学术全文本知识图谱构建的关键技术,所构建的学术知识图谱能够实现文献的结构化、知识化,提高研究人员检索文献、分析文献和把握科研动态的效率,以及通过图谱的认知推理,有助于隐式知识发现.[方法/过程]通过外部知识来增强关系抽取已在不少研究取得成果,但针对特定领域的关系抽取往往缺少可用的外...  相似文献   

6.
张颖怡  章成志  Daqing  He 《图书情报工作》2022,66(12):125-138
[目的/意义]问题和方法是学术论文的重要组成部分。将散落在学术论文中的问题与方法进行有效组织,例如问题与方法识别及其之间的关系抽取,可挖掘学术论文中的隐性知识,促进学科的方法体系和问题体系构建。对学术论文中问题与方法识别及其关系抽取的相关研究工作的梳理,有助于把握该研究的发展趋势、发现该研究中存在的不足,并为未来的工作提供借鉴和指导。[方法/过程]在学术论文的问题和方法的挖掘方面,现有研究围绕4个研究点展开,分别是问题与方法及其关系定义、问题与方法及其关系标注数据集构建、问题与方法识别及其关系抽取的模型设计以及问题与方法及其关系的应用。本文分别对这4个研究点进行梳理,归纳总结现有学术论文中问题和方法知识挖掘的现状。[结果/结论]分析发现,在问题与方法的相关定义中,较少结合科学哲学中的问题学等理论进行定义;在问题与方法数据集构建中,存在数据集重复标注的现象,另外,开源数据集集中在自然科学领域且一般为英语语料,中文开源语料稀缺;在问题与方法识别及其关系抽取中,现有抽取模型性能较低;有关问题和方法的研究不应止步于词语识别和关系抽取,需对挖掘出的知识进行深入分析和应用。  相似文献   

7.
提出一种新的领域本体学习方法,结合形式概念分析(FCA)与关联规则挖掘从非结构化文本中获取情报学本体。该方法从文本集中通过种子-扩展机制的方法获取领域核心概念,构建文档概念格(文档×关键词矩阵),在此基础上通过形式概念分析方法来识别概念之间的等级关系,通过关联规则挖掘概念间的相关关系。最后,采用基于"黄金标准"的方法对本体学习的结果进行评价,结果表明:通过这种方法构建的本体可以达到较高的领域知识覆盖率,而且能够识别概念之间部分隐含的关系,从而验证该方法在领域本体的构建中实用且有效。  相似文献   

8.
[目的/意义]传统的关键词自动抽取将摘要看成一个整体,常以候选词的出现频次等非语义信息构建特征,并未考虑学术文献摘要中目的、方法、结论等各个结构功能语义蕴含的差异性。本文以中文文献为研究对象,探讨候选词所在的结构功能域对关键词抽取的影响和作用。[方法/过程]本文将文献标题和摘要文本共分为4个结构功能域,在传统的词频、词长、词跨度等基准特征上,融合了基于BERT的语义特征和结构功能特征,并以不同的特征组合方式,使用图书情报领域的中文学术文献,基于分类模型进行关键词自动抽取实验。[结果/结论]实验结果表明,融合结构功能特征后,关键词抽取效果整体提升了6.82%,证明了学术文献摘要结构功能的识别形成的结构功能特征对关键词抽取效果的提升有良好作用。  相似文献   

9.
对利用关键动词(即语义关系动词)进行关系抽取的研究进行回顾,并对生物医学语义关系抽取的常用方法进行详细介绍。认为目前关系抽取研究中所利用的关键动词主要是人工选取的,涉及的主观因素较多,影响关键动词选取的客观性、准确性和全面性。因此,如何自动化地找到这些动词可能会成为今后关系挖掘的一项关键任务。  相似文献   

10.
[目的/意义]利用关联数据名称唯一性特点,对书目数据进行语义化关联组织,使不同图书馆资源通过文献版本关系发现实现语义聚集。[方法/过程]分析书目关系类型及文献不同版本的特点,提出文献不同版本类型对应的版本关系,然后采用属性值顺序匹配方法,经过同种文献确定、版本关系发现两个步骤发现文献之间的版本关系,并利用美国国会图书馆、德国国家图书馆相关数据以及维基关联数据进行实证研究。[结果/结论]构建基于关联数据、书目数据的文献版本关系发现方法,实现同种文献不同版本的语义关联,发现实证数据间的版本关系,并指出其应用方向。通过该方法可以提供基于关联数据的知识检索服务,满足用户阅读、科研需求。  相似文献   

11.
基于本体与规则的语义推理研究   总被引:1,自引:0,他引:1  
为解决本体相关概念的共享和信息集成,发现本体间的语义关联,提出了本体与规则整合下的语义推理模型ORRM,构建了家庭本体FO。将推理集中在两个不同层次,第一层的推理使用Racer推理机进行描述逻辑的推理,检测本体的冲突。第二层使用本体中表示的概念和属性制定成员规则库,采用基于XML的SWRL呈现规则和Jess推理引擎,增加了本体概念问语义的关联。该模型在本体中引入规则表示,弥补了OWL DL在推理机制上的不足,推导出的新本体在原本体的基础上实现了本体成员间隐含关系的语义推理,完善了本体知识库的内容。在语义Web领域,该模型的应用能够提高本体知识的利用率。  相似文献   

12.
白华 《图书情报工作》2015,59(17):127-133
[目的/意义]针对大众分类法和知识组织系统各自的优势和缺点,构建兼有大众分类和概念本体特征的新本体,利用语义关联技术为标签添加语义,以克服传统分类线性结构的缺陷。[方法/过程]建立一个"文学图书本体", 该本体以每对概念与标签之间的资源相似率为标准,采用标签—概念映射和集成技术把标签映射到概念框架中,从而一方面赋予标签以等级关系、同一关系和相关关系等语义,另一方面提高概念本体的标引能力,使每种图书的属性充分得到语义表达和揭示。[结果/结论]试验表明,新本体在容纳性、灵活性和多向语义关联方面的功能,均有显著提高,因而可提高图书资源的知识表示和组织能力。  相似文献   

13.
基于Web挖掘技术的用户兴趣本体学习研究   总被引:2,自引:1,他引:1  
目前针对基于关键词的用户模型不能从语义上表达用户需求真正内涵,基于领域本体的用户模型多数忽略研究概念间非分类关系和语义应用环境较分散等缺陷。本文提出一种循环式的基于Web挖掘技术的用户兴趣本体学习模型,即综合应用统计分析、关联规则和聚类分析等技术进行电子商务领域用户兴趣概念及概念间分类与非分类关系学习,面对用户兴趣的迅速变化,还提出一种传递激活方法来实时更新本体或重新进行本体学习,以不断提高该本体的质量。经验证,基于该本体的用户模型在文本过滤等应用中能较上述两种用户模型满足用户个性化服务需求。  相似文献   

14.
邱璇  李端明  张智慧 《图书情报工作》2015,59(2):112-117,50
[目的/意义]单一资源构建本体存在概念完整性和语义关系完整性的局限,为了满足用户对资源检索的个性化需求,综合FCA和异构资源各自的优势,采用异构资源构建本体的手段克服单一资源的局限。[方法/过程]以主题词表和Folksonomy数据集为数据源,各自构建形式背景,通过并叠置运算获得异构资源的形式背景,转换成概念格,从概念格中抽取概念模型,使用protégé工具和OWL语言构建实验本体。[结果/结论]通过词重率、增词率、漏词率3个参数,评估实验本体构建效果。实验结果表明,融合的本体有效地丰富了概念和概念间关系,比单一资源构建的本体更具有优势,为本体构建提供了一种新的可行方案。  相似文献   

15.
[目的/意义]通过对国内外多语本体领域映射技术相关研究成果的总结和EuroWordNet案例分析,为国内跨语言信息检索系统映射机制的建立提供借鉴和参考。[方法/过程]选取目前发展较为成熟的多语本体库EuroWordNet作为案例,分别从数据库设计、本体构建、概念存储和多语文化差异的映射处理4个方面对其中间语言索引机制(Inter-Lingual-Index,ILI)进行分析。[结果/结论]嵌入式的数据库结构设计、概念抽取及同义词集对应关系的界定、概念存储的细粒度化和复杂等价关系的建立是建立跨语言信息检索映射机制的关键。  相似文献   

16.
[目的/意义]提出一个药物不良反应本体的半自动构建方法,构建的细粒度药物不良反应本体为利用社交媒体挖掘潜在的药物不良反应信号提供语义资源库。[方法/过程]首先,采用业务层次和语言层次相分离的设计理念,将用户在社交媒体中评论的药物不良反应表示成"对象要素-属性要素-描述概念"的形式。细粒度体现在社交媒体用户对药物同一不良反应描述概念表达的多样性上。然后,基于深度学习的思想,利用基于word2vec的描述概念候选词抽取算法自动地抽取出更多的描述概念候选词构建本体。[结果/结论]以糖尿病药物的建模实例表明,提出的细粒度药物不良反应本体的半自动构建方案,提高了本体构建的智能化水平,构建的细粒度药物不良反应本体为利用社交媒体挖掘潜在的药物不良反应信号提供语义资源库。  相似文献   

17.
网络学术文档细粒度聚合本体构建研究   总被引:2,自引:0,他引:2  
[目的/意义] 旨在探索网络学术文档细粒度聚合本体构建的理论和方法。[方法/过程] 在梳理相关理论与方法的基础上,首先明晰细粒度聚合本体概念的基本类型、粒度特征和定义等基本理论问题,然后以网络环境下图书情报学领域"引文分析"主题语料为数据来源,从概念、属性和关系、实例等方面对细粒度聚合单元本体构建进行逐一探讨,并对本体进行评估和讨论。[结果/结论] 首次提出基于聚合单元知识体系构建细粒度聚合本体的思路与方法,可为基于聚合单元的细粒度组织、检索和导航中知识组织系统工具的构建提供参考。  相似文献   

18.
[目的/意义] 科技文献中的概念是对文献中知识高度凝练的表达,通常以定义句的形式出现在科技文献中。自动从概念定义句中抽取概念,能够进一步挖掘科技文献中蕴含的重要知识。[方法/过程] 通过分析概念定义句的结构、句式等模式特征,提出以WCL数据集为基础的语料构建方案,并采用BERT+BiLSTM+CRF模型学习概念定义句的模式,从而实现概念短语抽取。[结果/结论] 结合以往对概念定义句模式特征的研究,创新性地提出一种基于序列标注学习概念定义句的组成模式,从而实现概念短语抽取。通过BERT+BiLSTM+CRF模型,有效学习了概念定义句中的上下文语义、句式结构、组成项分布等模式特征,实现了句子中概念短语的抽取。  相似文献   

19.
徐坤  蔚晓慧  毕强 《图书情报工作》2015,59(17):120-126
[目的/意义]数据驱动的科研时代,科学数据的重要性越来越高,有效组织科学数据,便于科学数据被科研人员复用和利用计算机进行二次开发,对科学研究具有重要意义。[方法/过程]利用专家调查法确定科学数据本体的概念、属性和描述科学数据的元数据模型,在领域专家的参与下构建科学数据本体,将科学数据组织于一个由相关概念组成的知识环境中。[结果/结论]利用数据本体组织科学数据,使科学数据在内容上更加丰富,在表现形式上更易于被计算机所理解,通过对构建基于数据本体的检索实证表明其检索结果能够利用推理功能提高检全率,并便于以可视化的形式展示检索结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号