首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
网络科技信息具有开源、发布及时等特点,目前已成为战略情报监测的重要资源。但这类资源又具有非结构化、无语义描述等特点,如何将Web信息从非结构的自由信息转为可分析的结构化、语义化信息成为一个亟需解决的问题。针对这一问题,笔者提出了网络科技信息结构化监测的思路方法。这一方法通过知识抽取技术,从网络信息资源中抽取出嵌在其中的知识对象以及对象间的相互关系,将自由文本转换为结构化的可计算的知识单元,在此基础上构建各类监测模型,进而实现对研究领域的态势监测。基于这一思路,笔者开发了“网络科技信息自动监测系统”,并基于监测数据所形成的语义资源,进行了监测态势分析实验。图 6。表1。参考文献16。  相似文献   

2.
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识),它提供了一条从浩瀚信息堆积中抽取出与用户相关信息的一条思路。本文分析了信息抽取的主要概念、信息抽取的现状及类型,提出了在数字图书馆的建设中,信息抽取技术在数字内容的自动标引、数据获取、数据挖掘、情报研究分析、参考咨询等方面发挥重要的作用。  相似文献   

3.
当前知识抽取的主要技术方法解析*   总被引:3,自引:0,他引:3  

 对MnM、KIM、Text2Onto、Amilcare、Melita等具有知识抽取功能的系统所应用的技术方法进行解析。提出在当前知识抽取技术中,机器学习和自然语言分析两大思路各自得到较大发展,并且在相互融合、相互借鉴中受益。在基于机器学习的知识抽取方面,出现以自适应信息抽取(Adaptive IE)、开放信息抽取(Open IE)为代表的新思路,并且有向自动本体学习(Ontology Learning)方向发展的趋势;在基于自然语言分析的知识抽取方面,基于模式标注、语义标注的方法得到广泛关注和进一步完善,并且有向基于Ontology的信息抽取(OBIE)方向发展的趋势。此外,为减少Ontology建设成本,让人们可以利用简单的自然语言构建Ontology,基于受控语言的信息抽取(CLIE)技术也得到一定的关注。  相似文献   


4.
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识),它提供了一条从浩瀚信息堆积中抽取出与用户相关信息的一条思路.本文分析了信息抽取的主要概念、信息抽取的现状及类型,提出了在数字图书馆的建设中,信息抽取技术在数字内容的自动标引、数据获取、数据挖掘、情报研究分析、参考咨询等方面发挥重要的作用.  相似文献   

5.
[目的/意义]文章对科技政策隐性扩散路径自组织方法进行研究,挖掘科技政策文本包含深层语义信息,将隐性知识显性化,为科研人员拓展和丰富政策扩散路径研究提供参考。[方法/过程]本文结合科技政策篇章文本的形式语义和内容语义两个方面对政策文本结构化处理和深度挖掘,对政策文本资源全解析,抽取科技政策文本中包含的特征,其中包括概念和关系自动获取与标引技术、网络表示学习,挖掘科技政策文本中的隐含结构信息,利用BiLSTM-CRF模型的深度学习方法实现概念的自动获取和自动标引关系。将得到多篇科技政策文本的概念和关系组成概念关系对的形式,借助于表示学习的方法发现每个节点稠密的向量表示。[结果/结论]通过实验验证,证明了本文借助隐性路径特征的科技政策扩散隐性路径自组织方法的有效性,在一定程度上拓展了政策研究的方法,为科研人员在政策扩散研究上提供了参考。  相似文献   

6.
信息抽取技术及其在数字图书馆中的应用前景分析   总被引:18,自引:1,他引:18  
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识) , 它提供了一条从浩瀚的信息堆积中抽取出与用户相关的信息的一条思路。文章分析了信息抽取的主要概念、主要研究活动、信息抽取的类型和信息抽取系统的一般结构, 并提出在数字图书馆的建设中, 信息抽取技术能够在数字内容的自动标引、元数据获取、数据挖掘、情报研究分析、大型知识库数值库建设、参考咨询等方面发挥重要的作用。  相似文献   

7.
[目的/意义]技术创新服务平台的建设中需要智能搜索引擎技术,智能搜索引擎技术的内涵或者说重点在于自动语义标注.技术创新服务平台上对搜索引擎的要求,与大众的搜索引擎的需求还是不同的,处理的对象主要是专业领域的文本,通过语义标注技术,能快速对企业文档进行语义化和结构化组织,从而为企业提供精准的知识服务.[方法/过程]针对专业领域语义标注的相关问题,在进行深入研究与探讨的基础上,将语义标注理解为是对一组文档资源进行组织语义化的过程,提出利用结构化语义概念资源或集合对数字化文本进行自动标引的方法,并根据概念实体出现频次、位置和关系等因素,自动抽取相关语义概念集合,实现相关文本的语义内容的自动标注.[结果/结论]评价语义标注相关实验的效果,展示语义标注的具体应用场景.同时,体现领域本体与语义标注语料不断更新、进化、形成互动的过程,旨在为专业领域的语义自动标注及智能搜索引擎的构建提供有益的参考.  相似文献   

8.
集成第三方系统中已有的知识产出元数据是机构知识库内容建设的重要途径。文章分析了常见的知识资源管理系统中元数据共享方式,并确定了三种内容采集策略。对采集到的知识产出元数据,结合科研人员本体等语义网技术尝试解决作者同名问题。最后,系统使用WOS提供的元数据共享接口,对整体方案进行了检验。测试结果表明基于科研人员本体的知识产出自动获取方法能够最大可能地从多种类型的资源管理系统中获取知识产出元数据,基于科研人员本体的作者唯一辨识也较好地解决了作者重名问题。  相似文献   

9.
基于两种模式的知识管理系统研究   总被引:3,自引:0,他引:3  
知识管理系统的模式有两种:用于正常的结构化信息处理的知识管理模式、非正常和非结构化的认知发展型知识管理模式。现有的知识管理系统存在着局限性。对基于两种模式的知识管理系统在商业与技术战略、组织控制、信息共享文化、知识描述、组织结构等五方面要素进行了分析。图4。参考文献7。  相似文献   

10.
为充分发挥知识组织在企业专利战略中的作用,在分析专利文献的基础上,根据中文专利文献句法描述的特点,利用最大串频匹配、蚁群聚类、多层KMeans聚类、改进关联规则计算、基于规则和CRFs的术语关系抽取等算法,设计出一套领域本体的半自动构建系统,包括术语抽取、分类关系抽取、非分类关系抽取、本体形式化等模块,初步实现结构化数据和非结构化文本的本体半自动构建。  相似文献   

11.
随着信息技术的发展与普及,全球学术交流模式总体朝着开放获取的趋势发展,信息时代的科学活动需要更多的数据开放和共享。开放数据是公众参与科学、推动社会进步的必要条件。无论是对于图书馆工作还是对于信息服务、知识服务来说,科研模式的变革都是一种新的挑战。与此同时,在此背景下,也产生了一种新的机遇,即与科研数据管理相关的一系列新内容,包括:明确科研数据管理各利益方;明确数据管理服务的主要内容;塑造科研数据开放共享文化,开展各个利益相关者之间的数据对话;进行科学数据开放共享各个环节的政策研究;明确数据馆员发挥的作用和职业价值。表6。参考文献70。  相似文献   

12.
关于从MEDLINE数据库中进行知识抽取和挖掘的研究进展   总被引:28,自引:4,他引:24  
崔雷  郑华川 《情报学报》2003,22(4):425-433
本文对近年来国内外利用医学文献检索系统MEDLINE进行知识抽取和文本数据挖掘的研究进行了回顾和综述,包括Swanson等开展的从文献中发现隐藏的联系的研究,Cimino等人开展的从文献中抽取规则的研究,国外的共词及国内的共篇分析研究.并据此提出,在当前信息技术高速发展的条件下,应当充分开展知识抽取和文本挖掘的研究,为图书情报部门的服务功能从文献管理向信息管理和知识管理转化进行理论上的探索.  相似文献   

13.
This work exposes a new paradigm for the creation and publication of textbooks: open source. The phrase open source is borrowed from the computer software industry, where the word source has a technical meaning explained in this paper; open source software is software which has been developed by many collaborators using the internet to produce a final product. The contributors receive no financial compensation, yet there have been many successful open source software projects (Linux, Open Office, Apache, etc.). Open source textbooks use a similar financial model; the authors and contributors receive no direct financial compensation for their work. Contributors are listed in the produced work as primary author(s), co-authors, contributors, minor contributors, etc. according to the magnitude of their contribution. The produced work is available free for users on the internet. This paper will explain the open source process and will provide justification for open source as an effective paradigm; it will also present some existing open source textbook projects, as well as the author’s own open source textbook project.  相似文献   

14.
信息过载现象导致发现并获取有用信息变得越来越困难,用户急切需要精准的知识发现和问题解答服务,通过对当前实现精准知识发现的主要技术方法进行分析,本研究分别采用基于传统知识组织构建方法和基于深度学习的方法,面向湿地领域进行语义知识组织体系的构建和精准发现实验。实验分析证明,传统知识组织方法无法单独支持特定主题的精准知识发现,尽管基于词向量的深度学习方法可以有效弥补传统知识组织系统的局限,但会受到计算语料规模和质量的限制。因此,本研究最终提出融合知识组织与认知计算的基本思路和体系框架,分析了融合方案所涉及的关键技术,这对于构建新一代开放知识服务系统具有重要指导意义。图3。参考文献15。  相似文献   

15.
分析数字图书馆知识组织体系构建的层次与结构,围绕知识组织系统的构建与管理、知识组织系统的互操作、知识组织系统的存储与管理、语义元数据的生成系统4个组成部分,选取相关的开源软件,对每一结构在数字图书馆知识组织过程中的功能和作用进行说明,并对数字图书馆的知识组织体系的构建提出最佳实践和应用说明。  相似文献   

16.
Computational cognitive models developed so far do not incorporate individual differences in domain knowledge in predicting user clicks on search result pages. We address this problem using a cognitive model of information search which enables us to use two semantic spaces having a low (non-expert semantic space) and a high (expert semantic space) amount of medical and health related information to represent respectively low and high knowledge of users in this domain. We also investigated two different processes along which one can gain a larger amount of knowledge in a domain: an evolutionary and a common core process. Simulations of model click behavior on difficult information search tasks and subsequent matching with actual behavioral data from users (divided into low and high domain knowledge groups based on a domain knowledge test) were conducted. Results showed that the efficacy of modeling for high domain knowledge participants (in terms of the number of matches between the model predictions and the actual user clicks on search result pages) was higher with the expert semantic space compared to the non-expert semantic space while for low domain knowledge participants it was the other way around. When the process of knowledge acquisition was taken into account, the effect of using a semantic space based on high domain knowledge was significant only for high domain knowledge participants, irrespective of the knowledge acquisition process. The implications of these outcomes for support tools that can be built based on these models are discussed.  相似文献   

17.
Apache、Linux、Ubuntu、Debian、OpenOffice、Mozilla、开源中国社区(OsChina.NET)、开源及基础软件通用技术创新战略联盟(Cosoft)、开源高校推进联盟(LUPA)是国内外成功的开源社区;Oss4Lib、Code4Lib、Koha、Evergreen、reSearcher是国外图书馆开源社区,随着开源软件的发展,国内图书馆已越来越多地使用开源软件,但还没有开源社区。上述开源社区的成功经验必能对图书馆开源社区的发展起到很好的借鉴作用。文章从开发模式、管理模式、人才培养模式、基金模式、盈利模式等方面探讨图书馆开源社区的持续发展模式。  相似文献   

18.
[目的/意义] 比较分析语义网技术发展环境下国外代表性知识组织体系管理工具的研究现状及关键功能,梳理相关研究的发展趋势。[方法/过程] 通过网络调研法,遴选国外10个代表性知识组织体系管理工具,从结构定义、项目维护、数据管理、互操作性、操作环境等方面比较分析其发展现状。在此基础上,为国内知识组织体系管理工具的建设工作提供建议。[结果/结论] 研究发现,国内知识组织体系管理工具的建设工作应依托语义网、关联数据、语义集成、语义互操作等技术促进功能创新,包括:灵活设计并配置多类型数据模型、支持可持续发展的管理与维护机制、支持用户分布式协同管理与控制、知识驱动的数据迭代式更新、面向语义的KOS重用与进化、建设以KOS为核心的知识组织框架等。  相似文献   

19.
数据与数据之间通过富含语义链接的方式形成了有价值的数据网络,在以语义网为核心的网络架构中,网络资源的语义化结构、细粒度描述、数据关联等特性对数据加工及利用提出了新的挑战,信息组织的处理对象及外延发生着变化,信息组织工具不断丰富且功能趋于统一。本文依据信息组织的不同功能和处理流程可以将其细分为资源层、元数据记录层、词表层,分别对各个层次的特点、变化及其未来发展进行分析,认为从文本中准确提取出反映语义含义的特征项是当前信息组织的关键问题,元数据集、知识组织系统成为词表的主要构成,知识组织系统呈现出描述对象概念化、语义关系多样化、描述语言形式化、数据开放关联性四大特点。图3。参考文献23。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号