共查询到19条相似文献,搜索用时 203 毫秒
1.
李昕 《中国科技资源导刊 (中国信息导报)》2008,40(2):52-56
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识),它提供了一条从浩瀚信息堆积中抽取出与用户相关信息的一条思路。本文分析了信息抽取的主要概念、信息抽取的现状及类型,提出了在数字图书馆的建设中,信息抽取技术在数字内容的自动标引、数据获取、数据挖掘、情报研究分析、参考咨询等方面发挥重要的作用。 相似文献
2.
李昕 《中国科技资源导刊》2008,40(2)
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识),它提供了一条从浩瀚信息堆积中抽取出与用户相关信息的一条思路.本文分析了信息抽取的主要概念、信息抽取的现状及类型,提出了在数字图书馆的建设中,信息抽取技术在数字内容的自动标引、数据获取、数据挖掘、情报研究分析、参考咨询等方面发挥重要的作用. 相似文献
3.
刘鲁红 《中国科技资源导刊 (中国信息导报)》2005,(2):49-52
一、信息抽取的概念 信息抽取是自然语言处理研 究中一个正在走向成熟的研究领 域。信息抽取的目标是自动实现从 文本信息中抽取出预先想要的信 息(知识),它提供了一条从浩瀚的 相似文献
4.
5.
模板处理的含义及其主要内容。详细阐述了模板处理在数字化文献环境中的主要应用领域:利用模板建立引用数据库,从电子刊物中抽取信息等。并探讨了在元数据中利用模板自动抽取信息的一些原理及方法。 相似文献
6.
7.
模板处理在数字化文献中的应用 总被引:1,自引:0,他引:1
介绍了数字图书馆和模板处理的含义及其主要内容,详细阐述了模板处理在数字化文献环境中的主要应用领域,即利用模板建立引用数据库,从电子刊物中抽取信息等,并探讨了在元数据中利用模板自动抽取信息的一些原理及方法。 相似文献
8.
李炜 《浙江高校图书情报工作》2008,(6)
本文把信息抽取结合进数字图书馆的三层架构体系,从数据挖掘、情报搜索以及专家系统三个方法上出发,结合模板数据挖掘平台,情报自动搜集平台和图书馆大型知识库、数值库设计出了一套信息抽取在数字图书馆里应用的实例。同时,该模型整合进了数字图书馆中的数据库平台、情报咨询平台等服务平台。 相似文献
9.
网络科技信息具有开源、发布及时等特点,目前已成为战略情报监测的重要资源。但这类资源又具有非结构化、无语义描述等特点,如何将Web信息从非结构的自由信息转为可分析的结构化、语义化信息成为一个亟需解决的问题。针对这一问题,笔者提出了网络科技信息结构化监测的思路方法。这一方法通过知识抽取技术,从网络信息资源中抽取出嵌在其中的知识对象以及对象间的相互关系,将自由文本转换为结构化的可计算的知识单元,在此基础上构建各类监测模型,进而实现对研究领域的态势监测。基于这一思路,笔者开发了“网络科技信息自动监测系统”,并基于监测数据所形成的语义资源,进行了监测态势分析实验。图 6。表1。参考文献16。 相似文献
10.
提出了Web页面信息的自动抽取思想,并使用WebBrowser和DOM技术实现了Web页面上网页元素查找、表单自动填写、表单自动提交、自动获得查询结果并自动抽取所需信息的技术,从而实现了Web页面信息的自动抽取。文中还给出了这一方法的实现细节和示例代码。 相似文献
11.
数字信息资源的自动分类和主题识别--OCLC"蝎子计划"研究 总被引:2,自引:0,他引:2
“蝎子计划(Scorpion Project)”是美国 OCLC 利用《杜威十进分类法》电子编辑支持系统(ESS)对数字信息资源进行自动分类和主题识别的一个研究项目。本文简要介绍了该项目的进展情况、实施原理,描述了 Scorpion 对数字信息资源进行自动分类和主题识别的具体流程,并将其与我们自行研发的基于《中图法》知识库的中文信息自动标引和自动分类系统进行对比分析,以探讨 Scorpion 对中文信息自动分类和主题识别的借鉴意义。 相似文献
12.
13.
数据挖掘技术在图书馆工作中的应用 总被引:17,自引:0,他引:17
数据挖掘是一门新兴的数据分析技术。本介绍数据挖掘在数字图书馆中实现的流程和方法,并对其在图书馆的应用作出科学分析。使现代图书馆服务领域得以扩宽,从传统查询服务扩展到基于WEB信息空间或自动化管理系统的知识服务。 相似文献
14.
国家图书馆数字图书馆概论 总被引:1,自引:0,他引:1
介绍国家图书馆数字图书馆系统由数字资源采集与制作、数字资源的永久保存与存储管理、数字资源发布与服务、灾害备份等子系统组成。构造现代图书馆的信息网络化服务平台需要,全面整合图书馆的服务和自动化系统。作为目前中国最大的数字图书馆系统总体设计之一,国家数字图书馆工程的设计尚存在很多问题需要在实施过程中逐步解决。 相似文献
15.
随着计算机技术的发展与数字资源建设的不断跟进,大量的纸质文献需要进行数字转化为电子文献,电子文献逐渐成为信息资源的重要组成部分。电子文献的普及和广泛应用,使得针对电子文献的自动校对系统的研究应运而生。文章在调研了国内外相关的文本自动校对相关研究之后,结合CSSCI数据库的实际情况,构建了一个基于混淆集和上下文特征分析的文本自动校对系统模型,并进行了其相关的实验。 相似文献
16.
面向数字图书馆的本体自动构建 总被引:1,自引:0,他引:1
提出一种面向数字图书馆的本体自动构建方法:首先从因特网数据中找出本体语义概念的模式及其关系,然后通过构建概念分类体系来自动化地抽取数字图书馆的各类本体。包括以下步骤:术语选择、抽取本体概念、语义关系抽取、分类体系构建、本体构建和本体修剪及评价。图3。参考文献3。 相似文献
17.
自动文摘的四种主要方法 总被引:17,自引:0,他引:17
本文将现有的自动文摘方法概括为四种:自动摘录、基于理解的自动文摘、信息抽取和基于结构的自动文摘,并详细介绍了这四种方法的基本原理,剖析了它们的优点和不足。最后,概述了中文自动文摘的研究状况。 相似文献
18.