首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
数据挖掘:原理、方法及其应用   总被引:53,自引:2,他引:51  
数据挖掘是当前数据库和信息决策领域的最前沿研究方向之一。首先介绍了数据挖掘的基本概念和处理过程, 然后分别分析了数据挖掘所发现的主要知识类型和使用的技术方法, 最后对基于Web 的几个数据挖掘应用系统进行了较为细致的剖析, 并指出数据挖掘技术和搜索引擎技术的结合对网络信息的发现、搜集和管理、利用具有巨大的发展前景。  相似文献   

2.
档案信息化已经成为档案信息服务社会的最佳技术手段和实现途径.如何高效地利用爆炸性增长的数字化资源,从错综复杂的海量信息中提取出有价值的信息,已成为档案工作者的重要任务,数据挖掘正是解决这一问题的有力工具.各级财政和统计部门多年来积累了大量的财经类档案数据,对其进行数据采集和预处理是进一步数据挖掘和利用的基础.由于财经类数据不同于一般档案数据,因此,在数据采集、预处理工作中必须充分注意其特性,采用相关技术才能形成高质量的数据,使数据的利用(统计、数学建模、数据挖掘)等更加有效.  相似文献   

3.
以不动点相关理论为基础,采用数据挖掘和概率统计的方法,对Web服务行为约束和概率统计语义的问题进行研究和分析。针对传统定性描述调用关系的不足,给出服务调用关系定量描述的方法,并给出Web服务间调用的不动点函数及相应算法。实验证明,此方法对Web服务发现是有效的。  相似文献   

4.
本文提出了一种财务预算精细化管理方法.这种方法的思路是:首先需要其他相关部门的配合,得到需要的数据,然后用数学的方法对数据进行量化处理,再用数据挖掘算法做定性研究,最后综合考虑做预算.这种方法主要采用数学统计的方法和数据挖掘方法相结合,主要从定量和定性方面考虑,方法比较科学、合理,为决策者进行精细化财务预算提供可靠的依据.  相似文献   

5.
大数据时代的专利分析   总被引:2,自引:0,他引:2  
本文主要介绍在大数据时代的浪潮下,如何利用数据挖掘技术从世界上最大的技术信息源专利文献中挖掘有用的模式、信息和知识.本文指出了大数据时代下专利分析面临的三大难题,重点对现阶段专利分析、专利评估方法进行了论述和比较.实践表明,数据挖掘技术在专利分析应用十分重要,对其深入研究与探索具有非常显著的研究意义与价值.  相似文献   

6.
数据挖掘技术是数字图书馆的核心技术。人们不仅需要检索到文本信息,还需要对视频信息进行管理和检索。所以,多媒体数据挖掘成为研究的热点。本文介绍了多媒体数据挖掘的过程、方法和数据表示。  相似文献   

7.
蔺军 《兰台世界》2006,(5):53-54
本文分析了多媒体数据库数据挖掘的特点,并对其挖掘方法和步骤作了进一步的阐述。  相似文献   

8.
Web 是动态性极强的信息源,访问、分析信息必须研究异构数据的集成问题,并选择合适的技术进行数据 分析、集成和处理。怎样对Web 海量的数据信息进行深层次的应用已成为数据挖掘技术的研究热点。本文介绍了XML (可扩展标记语言)在Web 数据挖掘中的应用,探讨了Web 数据挖掘中的数据异构问题。通过XML技术建立数据抽取模 型,解决互联网上绝大多数因异构、非结构化所导致的Web 数据挖掘问题。  相似文献   

9.
信息整合与数据挖掘技术在文献数据库创新性建设领域具有非常重要的意义,这已在国外同行的应用中取得了较好的效果,但国内对此项技术的研究和应用才刚刚起步。该研究通过广泛调研,制定了文献专题知识数据库的期刊和文献收录标准,以及数据库框架结构和数据录入标准。在此基础上,收集了国内外乙肝相关文献,借助期刊和文献影响力及专家内容分析等筛选方法筛选了近1.5万篇左右文献信息,构建了一个知识覆盖面广、文章质量高和分类标引好的乙肝专题文献知识库,并进一步通过构建文本挖掘工具字典,成功实现了乙肝专题文献知识库与国内外科学数据型数据库的关联与整合,从而初步实现了乙肝病毒相关蛋白质的知识  相似文献   

10.
信息整合与数据挖掘技术在文献数据库创新性建设领域具有非常重要的意义,这已在国外同行的应用中取得了较好的效果,但国内对此项技术的研究和应用才刚刚起步。该研究通过广泛调研,制定了文献专题知识数据库的期刊和文献收录标准,以及数据库框架结构和数据录入标准。在此基础上,收集了国内外乙肝相关文献,借助期刊和文献影响力及专家内容分析等筛选方法筛选了近1.5万篇左右文献信息,构建了一个知识覆盖面广、文章质量高和分类标引好的乙肝专题文献知识库,并进一步通过构建文本挖掘工具字典,成功实现了乙肝专题文献知识库与国内外科学数据型数据库的关联与整合,从而初步实现了乙肝病毒相关蛋白质的知识挖掘。  相似文献   

11.
The essence of text mining and data mining is that a machine and software are used for content analysis of large digital corpora. The Publishing Research Consortium commissioned a study on content mining of scholarly journal articles with 29 expert interviews and an international survey among publishers. The main results are: (i) content mining developments appear to be accelerating with more applications in more areas; (ii) third‐party demand for content mining is widespread but still at low levels of frequency; (iii) publishers' permissions for content mining are quite liberal, especially for research‐driven mining requests; (iv) half of the publisher respondents undertake mining of their own content; and (v) content mining is on the rise – publishers and third parties both report an increase in planned mining activities. As content mining of journal articles spreads and intensifies, cross‐publisher solutions can better help facilitate content mining. The study investigated the interest and willingness of publishers to support a set of different solutions, from one shared content mining platform to commonly agreed access terms for mining and standardization of mining‐friendly content formats.  相似文献   

12.
文章通过统计重庆市专利申请和R&D 相关数据,在分析其发展趋势的基础上,运用SPSS 软件对专利申请 量和R&D 指标作相关性分析并建立回归模型。结果显示:专利申请量与R&D 支出呈显著正相关关系,政府、企业应 继续加大R&D 投入力度,尤其要发挥企业的主导作用。  相似文献   

13.
基于WWW的文本信息挖掘   总被引:42,自引:1,他引:41  
邹涛  黄源  张福炎 《情报学报》1999,18(4):291-295
基于 Internet 的信息挖掘是数据挖掘和数据仓库技术中的重要组成部分,也是网络信息处理领域中的一项新课题。本文介绍了网络信息挖掘的概念,并给出了在 World Wide Web 上针对文本信息进行信息挖掘的算法和步骤。  相似文献   

14.
知识发掘的概念及其相关理论研究   总被引:2,自引:1,他引:1  
程鹏 《图书情报工作》2010,54(18):111-115
知识发掘是撷取隐含、有用、未被发掘、有潜在价值的知识资源的一种过程,采用先进和传统的技术、方法和手段,对数据库内外的知识进行系统分析、挖掘、发现和利用,区别于数据库中的“知识发现”,强调发掘目的的有用性、发掘源头的广泛性、发掘手段的综合性、发掘内容的知识性、挖掘价值的潜在性、应用方式的具体性等特征。通过对“酵论”、“差论”、“圈论”的重点阐述,试图分别回答知识发掘过程中发掘什么、发掘范式、发掘环境等问题。  相似文献   

15.
数据采掘与信息资源的开发利用   总被引:10,自引:0,他引:10  
数据采掘是近年来迅速发展起来的一种开发信息资源的数据处理新技术。数据采掘可用于挖掘图书馆数据库或数据仓库中有用的信息和知识, 把数据仓库、OLAP、数据采掘、模型库结合起来, 可以构造出更高形式的图书馆决策支持系统。本文阐述了数据采掘的定义、特点、类型、功能、发现的知识类型及其发展趋势, 介绍了数据采掘的工具, 探讨了数据采掘的各种方法以及数据采掘与知识发现的关系等问题。  相似文献   

16.
构建基于Web数据挖掘技术的信息服务系统   总被引:5,自引:0,他引:5  
介绍Web数据挖掘的种类和方法,提出一个基于Web数据挖掘的信息服务系统结构,该结构以数据挖掘模块为中心,处理数据库、智能代理、Web服务器日志和用户接口多数据源的信息,以改善文献情报机构的服务质量。  相似文献   

17.
指出Web挖掘是从数据挖掘发展而来,是集合Web技术、数据挖掘、信息科学等多领域为一体的一项综合技术;介绍Web挖掘的概念、分类以及Web页面之间链接结构挖掘的HITS与Page-rank等算法;提出基于样本模式特征提取的信息检索方法。最后,分析Web链接挖掘面临的问题和未来研究的发展趋势。  相似文献   

18.
Web挖掘在个性化信息服务中的应用探讨   总被引:1,自引:0,他引:1  
数据挖掘是近年来新兴的计算技术与方法。在介绍Web数据挖掘的概念、挖掘步骤、以及Web挖掘三种技术的基础之上,探讨了Web数据挖掘在图书馆个性化信息服务过程中提供的技术支持。  相似文献   

19.
从分析国内外信息资源管理实践与理论的起源入手,对近年来建立在信息资源概念基础上的图书馆学、情报学和档案学等相关学科的集成趋势与特点进行探讨;认为信息资源管理这一概念具有集成相关学科领域知识而形成一个上位学科群的巨大包容力,开展信息资源管理教育十分必要。在对国内外信息职业发展现状和趋势进行研究后,从5个方面分析我国信息资源管理教育应关注的主要问题。  相似文献   

20.
泛在知识环境中数据挖掘技术进展分析   总被引:2,自引:0,他引:2  
本文针对泛在知识环境的特征和知识获取需求,重点从数据挖掘的智能演化、挖掘层次、发展要素三个主要方面进行调研分析,探讨了数据挖掘的本质要素及规律,指出基于智能语义处理的知识挖掘是数据挖掘发展的必然趋势.本文进一步提出,将人工智能领域的智能信息获取技术与知识管理领域的大规模语义知识处理技术相结合,构建语义知识表示、分析、检索、推理、挖掘等一体化的知识挖掘体系,是实现大规模知识获取和提升其智能水平的有效途径.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号