首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 626 毫秒
1.
Web文本挖掘技术研究   总被引:1,自引:0,他引:1  
WWW上的信息量迅猛增长,Internet成为一个拥有大量Web文本资源的巨型数据库。大量异构、非结构化的Web文本对数据挖掘技术提出新的挑战。分析了Web文本的特点、Web文本挖掘的一般流程以及Web文本挖掘中的关键技术。  相似文献   

2.
介绍了数据挖掘和Web挖掘的基本概念,在此基础上,对基于Web的文本信息挖掘技术进行了分析研究,给出了一个基于Web的文本挖掘的结构模型。  相似文献   

3.
介绍了文本数据挖掘和知识提取的基本理论,然后分析了网络信息的检索与挖掘的特征,特别是文本挖掘、Web数据挖掘和基于内容数据挖掘与之相关联的系列问题.在此基础上,分析了Web知识库的设计、建立、文本数据挖掘和知识发现所需的理论和技术,对Web知识库系统的架构和功能模块进行分析和设计,建立了基于文本数据挖掘的Web网络知识库的模型.  相似文献   

4.
文本挖掘在Web中的技术分析   总被引:1,自引:0,他引:1  
根据调查,各领域的信息存储约有80%包含在文本文档中,文本挖掘因此也被认为比数据挖掘具有更高的商业潜力。作为从浩瀚的Web信息资源中发现潜在的、有价值知识的一种有效技术,Web领域的挖掘技术正悄然兴起,备受关注。本文重点阐述文本挖掘在Web中对信息抽取、挖掘过程及超文本挖掘技术的分析及应用。  相似文献   

5.
构建基于Web数据挖掘的信息服务系统   总被引:2,自引:1,他引:2  
黄媛 《情报探索》2004,(4):109-110
介绍了Web数据挖掘的种类和方法,建立一个基于Web数据挖掘的信息服务系统。以数据挖掘模块为中心,处理数据库、智能代理、Web服务器日志和用户接口多数据源的信息,以改善信息服务机构的服务质量。  相似文献   

6.
通过研究Deep Web数据库的集成及词频数准确估算问题,提出Deep Web数据库三层集成构建体系和一种有效估算Deep Web数据库的大小和词频关系的方法,可以准确有效地估算Deep Web数据库中的信息数据大小词频数。实现了对Deep Web数据库宏观处理。对文本特征提取算法进行研究,研究了瑕疵文本去除率(去伪)和有用文本提取率(存真)等性能比较指标,得到算法瑕疵文本去除率相对传统算法是最优秀的,然而其存真的有用文本提取率UR相对较低。仿真实验表明:当数据集样本数大于5000时,词频趋于收敛稳定,取得5000样本数据集为有效最小值,所得到的趋于稳定后得到词频结果与实际词频结果是基本一致的。研究结果对Deep Web数据库的宏观统计决策和单个Deep Web数据库的查询效率问题有重要指导作用。  相似文献   

7.
聚类分析在Web文本挖掘中的应用   总被引:2,自引:0,他引:2  
徐海霞 《情报杂志》2004,23(12):99-101
在区分Web挖掘与数据挖掘的基础上,较详细地分析了Web文本挖掘的过程,并给出了一个具体的Web文本挖掘模型。重点在介绍聚类分析的基础上,以PCCS为算法原型分析了聚类分析在Web文本挖掘中的具体应用。  相似文献   

8.
宜建军 《现代情报》2006,26(3):146-147,149
基于Web数据挖掘的图书馆UIS系统涉及到很多方面的内容。该系统利用Web数据挖掘技术获取用户需求信息、用户咨询信息。再结合图书馆自己的综合数据库,并在互联网上利用电子邮件、短信等方式,采满足用户的需要。进行相应的用户关系管理。  相似文献   

9.
基于Web文本挖掘的企业竞争情报获取方法研究   总被引:1,自引:0,他引:1  
本文从Web数据挖掘方法入手,介绍了企业竞争情报的获取方法,包括基于Web内容挖掘的获取方法、基于Web结构挖掘的获取方法和基于Web使用记录挖掘的获取方法,进而研究了基于web文本挖掘的竞争情报获取步骤,最后剖析了基于Web文本挖掘的企业竞争情报中客户知识获取的案例。  相似文献   

10.
熊启军 《情报杂志》2007,26(4):78-79,83
从Web技术的层面对网络信息的静态挖掘(内容挖掘、结构挖掘)和动态挖掘(使用挖掘)进行了比较,分析了以Web技术为支撑的网络信息实体挖掘与过程挖掘的特征,阐述了Web网络信息挖掘对于信息现实价值与信息未来增值的双重功能。  相似文献   

11.
作为一项通用的知识发现技术,数据挖掘技术旨在从少量数据中提取出人们感兴趣的数据信息。文章对数据挖掘概念的产生,数据挖掘与常规数据分析的主要区别,所能解决的几大类问题和所应用的领域都有清晰的论述,并且结合数据挖掘的应用模型及技术提出了数据挖掘的应用前景。  相似文献   

12.
汪秀 《大众科技》2013,(8):160-162
数据挖掘技术中的分类和回归树(classmcationAndRegressionTree,CART)节点是一种基于树的分类预测方法,使用递归分区来将训练记录分割类似的输出字段值。文章将C&R树应用于市场营销研究,目标是寻找意愿接受互动新闻服务并购买的潜在客户。通过使用已有的客P数据作为训练样本,建立了一个分类回归模型,可以用于未来数据的预测,从而有助于企业更好地针对不同类型的客户进行不同的营销策略。  相似文献   

13.
数据挖掘在数字图书馆中的应用   总被引:28,自引:1,他引:28  
王艳 《情报科学》2003,21(2):211-214
本文在描述数据挖掘技术与方法的基础上,探讨了数据挖掘在数字图书馆中的应用空间以及其所具有的巨大应用价值。  相似文献   

14.
浅析数据挖掘软件的发展   总被引:5,自引:0,他引:5  
叙述了数据挖掘软件的发展情况,并介绍了几种常用的数据挖掘软件,对数据挖掘软件的应用与发展前景进行了一定的分析。  相似文献   

15.
网络信息挖掘系统评价初探   总被引:1,自引:0,他引:1  
贾丰  张燕 《情报理论与实践》2003,26(3):267-269,237
随着电子商务的蓬勃兴起 ,许多企业已经开始意识到其所拥有的丰富的信息资源在商业决策中具有潜在的巨大商业价值。更好的决策支持需求和企业电子商务的开展正推动着网络信息挖掘系统的研究与开发。鉴于网络信息挖掘是在数据挖掘的基础上发展起来的 ,因此对于网络信息挖掘系统的基本问题 ,本文仍将利用数据挖掘系统的基本理论来描述。目前 ,由于网络信息挖掘系统的发展正在起步阶段 ,因此它的分类还无法达到数据挖掘系统分类那样细致。具体而言 ,对网络信息挖掘系统分类可以从商业能力、挖掘数据类型、挖掘功能、数据分析方法和应用领域角度…  相似文献   

16.
数据挖掘在图书采购中的应用   总被引:11,自引:0,他引:11  
充分利用有限的资金采购真正符合读者需要的图书、提高图书的使用率是本研究的目的。本文归纳了图书采购的常用策略 ,详细论述了应用数据挖掘技术确定图书采购策略的方法 ,是挖掘图书馆计算机管理系统的潜力、提高管理水平和读者服务水平的有益探索。  相似文献   

17.
网络信息挖掘是从丰富的网络信息源和用户使用网络的行为数据中抽取有用的模式和隐含信息。文章分析了网络信息挖掘结果评价的必要性,介绍了网络信息挖掘常用方法的效果评价的做法与相关指标,构建了网络信息挖掘效果评价的体系,并指出应该注意的一些问题。  相似文献   

18.
基于数据挖掘技术的专利信息分析   总被引:3,自引:0,他引:3  
马芳  王效岳 《情报科学》2008,28(11):1672-1675
随着计算机技术和网络技术的的发展,各行各业积累的数据量越来越大.而专利信息集是目前世界上最大的技术信息集,几乎囊括了一切应用领域内的技术成果.为了提取隐含在其中的、人们事先不知道但又潜在有用的知识,将数据挖掘技术应用于专利信息分析,如采用聚类算法对专利文本进行挖掘、采用关联规则对专利发明人进行挖掘,以发现用户感兴趣的知识,并使之转化为有效的竞争情报.  相似文献   

19.
浅谈数据挖掘技术及其研究现状   总被引:1,自引:0,他引:1  
刘先花 《现代情报》2010,30(3):167-169
本文首先介绍了数据挖掘的概念、过程与系统构成,其次从数据挖掘的研究方法和应用角度论述了数据挖掘的研究现状,其中着重论述了目前的热点研究方向——Web挖掘的流程与分类。  相似文献   

20.
Data availability and access to various platforms, is changing the nature of Information Systems (IS) studies. Such studies often use large datasets, which may incorporate structured and unstructured data, from various platforms. The questions that such papers address, in turn, may attempt to use methods from computational science like sentiment mining, text mining, network science and image analytics to derive insights. However, there is often a weak theoretical contribution in many of these studies. We point out the need for such studies to contribute back to the IS discipline, whereby findings can explain more about the phenomenon surrounding the interaction of people with technology artefacts and the ecosystem within which these contextual usage is situated. Our opinion paper attempts to address this gap and provide insights on the methodological adaptations required in “big data studies” to be converted into “IS research” and contribute to theory building in information systems.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号