首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 625 毫秒
1.
语义web是web2.0时代计算机对网络发展做出的定义,是自动语义处理用户的数据,以帮助用户使用,同时提供个性化的服务。web数据挖掘是数据挖掘的一个应用,利用数据挖掘技术从网络文档中抽取并且发现信息,着重从web日志和数据中发现模式。语义结构可以通过web挖掘发现的模式或关系来构建,通过结合两个应用程序,实现语义web挖掘。在电子教学中的web挖掘应用,已成为一个教育的基本组件。  相似文献   

2.
XML作为基于web的描述数据、交换数据标准,正日益流行和普及,因此从web的大量数据中挖掘XML数据变得日益重要。本从Apriorl算法出发,提出了基于Apriorl应用的XML关联关系的挖掘算法。  相似文献   

3.
基于Web使用挖掘的个性化推荐系统   总被引:1,自引:0,他引:1  
Web使用模式挖掘是对用户浏览Web后在服务器日志上所留信息的数据挖掘。讨论了挖掘中常用技术及流程,并提出一种Web使用模式挖掘体系结构,介绍了系统的工作原理,对系统设计中的推荐算法等关键技术作了详细讨论。关  相似文献   

4.
介绍web挖掘的技术基础,阐述了web挖掘的含义,从web数据中发现潜在的有用信息和先前不知道的知识.描述了web挖掘的现状、分类以及web挖掘技术的流程,并对web挖掘的前景加以展望.  相似文献   

5.
首先介绍了Web数据挖掘的概念及常见的三种web数据挖掘模式:Web内容挖掘、Web结构挖掘、Web访问挖掘,然后对Web数据挖掘在个性化网络学习中的应用空间分两个方面进行分析。  相似文献   

6.
介绍web挖掘的技术基础,阐述了Web挖掘的含义,从Web数据中发现潜在的有用信息和先前不知道的知识。描述了web挖掘的现状、分类以及web挖掘技术的流程,并对web挖掘的前景加以展望。  相似文献   

7.
日志是计算机取证、入侵检测分析的重要数据来源,运用关联规则挖掘算法对日志进行分析是获取日志中所蕴含有用信息的重要方法,针对基于置信度-支持度框架的常用关联规则挖掘算法在日志分析中存在的不足,引入日志关键属性的概念,提出了基于关键属性约束的关联规则挖掘算法。实验结果表明,该算法能有效阻止无趣规则的产生,提高挖掘结果的有效性。  相似文献   

8.
从阐述数据库应用系统体系结构入手,分析了客户机/服务器(C/S)模式与浏览器/服务器(B/S)模式的各自优劣,基于web的数据库应用系统开发模式比客户机/服务器模式性能更好。设计开发了基于web的某武装部信息管理系统.  相似文献   

9.
web挖掘技术是指从大量的web数据中提取隐含的、先前未知的、有潜在应用价值的模式、规则和知识,它是在数字图书馆中应用广泛的新技术。以XML为基础的新一代Web环境是直接面对Web数据的,不仅可以4良好地兼容原有的Web的应用,而又可以更好地实现Web中的信息共享与交换。本文介绍了基于XML的web挖掘技术的特点、方法及在数字图书馆中的应用。  相似文献   

10.
为了提高从web中挖掘数据记录的精确性和完整性,提出了同构页与目录页的概念及3个算法.如果一组网页结构相同,只是主信息不同,该网页称为同构页.一个包含有多个指向同构页连接的网页称为目录页.算法1用于发现目录页,它首先将连接排序,并对同一目录的链接记数,如果记数大于某一给定阀值,则对其链接子页进行相似比较并得到结果.同时给出了一个网页相似度判断的函数.算法2采用了噪声信息过滤方法从同构页中挖掘主信息并得到数据记录,该算法是基于在2个同构页中噪声信息相同而只有主信息不同.算法3通过采用Spider技术可以实现从整个网站中自动挖掘数据记录.实验表明所提算法比已有算法可挖掘更完整的数据记录.从同构页中挖掘数据记录是一种有效的方法.  相似文献   

11.
随着www的广泛应用及相应的Web技术的出现,使数据挖掘的研究进入了一个新的阶段.关联规则挖掘是数据挖掘中的一个重要研究分支.本文提出了一种Web日志挖掘中频繁访问页组的加强算法.  相似文献   

12.
Web文本挖掘是数据挖掘技术在网络信息处理中的一个重要应用,如何将web文档转换成数据挖掘所要求的格式,即web文档预处理是一项很重要的研究课题.本文的方法是:从Internet网上下载了大量的网页文件,将网页文件转换成文本文件,然后通过算法对这些文本文件中的数据进行词频统计,删除非用词,去掉高频词,对单词进行词根处理,建立用词词表,从而抽取用词,按字母排序生成词频索引,和字典文件进行对照,获取单词的ID,最后生成Reuters-21578的Database数据格式.这样就将web文档数据转换成标准的数据集,以便为数据挖掘中分类、聚类作好准备.  相似文献   

13.
基于Web挖掘的个性化信息服务系统的设计   总被引:1,自引:0,他引:1  
W eb挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。本文探讨了W eb挖掘的基本流程,提出了一种基于W eb挖掘的图书馆个性化信息服务系统实现方案。  相似文献   

14.
属性约简是基于粗糙集的数据挖掘方法中最重要的思想和算法,采用经典的数据分析工具得到最小约简是一个NP问题,由此产生了许多启发式属性约简算法。对不完备信息系统中数据动态变化的问题做了研究,对已有的算法做了改进,并通过实际算例分析,验证了算法的有效性。  相似文献   

15.
该文首先剖析了数据挖掘技术,并阐述了XML在数据挖掘中的应用优势,然后构建了一个基于XML的面向多种Web教据的挖掘系统模型,最后详细介绍了模型中的三个层次构成,并介绍了其中关键技术的实现方法,以期为Web数据挖掘的研究提供参考.  相似文献   

16.
阐述了动态取证的特点,基于基本的数据挖掘算法,结合约束属性的限制,设计了一种改进的WWW日志的动态取证模型,并且用程序进行了简单的实现。实践证明,该方法提高了对WWW日志的挖掘效率和准确率,为案情提供了有效线索。  相似文献   

17.
针对银行CRM中的数据冗余大、数据挖掘效率低的问题,将基于属性约简的数据预处理方法应用在银行CRM中.使用决策表属性重要度属性约简算法简化客户贡献度决策表,实现决策表条件属性的归约.通过该算法在某商业银行CRM数据预处理过程中的实际应用,证实约简算法应用在银行CRM系统是有效可行的.  相似文献   

18.
聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法。聚类无论在商务领域,还是在生物学、Web文档分类、图像处理等其他领域都得到了有效的应用。本文主要研究的是基于迭代思想的聚类算法。  相似文献   

19.
设计中文网页聚类系统是为了便于从动态Web文本集中快速、有效地挖掘知识。该系统以经典聚类算法为基础,通过比较网页相似度,将相似度高的网页聚合,并提交用户界面显示。通过应用模糊数学中的不确定度,表达了样本类属不同的模糊性,从而更为真实地反映客观情况,改善了以往确定归属某一类的不完整信息收集,结果更具客观性。  相似文献   

20.
介绍了粗糙集的布尔矩阵表示及其重要性,重点研究了基于条件区分能力的属性约简及其改进算法,构造了基于核与条件区分能力,加权条件区分能力的两种属性约简算法,提高了数据挖掘速度.通过实例证明了该算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号