首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
肖强  钱晓东 《图书情报工作》2011,55(16):136-139
针对传统关联规则算法中事务扫描的重复性以及最小支持度设定的不确定性,导致关联规则挖掘算法扫描事务数据库运行效率低下的问题,提出一种基于K-means的Web访问用户关联规则挖掘算法,该算法利用K-means算法聚类的效果,将Web访问用户数据集聚类为不同的小数据集,采用不同的最小支持度,分别对Web访问用户聚类小数据集进行关联规则挖掘。分析和实验结果证明,该算法可有效提高传统关联规则挖掘算法的效率,同时也可有效避免传统关联算法中扫描中的重复性。  相似文献   

2.
本文概括了Web挖掘在数字图书馆中的应用、Web挖掘的难点及XML在Web数据挖掘中的优势,说明了将XML应用于Web数据挖掘的几个方面,最后给出一个利用XML及Java类进行Web挖掘的实例.  相似文献   

3.
阮光册 《图书情报工作》2011,55(11):121-124
网络用户行为研究大多采用Web用户日志挖掘,首先介绍Web关联规则应用的传统方法,并指出传统方法中忽略了用户兴趣这一因素研究,更多的是以网页高频出现为挖掘结果进行聚类。针对这一问题,提出一种基于Web关联规则挖掘、页面内容和会话相似度相结合的研究方法,聚类出用户频繁访问的页面组,以发现网络用户行为的规律。在案例应用中,以上海某高校学生网络行为研究为例,得出相关结论。  相似文献   

4.
基于XML的Web日志挖掘研究*   总被引:2,自引:0,他引:2  
设计一个基于XML的Web日志挖掘体系结构,简要介绍XGMML和LOGML,并在此基础上讨论LOGML文档的生成方法及利用Apriori算法对日志文档进行频繁集、频繁序列和频繁子图挖掘。  相似文献   

5.
基于Web结构挖掘的网络动态竞争情报采集研究   总被引:2,自引:0,他引:2       下载免费PDF全文
通过挖掘蕴含在Web内部结构和网页中的关联信息与结构模式,Web结构挖掘为企业实现多维度和多层面的竞争情报采集提供了一种有效途径。基于Web结构挖掘的网络动态竞争情报采集方法有:URL挖掘、Web内部结构挖掘和超链接挖掘。图1。参考文献15。  相似文献   

6.
介绍了数据挖掘中的关联规则和基于Apriori算法的关联规则数据挖掘技术,并使用关联规则挖掘对医学图书馆中的流通数据进行了实例分析.  相似文献   

7.
利用XML实现图书馆Web数据库的动态发布   总被引:4,自引:0,他引:4  
介绍了XML以及基于XML的三层C/S模型,探讨了利用XML实现图书馆Web数据库动态发布的设计思想,并通过示例展示了基于XML的图书馆Web数据库动态发布的具体实现。  相似文献   

8.
基于关联规则挖掘的查询扩展模型研究   总被引:1,自引:0,他引:1  
为了将关联规则挖掘技术更好地应用于信息检索查询扩展,通过对基于关联规则挖掘的查询扩展模型的深入研究,归纳出4类共13种查询扩展模型,理论分析和实验比较各个查询扩展模型的检索性能,试图发现一些优秀的扩展模型。  相似文献   

9.
完全加权关联规则挖掘是关联规则挖掘的一个重要分支。本文在论述完全加权关联规则挖掘技术的基础上,探讨其在数字图书馆信息处理中的应用价值,并给出一种基于完全加权关联规则挖掘的数字图书馆信息检索模型。  相似文献   

10.
Web抽取技术在数字图书馆中的应用   总被引:2,自引:0,他引:2  
从Web页面中挖掘有价值的信息是数字图书馆技术应用的一个重要方式。目前Web页面信息描述大多教是用XML表示的,Web数据抽取技术是Web信息挖掘的关键,文章提出了一种面向HTML或XML描述的web页面的web数据抽取模型并阐述了实现过程。  相似文献   

11.
根据互信息、RBF神经网络和关联规则原理,提出了一种抽取WEB文本分类规则的新方法。先根据互信息选择和各类相关程度大的若干词条,然后采用RBF神经网络方法对选择的特征进行进一步提取,得到维数较小的文本特征向量空间。之后再根据挖掘出的关联规则获取WEB文本分类规则,建立文本分类器,在保证了分类精度的前提下抽取出利于理解的文本分类规则。  相似文献   

12.
文献数据库中书目信息共现挖掘系统的开发   总被引:9,自引:0,他引:9  
针对权威的生物医学数据库和引文索引数据,介绍一个基于文献数据库中书目信息共现关系进行文本挖掘的系统。该系统具有基本的文献计量学分析功能,并对相应的结果进行可视化表达;对高频主题词、高产作者和高被引论文和高被引作者进行共现分析,据此进行聚类分析和关联分析,获得有关的研究主题聚类和主题词/副主题词关联规则、合著聚类分析、高被引论文同被引聚类分析和高被引作者同被引聚类分析的结果和可视化表达。其中对关联规则的分析可以发现主题词之间的潜在语义规则,其他的文献计量学指标和共现分析结果可以用于科学计量学的分析。  相似文献   

13.
采用数据挖掘技术中的关联分析和聚类方法,重点研究Web日志兴趣发现的理论和方法,指出普通日志记录方法的局限性,提出过滤用户偏好的定制Web日志方法,实验结果验证通过该方法采集的数据,可以发现隐藏在日志数据中的关联规则,同时找到相似用户的兴趣和偏好,并且能够提高过滤用户兴趣偏好的精度。  相似文献   

14.
大多数传统的数据挖掘算法,通常是在二进制值的事务数据库中在单一层次上发现属性之间的关联关系即关联规则,但是大多数的数据库包含有大量量化的值。通常人们采用分区的方法处理量化值,然而这种处理方法带来分区过硬的问题。本文使用模糊的方法从Web日志中发现模糊泛化的Web网页之间的关联规则,它们能够体现出带模糊浏览时间的网页之间的关联关系。通过实例分析表明,该算法在可承受的计算时间内可对Web日志中的用户存取模式进行有效的模糊泛化关联规则的提取。  相似文献   

15.
使用Visual Studio.NET开发平台,C#程序设计语言,采用XML网页元数据描述框架,对网络专题知识库系统进行设计开发。对该系统的HTML网页元数据采集与XML文件生成、知识点挖掘、网络专题知识XML文件与关系型数据库快速转换等关键技术进行研究与实现。  相似文献   

16.
关联规则挖掘算法通常生成大量的规则,但由于资源的限制,只有少量规则可能被筛选出来使用。因此关联规则的兴趣度评价成为数据挖掘领域中的一个重要问题。考虑到关联规则兴趣度评价本质上是一个多属性决策问题,本文首先基于关联规则的客观兴趣度度量和用户的主观偏好,建立了关联规则评价指标体系;然后提出一种基于组合评价方法的关联规则评价的框架及其具体实现步骤,以解决多种评价方法评价结果不一致的问题;最后以某超市购物篮数据分析为例,基于整体差异的组合评价方法实现了关联规则的组合评价以验证所提评价方法的可行性和有效性。  相似文献   

17.
Web 是动态性极强的信息源,访问、分析信息必须研究异构数据的集成问题,并选择合适的技术进行数据 分析、集成和处理。怎样对Web 海量的数据信息进行深层次的应用已成为数据挖掘技术的研究热点。本文介绍了XML (可扩展标记语言)在Web 数据挖掘中的应用,探讨了Web 数据挖掘中的数据异构问题。通过XML技术建立数据抽取模 型,解决互联网上绝大多数因异构、非结构化所导致的Web 数据挖掘问题。  相似文献   

18.
文章针对21世纪数字图书馆中图书馆员应如何进行有效的信息服务,研究了XML技术与面向Web的数据挖掘技术.随着XML作为Web上交换数据的一种标准方式的出现,Web挖掘将会变得非常轻松,成为未来信息检索的主要工具.参考文献6.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号