首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于有序复合策略的数据流最大频繁项集挖掘
引用本文:琚春华,许翀寰.基于有序复合策略的数据流最大频繁项集挖掘[J].情报学报,2010,29(5).
作者姓名:琚春华  许翀寰
作者单位:1. 浙江工商大学现代商贸中心,杭州,310018;浙江工商大学计算机与信息工程学院,杭州,310018
2. 浙江工商大学计算机与信息工程学院,杭州,310018;浙江工商大学工商管理学院,杭州,310018
基金项目:国家自然科学基金,浙江省自然科学基金重点项目 
摘    要:挖掘最大频繁项集的优势在于得到的项目数量较少.相比频繁项集和频繁闭合项集挖掘算法,此类算法具有较高的时间和空间效率.根据数据流的特点,结合滑动窗口,提出一种基于有序复合策略的数据流最大频繁项集挖掘算法(E-FPMFI).当数据流流过时,以基本窗口为单位,更新获取数据流片段信息,单遍扫描片段信息得到频繁项目并存储于频繁项目列表内.算法的核心思想:构建有序FP-tree,采用混合子集剪枝技术削减搜索空间,合并同一分支中支持数相等的邻接结点,压缩生成有序复合FP-tree,挖掘最大频繁项集时避免超集检验.经实验验证, E-FPMFI算法具有较好的时空效率和良好的可扩展性.

关 键 词:数据流  最大频繁项集  滑动窗口  有序复合FP-tree

Maximal Frequent Itemsets in Data Stream Mining Based on Orderly-Compound Policy
Ju Chunhua,Xu Chonghuan.Maximal Frequent Itemsets in Data Stream Mining Based on Orderly-Compound Policy[J].Journal of the China Society for Scientific andTechnical Information,2010,29(5).
Authors:Ju Chunhua  Xu Chonghuan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号