首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 195 毫秒
1.
为了解决频繁闭项目集挖掘中时间和存储开销大的问题,提出了一种基于FC-tree(频繁闭模式树)的频繁闭项目集挖掘算法max-FCIA(最大频繁闭项目集挖掘算法).该算法利用哈希表映射事务数据库,通过对哈希表进行操作从而得到所有频繁项目集的支持度,进而生成包含所有频繁项目的有序树.经过剪枝处理的有序树就是包含所有最小频繁闭项目集的FC-tree,最后用最小频繁闭项目集生成频繁闭项目集.实验结果表明,该算法通过映射事务数据库,减少了扫描数据库所浪费的时间,提高程序执行效率.另外,运用有效的剪枝策略,避免了不必要候选项目集的生成,节省了存储空间,实验证明该算法是有效的.  相似文献   

2.
针对数据删除的关联规则的更新问题,提出了一种新的算法,该算法充分利用了保留下来的原数据库中所有项目的计数以及挖掘出来的最大频繁项目集及其计数,找出更新后的数据库中新增的频繁一项集和被删除的原频繁一项集,进而挖掘出更新后的关联规则。  相似文献   

3.
关联规则挖掘算法是数据挖掘领域的主要研究方向之一。对几种经典的关联规则挖掘算法进行了分析、探讨和比较,给出了一种基于支持矩阵的、不需要产生候选项目集的算法设计思想。算法为事务数据库中的每个项目设置二进制向量,利用逻辑与运算构造支持矩阵来挖掘频繁项目集,极大地节省了存储空间,提高了算法运行效率。  相似文献   

4.
提出了一种挖掘频繁项目集的有效算法——FFP-Growth,该算法采用自底向上的策略搜索频繁模式树,但不同于FP-Growth的是它无须生成条件模式基和频繁模式子树,且生成的频繁模式树较TD-FP-Growth生成的频繁模式树小,因而能提高关联规则的挖掘效率.类似于TD-FP-Growth的扩展TD-FP-Growth(M)和TD-FP-Growth(C),FFP-Growth很容易被扩展,以此来有效地减小搜索空间.实验结果表明本提出的算法是有效可行的.  相似文献   

5.
《嘉应学院学报》2017,(8):21-25
提出了一种利用FP树表示增量数据库,然后进行增量挖掘的方法,即IA_FP-Growth算法.算法重构和合并两个小的时间上连续的FP树,以获得由FP-Growth算法生成的FP树.与其他从数据库读取事务的顺序增量算法不同,IA_FP-Growth算法使用原FP-tree作为预处理数据库来获取项目集,因此其花费较少的时间来构建新的增量FP-tree项目.实验结果表明,随着数据库大小的增加,IA_FP-Growth的运行时间的增加要少得多,而且与其他算法比较也是最少的.  相似文献   

6.
频繁项目集挖掘是数据挖掘应用研究的一个重要研究内容.文章在FP-Growth算法的基础上,提出了一种基于集合的频繁项目集挖掘算法,该算法直接对FP-tree进行挖掘,不需要产生节点的条件模式基,因此在挖掘频繁模式集时节省了空间和时间,提高了算法的执行效率.最后对该算法进行了实例分析.  相似文献   

7.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

8.
分布式互斥请求集的性能,对基于竞争的分布式互斥算法的消息复杂度、对称性、同步时间及容错能力等均具有直接影响.而分布式互斥请求集生成算法性能,如时间复杂度、空间复杂度,则对算法的运行速度、计算能力具有直接影响.通过对基于循环编码的分布式互斥请求集生成算法运行过程的研究,特别是对该算法的时间复杂度的研究,提出一种改进的基于循环编码的分布式互斥请求集生成算法.此算法在不明显增加算法空间复杂度和请求集长度的基础上,能够显著提高请求集生成算法的时间复杂度,从而使得算法的运行速度和计算能力都得到显著增加.  相似文献   

9.
更新挖掘最大频繁项目集是多种数据挖掘应用中的重要问题,其发现过程的高花费要求对高效更新挖掘算法进行研究,提出了一种快速的更新挖掘最大频繁项目集算法,其能够在原有挖掘结果的基础上,有效地挖掘出更新后的数据库中隐含的新最大频繁项目集.  相似文献   

10.
发现最大频繁项目集在关联规则挖掘中有着重要意义。通过已发现的最大频繁项目集,可容易地发现频繁项目集。提出了一种基于事务树(T-tree)的最大频繁项目集挖掘算法MFIA(Maximum Frequent Itemsets Algorithm),其挖掘过程中只需对数据库扫描一次,从而提高了最大频繁项目集的挖掘效率。  相似文献   

11.
有效的挖掘频繁项集是挖掘最大频繁项集的关键步骤.为了克服Apriori算法在挖掘最大频繁项集上的不足,以及FP-Tree存储结构算法多次遍历的缺点,本文引进了新的矩阵技术,减少了FP-Tree遍历次数来挖掘频繁项集,提高了挖掘频繁项集和最大频繁项集效率.并以此提出基于FP-Tree的改进算法FPgrowth*和FPmax*.最后实验结果说明,矩阵技术的引进有效的提高了频繁项集和最大频繁项集挖掘效率.  相似文献   

12.
针对关联规则负增量更新的挖掘问题,提出了一种高效的关联规则负增量更新算法,即NIUA。该算法充分利用原数据库中已有的频繁项集、所有1-项集来生成最小非频繁项集;并采用选样等策略求出删减数据后的频繁项集。整个算法只需扫描删减后的事务数据库一遍,从而提高了关联规则的更新效率。  相似文献   

13.
陈建辉 《宜春学院学报》2007,29(4):87-88,122
在对关联规则挖掘算法Apriori进行深入研究的基础上,提出了一种改进的算法SDA算法,在三个方面进行了改进:(1)频繁2-项集生成方法;(2)改进Apriori_gen算法(3)减少事务数据库.在实验数据集上所做的实验结果表明SDA算法是有效的.  相似文献   

14.
We propose a structural equation model, which reduces to a multidimensional latent class item response theory model, for the analysis of binary item responses with nonignorable missingness. The missingness mechanism is driven by 2 sets of latent variables: one describing the propensity to respond and the other referred to the abilities measured by the test items. These latent variables are assumed to have a discrete distribution, so as to reduce the number of parametric assumptions regarding the latent structure of the model. Individual covariates can also be included through a multinomial logistic parameterization for the distribution of the latent variables. Given the discrete nature of this distribution, the proposed model is efficiently estimated by the expectation–maximization algorithm. A simulation study is performed to evaluate the finite-sample properties of the parameter estimates. Moreover, an application is illustrated with data coming from a student entry test for the admission to some university courses.  相似文献   

15.
数据挖掘是目前信息领域和数据库技术的前沿研究课题。关联规则技术是数据挖掘的最重要的组成部分之一,它用于发现大量数据中项集之间的有意义的关联和相关联系。在给出教学评估数据挖掘系统的框架之后,使用相关数据进行关联规则算法的实验,对结果进行初步分析,其得出的结论对高校教学评估和教学工作都具有一定的指导意义。  相似文献   

16.
采用随机整群抽样抽取505名中小学教师作为被试,其中,男教师189名,女教师271名,年龄均在25至55岁之间。采用教学效能感问卷进行施测,基于项目反应理论,对测试结果进行分析,得出所有项目的区分度、难度和项目信息峰值,参考项目区分度、难度及项目信息函数峰值对教学效能感量表做了修订,再运用结构方程模型、层面理论技术和最小空间分析对修订后的量表进行质量检验,结果表明修订后的量表测量拥有更为清晰的结构效度和更高的信度,测量更为精确。运用SPSS15.0管理数据,运用Hudap6.0和MULTILOG 7.03分析数据,研究得出如下五个结论:1)教学效能感量表为单一维度,可以使用项目反应理论进行分析;2)修订后的量表项目的区分度、难度更为合理;3)修订后的量表的测验信息峰值较原量表稍低;4)修订前后量表对应层面元素之间存在高相关;5)量表的三个方面内容结构得以证实,即学生品德行为教育、课堂组织管理和知识传授。  相似文献   

17.
引入数据挖掘对高校教学进行客观、公平的评估,并使用相关数据进行关联规则算法的实验,实现了对结果的初步分析。所得出的结论对高校教学评估和教学工作都具有一定的指导意义。  相似文献   

18.
新一轮高考综合改革虽然已平稳落地,但也遇到一些困难和考验,需要从考试技术层面入手,运用现代测评理论与技术破解,包括:寻找具有公平性、科学性、可行性的赋分方法,优化赋分机制;加强命题理论指导,优化命题方式,建设命题质量控制机制,促进命题由经验式向专业化转变;利用大数据挖掘技术,充分挖掘考试结果信息,推进考试向评价转变;运用现代信息技术和人工智能,推进“互联网+考试”发展,推进考试方式、考试组织实施和服务考生的智能化。  相似文献   

19.
采用文献资料、数理统计等方法,将组成女子七项全能的各单项指标建立关联树.运用灰色系统理论中的关联分析法对8名优秀女子七项全能运动员的各单项成绩与总成绩进行分析得出:女子七项全能总成绩组成中最重要的单项成绩是100米栏和跳高,其次对总成绩有较大影响的单项是跳高和200米.相对影响较小的是持器械类的铅球和标枪.针对所得出的结论提出了女子七项全能运动员在优势项目中应该加强训练的建议,对我国女子七项全能运动员的训练和总成绩的提高提供一些理论依据作为参考.  相似文献   

20.
试题命制的理论和技术(二)   总被引:1,自引:0,他引:1  
雷新勇  周群 《考试研究》2008,(2):90-106
大规模教育考试试题命制以心理学的某些理论假设为基础。与这些理论假设一致的试题定义要求试题应该具备三个要素,即测量目标、刺激情境和设问,这三个要素缺失了任何一个,都不能构成完整的试题。根据这些理论假设以及试题定义和要素,本文讨论了命制客观题和主观题的基本要求,客观题包括题干的要求、选项设置的要求以及选项数的问题;主观题包括情境材料的选择、设问、赋分和评分标准制定。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号