期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

邓晓懿金淳樋口良之韩庆平《情报学报》2011,30(9)

关联规则挖掘是解决电子商务推荐问题的重要方法之一.针对传统关联规则挖掘算法在解决移动电子商务环境个性化推荐问题时反复扫描数据库,频繁项挖掘效率低,关联规则挖掘准确率低以及规则大量冗余等不足,提出一个基于事务矩阵和用户兴趣度的关联规则挖掘算法(Matrix-and-Interestingness-based Association Rules Mining,MIbARM).该算法仅需扫描一次数据库,并在挖掘过程中不断缩小算法搜索空间以避免生成冗余候选项,同时避免了冗余规则挖掘,从而提高了挖掘效率.最后,在四组人工数据和160种参数组合的数值实验环境下,引入Apriori、CBAR 及BitTableFI算法对MIbARM进行对比验证.结果表明,在不减少有趣规则的前提下,MIbARM不但可有效避免冗余候选项集的产生,而且大幅减少了冗余规则数量,极大提高了算法的搜索效率,同时提升了个性化推荐的质量,更适用于移动电子商务环境下的个性化推荐问题. 相似文献

2.

基于页面内容和会话相似的网络用户行为研究

阮光册《图书情报工作》2011,55(11):121-124

网络用户行为研究大多采用Web用户日志挖掘,首先介绍Web关联规则应用的传统方法,并指出传统方法中忽略了用户兴趣这一因素研究,更多的是以网页高频出现为挖掘结果进行聚类。针对这一问题,提出一种基于Web关联规则挖掘、页面内容和会话相似度相结合的研究方法,聚类出用户频繁访问的页面组,以发现网络用户行为的规律。在案例应用中,以上海某高校学生网络行为研究为例,得出相关结论。相似文献

3.

基于人工免疫系统的关联规则增量挖掘

苏一丹顾新一黎竹娟《情报学报》2009,28(2)

本文采用人工免疫算法进行关联规则挖掘,通过权值设置发现在事务数据集中有意义的二进制关系,将挖掘工作集中在那些有着特殊权值的有意义的关联项,避免了挖掘工作在大量的无意义的关系项中搜索.实验证明,此算法是有效的且灵活性强,能在Web使用数据集中发现有意义的带权值的关联规则.同时给出了在最小支持度和最小置信度不变的情况下,在动态数据集中进行增量关联规则挖掘的方法.同样使用权值方法来提升新数据集的重要性.此方法的可行性和有效性同样在实验中体现出来. 相似文献

4.

基于免疫关联挖掘的教学信息评价

徐雪松王四春《情报学报》2011,30(5)

针对数据挖掘中的关联规则挖掘广度及效率问题,提出了一种基于免疫优化的关联规则挖掘算法.将数据原始记录和候选模式分别作为抗原和识别抗体,通过免疫聚类竞争加速克隆扩增,提高抗体成熟力及亲和性,增强候选模式支持度.在算法执行过程中,支持度大于阈值的优秀个体都将被作为记忆细胞保存下来.这样,记忆细胞所代表的模式满足最小支持度要求,可以很容易提取出也同时满足最小置信度要求的关联规则.试验表明,该算法加快了关联规则挖掘的收敛速度,具有更强的全局与局部搜索能力,提高了所得关联规则的准确率.在高校教学质量评估及规则挖掘中体现出应用价值. 相似文献

5.

Web日志中用户存取模式的聚类研究

吴瑞史文武《情报学报》2006,25(5):629-633

基于用户访问网页的不同序列反映了用户特定的兴趣,提出了Web日志中用户存取模式的聚类算法。利用传统的Leader算法只扫描数据集一遍的优点,以及粗糙理论在处理含有不确定信息问题上的优势,给出了结合粗糙理论的改进Leader算法对用户存取模式进行聚类方法,使得同一类中的用户存取模式尽可能的相近或相似,不同类中的模式尽可能的相异。实验结果表明,该算法在可承受的计算时间内可对Web日志中的用户存取模式进行有效聚类。相似文献

6.

一种面向图书馆新书推荐服务的广义关联规则挖掘算法 总被引：1，自引：0，他引：1

佘俊胜黄战《现代图书情报技术》2006,1(10):16-20

基于MMS_Cumulate和GP-Apriori算法, 提出一种针对图书馆新书推荐服务特点的广义关联规则挖掘算法MAR_LCR。不仅能挖掘出形如“读者-图书”的广义关联规则,而且还允许用户为不同的项设置不同的最小支持度。通过对候选集的产生过程进行改进,可大大压缩搜索空间。实验结果表明,MAR_LCR算法是有效的。最后,提出新书推荐模型。相似文献

7.

基于蚁群算法与K-means算法相结合的Web用户聚类 总被引：1，自引：1，他引：0

凌海峰刘业政杨善林《情报学报》2009,28(1)

Web用户聚类是指用聚类算法产生用户会话的聚类,是电子商务中的一个重要问题.该问题的难度在于有成千上万的会话需要聚类,而且每个会话都可描述为一个高维向量.此外,该问题就聚类的数目而言具有指数的复杂性,是一个NP-难的问题.本文提出一种新的聚类方法,该方法将蚁群算法与K-means算法相结合对用户会话进行优化聚类.实验结果表明,与K-means算法相比,该方法在Web导航推荐的应用中具有更好的性能. 相似文献

8.

持久偏爱的Web用户访问路径信息挖掘方法

朱志国邓贵仕《情报学报》2010,29(2)

现有的Web用户访问路径信息发现方法大都着眼于从静态的Web日志快照中进行挖掘.本文力图从Web访问数据的历史演变过程中,发现新的知识--持久偏爱的Web用户访问路径PP-WAP.PP-WAP实际上是历史访问序列WAS中大部分时间支持度值波动很小且保持较高的访问路径信息.本文首先介绍了相关背景和PP-WAP的应用领域.接下来,利用无序树结构来表示历史WAS集合,同时给出了PP-WAP的定义和挖掘算法描述.最后,分别针对模拟和实际数据集对算法的可扩展性以及PP-WAP的应用价值作了实验分析. 相似文献

9.

基于关联挖掘技术的数字图书馆个性化推送服务 总被引：3，自引：0，他引：3

熊拥军陈春颖《图书情报工作》2010,54(1):125-129

针对数字图书馆推送服务中缺乏对资源访问数据的有效分析,以关联挖掘理论为技术基础,设计出数字图书馆个性化推送服务模型。详细介绍资源访问多维数据集构建、多维数据集上文献资源的关联分析和挖掘方法。实验表明,关联挖掘技术可从资源访问事务中发现资源访问关联以及具有访问行为相似读者群,为个性化推送服务提供决策依据。相似文献

10.

Clustering of Web Users Based on an Improved Affinity Propagation Algorithm

Leng Yajun Liang Changyong Lu Wenxing 《情报学报》2012,31(9)

随着Internet和电子商务的迅猛发展,聚类技术在Web用户划分方面的作用越来越明显.Web用户聚类的难度在于有成千上万的用户需要聚类,而且每个用户的偏好向量是高维稀疏的.对于处理大规模的数据集,近邻传播算法是一种快速、有效的聚类方法.但面对高维稀疏的数据,近邻传播算法往往不能得到很好的聚类结果,而且该方法不能产生指定类数的聚类.本文提出一种改进的近邻传播算法,使用该方法对Web用户进行聚类.根据灰关系等级和Jaccard系数定义用户相似度矩阵,对算法产生的初始聚类进行重新分配,获得指定类数的聚类.实验结果表明新算法是有效的,与原始近邻传播算法相比,新算法在个性化推荐的应用中具有更好的性能. 相似文献

11.

基于事务标识列表的关联规则挖掘算法

王强《现代图书情报技术》2008,3(8):63-69

设计并采用Java语言实现基于事务数据库标识列表的频繁项集的产生算法——TidlistApriori。通过与采用Hash-Tree的Apriori算法进行比较,表明TidlistApriori能够提高频繁项集的产生效率,可以成为主题关联挖掘的有效算法工具。相似文献

12.

数据挖掘技术在高校图书馆中的应用 总被引：13，自引：0，他引：13

叶新友晁成春《新世纪图书馆》2005,(1):50-51

文章详细阐述了分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等数据挖掘技术在高校图书馆馆藏、读者服务、学术评价、管理及决策支持等方面的应用。相似文献

13.

基于加权关联规则挖掘的相关文献推荐*

陈祖琴张惠玲葛继科郑宏《现代图书情报技术》2007,2(10):57-61

研究利用数据挖掘中的关联规则挖掘分析及论文数据库，进行相关文献推荐，提出适用于进行相关文献推荐的改进的混合加权关联规则挖掘算法，并通过用户行为分析确定相关文献集和垂直权重，采用Google搜索引擎的PageRank算法确定水平权重，获得一些有意义的分析结果。相似文献

14.

提高个性化推荐精度的定制Web日志方法

苏玉召牛晓太赵妍《图书与情报》2011,(5):60-64

文章通过对个性化推荐和数据建模理论研究,分析了普通的Web日志格式采集到的数据无法满足个性化用户分析、预测和推荐精度需要的局限性。提出定制Web日志数据建模的过程及方法,建立了定制Web日志模型原型。通过应用数据挖掘技术的关联分析、分类和聚类实验,实验结果表明,通过定制Web日志的方式采集的数据质量能够很好地满足发现关联规则、内容分类和用户聚类的需求,从而提高个性化推荐的精度。同时,定制的Web日志数据还具有简化数据预处理、多用途的优点。相似文献

15.

刑事案件的多层关联分析模型研究

王春雨王雪华张旭娟王延章《情报学报》2011,30(1)

为探寻当前刑事案件的发案规律与特点,以便及时预防和打击刑事犯罪,本文研究提出了刑事案件的多层关联分析模型。首先提出了刑事案件的多层关联规则挖掘的模型框架,依据所建立的刑事案件多维多层数据立方体模型,设计了层间递减支持度策略。基于经典的Apriori算法,提出了适于多层频繁谓词集搜索的改进Apriori算法,按照最小支持度与最小置信度的要求产生强关联规则。由于多层挖掘产生的规则可能存在祖孙关系,本文设计了结果分析中的减少冗余规则。最后,利用大连公安局提供的甘井子区1999～2006年的18 629条刑事案件的真实数据,验证了模型的正确性与有效性。相似文献

16.

一种基于单处理机的并行关联规则算法及其在数字图书馆中的应用

刘晶朱清香梅群张蕾《图书情报工作》2011,55(7):114-117

针对现有并行挖掘技术需要建立在专门的并行机上而使中小图书馆难以实现的弊端,通过研究关联规则的内在并行性,提出一种基于图形处理单元技术的快速并行关联规则算法,实现在单处理器上并行数据挖掘。通过仿真实验证明,优化后的算法在不增加硬件设备的前提下实现单处理机并行,提高运行速度,解决传统并行关联规则挖掘难以应用化的问题,该算法对于数字图书馆具有重要的理论和应用价值。相似文献

17.

数据挖掘中分类方法综述 总被引：3，自引：0，他引：3

钱晓东《图书情报工作》2007,51(3):68-71

数据挖掘中的核心技术分类算法的内容及其研究现状进行综述。认为分类算法大体可分为传统分类算法和基于软计算的分类法两类，主要包括相似函数、关联规则分类算法、K近邻分类算法、决策树分类算法、贝叶斯分类算法和基于模糊逻辑、遗传算法、粗糙集和神经网络的分类算法。通过论述以上算法优缺点和应用范围，研究者对已有算法的改进有所了解，以便在应用中选择相应的分类算法。相似文献

18.

Web数据挖掘对Web数据检索的支持作用 总被引：3，自引：0，他引：3

唐建国胡芒谷《情报学报》2004,23(4):452-455

本文在对Web数据检索和Web数据挖掘的技术特性进行简要介绍的基础上 ,阐述了二者之间的主要区别 ,并着重对Web数据挖掘对Web数据检索构成的支持作用进行了具体分析。这些支持作用体现在 :自动分类 ,揭示知识特征 ,群集处理 ,超链结构挖掘和用户知识模型挖掘。相似文献