共查询到20条相似文献,搜索用时 15 毫秒
1.
针对传统相似度忽略用户局部偏好、用户评分差异和非共同评分项等因素的影响,提出了一种基于损失因子和数据集划分的协同过滤推荐算法.算法根据用户对项目的偏好度来划分数据集,并提出用两个修正因子来改进传统的相似度.在MovieLens数据集上将所提算法和Pearson算法、参考文献[1]中的算法进行比较,实验结果表明,基于损失因子和数据集划分的协同过滤推荐算法更明显地降低了MAE值. 相似文献
2.
邹永平 《河北能源职业技术学院学报》2013,(1):64-66,70
改进后的Fp-Growth挖掘算法适用于对大型数据库的数据关联规则的挖掘,基于一种新的数据库分隔方法来分隔数据库,并对分隔得到的各数据库子集用算法进行约束频繁项集挖掘。改进的数据库划分策略克服了占用内存大的缺陷,提高了挖掘速度,实时性更强。 相似文献
3.
胡三宁 《三门峡职业技术学院学报》2015,(2):140-144
提出了一种基于用户兴趣及标签相似度的混合推荐算法,构建基于标签的用户兴趣模型,通过计算与资源相似度完成推荐,同时融合时间因素研究用户兴趣变化,提高了基于内容的推荐中相似度计算的准确率;根据用户兴趣相似度聚类用户,通过兴趣协同推荐减少对评分矩阵的依赖,一定程度上解决了协同过滤中推荐数据缺失问题;同时,结合用户基本信息有望缓解冷启动问题。实验表明该算法具有一定的有效性及可行性。 相似文献
4.
5.
为改善WCMA算法简单根据时间间隔和平均值计算GAP因子的不足,提出一种基于天气相似度的太阳能收集功率预测方法D-WSMA。根据参考天和参考时刻对预测值的影响程度不同,采取相似度刻画数据间关系,动态调整参考天和参考时刻的权重以及历史参考时刻的加权平均值,从而得到可变化的DGAP因子。同时,根据数据波动性特征,改进原有算法中的固定权重α,得到动态变化权重因子dα。实验结果表明,D-WSMA预测精度相对WCMA算法提高了14.04%、28.30%、4.76%、12.58%,平均提高了15%。因此,D-WSMA预测方案具有良好性能,适合更加多样化的天气条件。 相似文献
6.
7.
数据稀疏是协同过滤预测精度的一个重要影响因素。Slope One算法使用简单的线性回归模型解决该问题,但它只使用评分数据做计算,未考虑相似性。提出一种基于用户习惯偏好相似度的Slope One算法(UPS Slope One)。UPS Slope One首先基于用户习惯偏好聚类,得到三组不同偏好的用户,然后分别计算各组评分偏差,计算时将用户习惯偏好相似度融入其中,最后使用线性回归模型预测评分。在MovieLens数据集上的实验表明,该算法可得到更高的推荐质量、预测准确性和稳定性。 相似文献
8.
为提高频繁项集的生成效率,提出一种基于概念格的频繁项集生成算法。首先将事务数据库映射为形式背景,利用概念格构建算法从形式背景中生成概念及其偏序关系,概念内涵表示项集,概念外延表示项集对应的支持度计数。根据概念的外延长度将所有概念划分到不同的层中,层的序号与概念外延长度相同,将层按照序号进行降序排列,从层序号大于等于最小支持度计数的概念中生成频繁项集。在两个人工数据集上的实验结果表明所提算法在时间性能上优于对比算法,最小支持度计数的值越小,所提算法的优势越明显。 相似文献
9.
目前,已经有很多针对数据挖掘更新算法的研究,但大部分的更新算法都只是考虑事务数据库增量更新的情况.实际上,事务数据库数据还存在数据删减的更新问题,为了解决这类问题,提出了一种基于闭合序列模式的更新算法DeCloSpan,该算法对已有的挖掘结果直接进行删减更新,避免了重复挖掘. 相似文献
10.
采用本体概念映射方法,研究概念间相似度计算问题并提出本体图驱动的概念相似度算法。该算法将概念映射到本体结构图上,通过计算概念的语义、结构及属性相似度得到综合相似度。其中,结构相似度通过语义辐射圆计算模型得到,属性相似度通过概念重心向量夹角余弦得到。通过实验对比证明,该算法在一定程度上提高了相似度准确性,为数据挖掘提供了一定依据。 相似文献
11.
协同过滤算法是最常用、最经典的个性化推荐算法之一。在算法计算中相似度计算是影响算法质量的关键因素,该算法中相似度计算根据用户评分差值作为距离来衡量,忽略了项目自身特征属性对相似性计算的制约。因此提出一种基于项目特征的协同过滤推荐算法(IFCF),结合项目评分相似度,利用Logistic二分类算法思想将用户对项目的偏好分为喜爱与不喜爱两类,再利用贝叶斯概率原理将用户对各项目特征的喜爱程度差值作为相似度调整度,以达到提高项目相似性度量准确度的目的。实验结果表明,该算法能够有效提高推荐算法的精度。 相似文献
12.
数据挖掘是从事务数据库中抽取有用的知识和感兴趣的模式,而从事务数据库中发现关联规则是最常见的挖掘技术之一。提出一个遗传模糊关联规则挖掘框架和综合聚类、模糊和遗传概念的多最小支持度的遗传模糊关联规则挖掘算法。该算法从定量事务数据库中抽取合理的多最小支持度值、隶属函数和模糊关联规则,首先使用k—means聚类算法采集相似项目,然后初始化一个种群设定相同的支持度值,每一个染色体通过需求满足的标准和隶属函数的适应性来评估是否满足其适应度。 相似文献
13.
《绵阳师范学院学报》2019,(8):84-90
基于近邻的协同过滤算法是目前最为成功的个性化推荐算法之一,相似度计算方法是其核心内容.然而,该算法通常存在冷启动,数据稀疏性以及在相似度计算的时候只能使用共同评分之类的问题.为了有效改善上述算法推荐质量不高的问题,本文介绍了巴氏系数(BhattacharyyaCoefficient),结合修正余弦相似度、杰卡德相似度和皮尔森相关系数的优点,提出一种考虑了项目全局评分信息和局部评分信息的多重相似度融合的协同过滤算法(CFSI).在数据集MovieLens上的实验表明,CFSI在一定程度上有效缓解了数据稀疏性和冷启动问题,并且提高了推荐质量. 相似文献
14.
15.
16.
数据库驱动的Web站点根据查询产生的Web页结构布局都是极其相似的;现有的Web提取方法忽视或者忽略了这种相似性,因而在提取效率性能和通用性上都有较大的限制。本文提出一种基于标签树相似度的模板自动学习方法;进而根据模板来提取这类网页的数据;并利用Eclipse和开源HTML Parser对算法进行了实现;实验结果表明该算法具有较快的提取速度和较好的准确率。 相似文献
17.
18.
19.
提出了一种自动完成本体映射的算法.该算法通过计算本体概念之间元素层与结构层上的相似性来完成相似度的计算.在元素层上,该算法引进了WordNet,通过将WordNet中对应的概念转换为向量,计算向量间夹角的余弦得到元素层概念的相似度.在结构层上,该算法通过加权函数和sigmoid函数,基于元素层的计算结果,将元素层的相似度和结构层的相似度结合起来,完成本体之间相似度的计算,最终完成映射.实验结果表明,该算法的匹配准确率可以达到63%~70%,可以有效地完成本体之间的映射. 相似文献