首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对传统相似度忽略用户局部偏好、用户评分差异和非共同评分项等因素的影响,提出了一种基于损失因子和数据集划分的协同过滤推荐算法.算法根据用户对项目的偏好度来划分数据集,并提出用两个修正因子来改进传统的相似度.在MovieLens数据集上将所提算法和Pearson算法、参考文献[1]中的算法进行比较,实验结果表明,基于损失因子和数据集划分的协同过滤推荐算法更明显地降低了MAE值.  相似文献   

2.
改进后的Fp-Growth挖掘算法适用于对大型数据库的数据关联规则的挖掘,基于一种新的数据库分隔方法来分隔数据库,并对分隔得到的各数据库子集用算法进行约束频繁项集挖掘。改进的数据库划分策略克服了占用内存大的缺陷,提高了挖掘速度,实时性更强。  相似文献   

3.
提出了一种基于用户兴趣及标签相似度的混合推荐算法,构建基于标签的用户兴趣模型,通过计算与资源相似度完成推荐,同时融合时间因素研究用户兴趣变化,提高了基于内容的推荐中相似度计算的准确率;根据用户兴趣相似度聚类用户,通过兴趣协同推荐减少对评分矩阵的依赖,一定程度上解决了协同过滤中推荐数据缺失问题;同时,结合用户基本信息有望缓解冷启动问题。实验表明该算法具有一定的有效性及可行性。  相似文献   

4.
提出一种新颖的基于谱聚类的音频聚类算法,首先对音频数据进行预处理,得到三维音频向量,然后根据向量之间的距离计算音频相似度,最后设计谱聚类算法获得音频数据聚类结果。在网易云音乐数据上的对比实验表明,与K means算法和快速查找密度峰值聚类算法相比,该算法获得的聚类结果更加优越。  相似文献   

5.
为改善WCMA算法简单根据时间间隔和平均值计算GAP因子的不足,提出一种基于天气相似度的太阳能收集功率预测方法D-WSMA。根据参考天和参考时刻对预测值的影响程度不同,采取相似度刻画数据间关系,动态调整参考天和参考时刻的权重以及历史参考时刻的加权平均值,从而得到可变化的DGAP因子。同时,根据数据波动性特征,改进原有算法中的固定权重α,得到动态变化权重因子dα。实验结果表明,D-WSMA预测精度相对WCMA算法提高了14.04%、28.30%、4.76%、12.58%,平均提高了15%。因此,D-WSMA预测方案具有良好性能,适合更加多样化的天气条件。  相似文献   

6.
发现频繁项集是数据挖掘应用中的关键问题,发现过程的高花费要求对增量数据挖掘算法进行深入研究.考虑保持最小支持度不变,一个事务数据集d动态的添加到事务数据库D中时,利用基于矩阵的MFUP(Matrix_Fast_Update)算法生成事务数据库D U d中的频繁项集.  相似文献   

7.
数据稀疏是协同过滤预测精度的一个重要影响因素。Slope One算法使用简单的线性回归模型解决该问题,但它只使用评分数据做计算,未考虑相似性。提出一种基于用户习惯偏好相似度的Slope One算法(UPS Slope One)。UPS Slope One首先基于用户习惯偏好聚类,得到三组不同偏好的用户,然后分别计算各组评分偏差,计算时将用户习惯偏好相似度融入其中,最后使用线性回归模型预测评分。在MovieLens数据集上的实验表明,该算法可得到更高的推荐质量、预测准确性和稳定性。  相似文献   

8.
为提高频繁项集的生成效率,提出一种基于概念格的频繁项集生成算法。首先将事务数据库映射为形式背景,利用概念格构建算法从形式背景中生成概念及其偏序关系,概念内涵表示项集,概念外延表示项集对应的支持度计数。根据概念的外延长度将所有概念划分到不同的层中,层的序号与概念外延长度相同,将层按照序号进行降序排列,从层序号大于等于最小支持度计数的概念中生成频繁项集。在两个人工数据集上的实验结果表明所提算法在时间性能上优于对比算法,最小支持度计数的值越小,所提算法的优势越明显。  相似文献   

9.
目前,已经有很多针对数据挖掘更新算法的研究,但大部分的更新算法都只是考虑事务数据库增量更新的情况.实际上,事务数据库数据还存在数据删减的更新问题,为了解决这类问题,提出了一种基于闭合序列模式的更新算法DeCloSpan,该算法对已有的挖掘结果直接进行删减更新,避免了重复挖掘.  相似文献   

10.
采用本体概念映射方法,研究概念间相似度计算问题并提出本体图驱动的概念相似度算法。该算法将概念映射到本体结构图上,通过计算概念的语义、结构及属性相似度得到综合相似度。其中,结构相似度通过语义辐射圆计算模型得到,属性相似度通过概念重心向量夹角余弦得到。通过实验对比证明,该算法在一定程度上提高了相似度准确性,为数据挖掘提供了一定依据。  相似文献   

11.
协同过滤算法是最常用、最经典的个性化推荐算法之一。在算法计算中相似度计算是影响算法质量的关键因素,该算法中相似度计算根据用户评分差值作为距离来衡量,忽略了项目自身特征属性对相似性计算的制约。因此提出一种基于项目特征的协同过滤推荐算法(IFCF),结合项目评分相似度,利用Logistic二分类算法思想将用户对项目的偏好分为喜爱与不喜爱两类,再利用贝叶斯概率原理将用户对各项目特征的喜爱程度差值作为相似度调整度,以达到提高项目相似性度量准确度的目的。实验结果表明,该算法能够有效提高推荐算法的精度。  相似文献   

12.
常浩 《太原大学学报》2013,14(2):127-130
数据挖掘是从事务数据库中抽取有用的知识和感兴趣的模式,而从事务数据库中发现关联规则是最常见的挖掘技术之一。提出一个遗传模糊关联规则挖掘框架和综合聚类、模糊和遗传概念的多最小支持度的遗传模糊关联规则挖掘算法。该算法从定量事务数据库中抽取合理的多最小支持度值、隶属函数和模糊关联规则,首先使用k—means聚类算法采集相似项目,然后初始化一个种群设定相同的支持度值,每一个染色体通过需求满足的标准和隶属函数的适应性来评估是否满足其适应度。  相似文献   

13.
基于近邻的协同过滤算法是目前最为成功的个性化推荐算法之一,相似度计算方法是其核心内容.然而,该算法通常存在冷启动,数据稀疏性以及在相似度计算的时候只能使用共同评分之类的问题.为了有效改善上述算法推荐质量不高的问题,本文介绍了巴氏系数(BhattacharyyaCoefficient),结合修正余弦相似度、杰卡德相似度和皮尔森相关系数的优点,提出一种考虑了项目全局评分信息和局部评分信息的多重相似度融合的协同过滤算法(CFSI).在数据集MovieLens上的实验表明,CFSI在一定程度上有效缓解了数据稀疏性和冷启动问题,并且提高了推荐质量.  相似文献   

14.
针对指纹一对一匹配识别方法严重影响指纹数据库系统识别效率的问题,提出一种基于细节点描述子的指纹检索算法,该算法先根据细节点描述子的结构信息进行粗匹配筛选,剔除虚假细节点产生的影响;然后利用筛选后的细节点位置关系确定最佳参考点;最后基于最佳参考点计算所有指纹图像相似度,将相似度排在前N0的指纹返回并作为候选指纹。实验结果表明,该算法在时间和空间上都优于传统指纹检索算法。  相似文献   

15.
根据聚类方法,通过计算结点间的相似度来发现社团结构,提出了一种基于蚁群算法识别相似结点的方法,以优化结点的计算性能.  相似文献   

16.
数据库驱动的Web站点根据查询产生的Web页结构布局都是极其相似的;现有的Web提取方法忽视或者忽略了这种相似性,因而在提取效率性能和通用性上都有较大的限制。本文提出一种基于标签树相似度的模板自动学习方法;进而根据模板来提取这类网页的数据;并利用Eclipse和开源HTML Parser对算法进行了实现;实验结果表明该算法具有较快的提取速度和较好的准确率。  相似文献   

17.
Fp-Growth算法是频繁模式挖掘的经典算法,已在许多领域得到了良好应用。传统Fp-Growth算法是基于内存的,而计算机内存却无法装载入大数据,故传统Fp-Growth算法并不能有效地处理大数据。提出一种新的基于MapReduce并行计算框架的Fp-Growth实现,使Fp-Growth算法在多台计算机上并行计算,从而实现大数据的有效处理。实验结果表明,该算法具有很好的扩展性,频繁模式挖掘效率随着用于计算的主机的增加而平稳提升。  相似文献   

18.
为改善传统个性化推荐算法精准度不高的问题,使用评论数据作为数据集,先对评论数据作文本预处理和特征提取,然后使用LDA主题模型对文本特征数据建模,得到主题词分布,将其作为标签,同时使用LSTM网络作文本分类,通过计算得到好评率。最后把用户需求和标签利用潜在语义标引计算相似度,根据相似度和好评率大小向用户推荐结果。实验结果表明,该方法能够向用户推荐符合其兴趣的个性化需求信息,且准确率高于96%,证明了该推荐算法的有效性。  相似文献   

19.
提出了一种自动完成本体映射的算法.该算法通过计算本体概念之间元素层与结构层上的相似性来完成相似度的计算.在元素层上,该算法引进了WordNet,通过将WordNet中对应的概念转换为向量,计算向量间夹角的余弦得到元素层概念的相似度.在结构层上,该算法通过加权函数和sigmoid函数,基于元素层的计算结果,将元素层的相似度和结构层的相似度结合起来,完成本体之间相似度的计算,最终完成映射.实验结果表明,该算法的匹配准确率可以达到63%~70%,可以有效地完成本体之间的映射.  相似文献   

20.
论述了图像校正算法的并行集群实现方法。针对图像复原问题,对复原算法结构与流程的并行处理进行研究,提出了整体数据传输、按行分片计算复原的并行处理方法。该方法在基于MPI的计算机并行集群系统中的8个计算节点上通过了测试,给出了集群校正实验结果和MPI并行计算时空图。实验结果表明,基于集群计算的并行复原方法十分有效,可缩短计算时间,提高计算效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号