首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 257 毫秒
1.
为了提高数据集中相似重复记录的检测效率,提出一种基于属性权值的分组聚类算法。该方法在记录集中选取特征属性,通过设定的权值对记录进行聚类,在形成的数据子集中进行字段匹配和记录匹配,来识别相似重复记录,并给出了相关算法。实验表明,该方法能减少字段的匹配次数和记录的匹配范围,节省运行时间,具有较高的查全率和查准率。  相似文献   

2.
一种deep web数据源下重复记录识别模型   总被引:1,自引:0,他引:1  
使用deep web数据源下重复记录识别模型对从多个deep web数据源中抽取出来的半结构化和无结构化的数据进行处理.首先,在数据预处理模块中将所抽取的数据生成实体记录的形式,然后,在异构记录处理模块中利用在同构记录处理模块所得到的权值,计算各实体记录的相似度,得到重复记录.与传统的重复记录识别模型不同,所提方法是在模式匹配未知的前提下实现的;并且采用带有可选算法的多个相似度估算器以达到更好的匹配效率.实验证明,该重复记录识别模型是可行且有效的.  相似文献   

3.
客户关系管理已成为当前企业决策管理的重要部分,而数据挖掘技术为客户关系管理提供了良好的支持。本文介绍了关联规则挖掘在客户关系管理中的应用,利用Apriori算法对客户数据库进行关联分析,并明确了数据挖掘在CRM系统中的重要性。  相似文献   

4.
针对内存数据库集群的数据划分,提出了基于相似度计算的内存数据库数据划分算法。该算法首先根据数据相关性对数据作初步简单划分,然后再基于事务相似度计算,得到最佳事务相似性判断标准,对事务进行相关性合并,进而进一步划分数据,得到合理优化的数据划分结果。算法创新地提出根据Rough集原理计算事务相关性,去除了数据库读写系数的影响,对内存数据库集群的数据划分具有一定指导意义。  相似文献   

5.
快速聚类分析算法在CRM中客户定位的应用   总被引:1,自引:0,他引:1  
客户关系管理是一个以客户为中心保持企业与客户互动的过程。把聚类分析用于客户关系管理,可以使得本企业更有针对性地与客户保持良好的关系。聚类分析算法可以用于客户关系管理的决策支持系统中。  相似文献   

6.
提出了规则合并的优化方法和重复记录聚类清除的方法.应用模糊等值理论,避免了传统等值理论非此即彼的僵硬方式,但清理过程中部分规则可能存在包含与被包含的关系,被包含的规则其等值度显然会相对较小,根据用户阀值提出了规则合并的优化方法,可减少重复记录的计算时间.基于同样的原因,规则间的包含与被包含关系将影响模糊等值度的误差分析,因此提出了利用忽略被包含的规则等值度提高误差分析精度的改进模糊等值理论误差分析方法.重复记录的核实通常需要人工逐条检测,易于出错,本文提出的聚类算法,可节省大量的用户劳动.最后给出一个实验,表明了规则优化的可能性.  相似文献   

7.
本文讨论了在使用ORACLE作为管理信息系统(MIS)的数据库管理系统时,如何来保证数据记录的唯一性。当由于一些原因已经产生了重复记录时,如何将重复记录删除。  相似文献   

8.
分析了传统的客户关系管理模型(CRM)功能和结构上的不足,把知识转移与客户关系管理联系起来,将人工智能,数据挖掘与电子商务相结合,得到了基于知识转移的客户关系管理模型(KTCRM),通过分析KTCRM的框架和功能,以及用推荐支持度取代传统算法的数量支持度,设计实现了关联规则挖掘算法,使客户关系管理由被动处理现有的知识发展到能主动地进行知识转移,从而得到新的信息,更好地为客户进行服务。  相似文献   

9.
提出了一种基于同级属性的重复记录检测方法.首先给出了同级属性的判断方式,然后通过查找数据集中的同级属性,来缩减数据集中需要计算的属性个数,提升相似重复记录检测的效率.实验结果表明,受同级属性在数据集中所占比例的影响,该方法能够不同程度的提高相似重复记录检测的效率.  相似文献   

10.
客户数据库是客户关系系统的重要组成部分,是实现CRM的基础。在介绍客户关系管理中数据库的特点及其作用的基础上,阐述了构建客户数据库时应考虑的因素、客户数据库的设计实现与客户数据库建立的困难及注意的问题。  相似文献   

11.
新型冠状病毒(COVID-19)疫情爆发期间,涌现出了众多的抗疫意见领袖。通过对意见领袖话题传播和演化进行分析研究,可以为网络舆情治理和疫情防控提供理论和知识支撑。采用N-Gram语言模型和Shingling相似度算法相结合的方式进行话题检测,再通过Neo4j图数据库存储与检索意见领袖、话题、事件等多维实体特征,构建以意见领袖为核心的话题图谱。实验结果表明,话题准确率达82.3%,召回率达81.6%,与传统Single-Pass聚类相似度算法相比均有所提高。通过对图谱分析,能够简单直观地展示出不同实体间多维舆情关系。同时,可以提高检索速度和分析效率,符合舆情传播客观规律。  相似文献   

12.
分析了变量的自相似是LRC算法中线性回归模型中的不利因素,提出了改进的LRC算法.该算法利用奇异值分解降低变量间的自相似程度,同时减少了变量的个数,提高了识别过程的速度.在UMIST人脸数据库中的实验显示了算法的有效性.  相似文献   

13.
顾客对电子商务网站访问的行为会产生大量的信息,可运用数据挖掘技术研究客户关系分类管理,从而实现从大量、不确定的客户信息中挖掘出客户分类的依据和信息,为企业提供重要决策支持。通过讨论客户关系管理理论和数据挖掘技术的算法及分析方法,研究并提供了数据挖掘技术在电子商务客户关系管理中的应用方法。  相似文献   

14.
互联网市场不断在壮大,网络促销活动越来越多,呈现出以价格促销为主、总体销量大,影响力广等特点,但同时存在虚假促销、广告失实、活动过多、缺乏新意等问题,消费者口碑逐渐下降。将CRM管理运用到网络营销实践中,充分发挥顾客数据库的作用,针对性开展促销活动,不仅能有效提高促销活动效果,还能加强企业与顾客的沟通,培养顾客忠诚度,为企业长期发展打下良好基础。  相似文献   

15.
陈琍 《钦州学院学报》2006,21(6):36-37,41
从数据挖掘方法中常用的聚类算法的基本原理,将聚类算法中的K—means算法用于客户关系管理系统中,实现客户分类.并且对K—means算法进行了改进,根据客户信用特征对客户进行预分类,提高了算法的效率.  相似文献   

16.
中国银行业实施客户关系管理的策略探讨   总被引:1,自引:0,他引:1  
客户关系管理(CRM)是一种以客户为中心的创新营销策略。本文通过对目前中国银行业面临的主要问题的剖析,借鉴外资银行先进的技术经验,探讨中国银行业在客户关系管理应用方面采取的有效措施,旨在提高中国商业银行对客户服务的水平,提高客户的满意度与忠诚度,最终提高银行的核心竞争力。  相似文献   

17.
为提高园林绿植地被植物引种成功率,在高维数据聚类中采用相似性度量算法分析地被植物引种气候指标间相似度。选取原产于我国新疆维吾尔自治区的皱叶剪秋罗作为地被植物引种品种,新疆哈密地区为引种源地,兰州、武汉、北京、广州等市为目标引种地。以 5 座城市 2015 年气候年值数据中的 8 项气候指标作为分析指标,采用高维数据聚类分析相似性度量算法计算引种地和引种源地间气候环境相似度,依据相似度大小次序,分析遴选出与哈密地区气候环境接近的目标引种地。实验结果表明,基于高维数据聚类分析的相似性度量算法在地被植物引种气候相似性分析中可较好体现引种源地与目标引种地气候相似度,实验结果与实际情况相符。相似性度量算法可为地被植物异地引种提供辅助决策分析,使园林绿植引种更科学。  相似文献   

18.
提出基于动态时间弯曲技术的流数据处理方法,将一段时间内采集到的流数据作为一个时间序列来进行处理.由于同一时间段内数据流变化的影响因素基本相同,导致一些数据流变化存在错位相似,具体表现为数据流形状大致相同,但在时间上有所超前或延迟.对于这种错位相似的数据流采用常用的欧几里得测度法是无法识别的,而采用动态时间弯曲技术却可以很好地判断数据流的这种相似性.在采用动态时间弯曲路径法得到两个时间序列对应点的基础上提出了用预测法估计两个时间序列的关系,从而确定时间序列最佳匹配点的算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号