首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 640 毫秒
1.
为了提高数据集中相似重复记录的检测效率,提出一种基于属性权值的分组聚类算法。该方法在记录集中选取特征属性,通过设定的权值对记录进行聚类,在形成的数据子集中进行字段匹配和记录匹配,来识别相似重复记录,并给出了相关算法。实验表明,该方法能减少字段的匹配次数和记录的匹配范围,节省运行时间,具有较高的查全率和查准率。  相似文献   

2.
为有效识别浮动验证码,提出一种基于特征匹配与卷积神经网络的识别方法。首先使用特征匹配的方法得到匹配特征点,结合交叉匹配算法与 K 近邻匹配算法滤除错误匹配;然后对特征点进行聚类及投票分析,得到待识别字符区域,将其分割得到单个字符;最后在 mnist 手写数字数据集的基础上加入英文字符,构建卷积神经网络模型,将数据集送入模型进行训练。对 10 000 张浮动验证码进行测试,结果表明,该方法对浮动验证码的识别准确率达 95%,且构建的训练集具有可扩展性,可进一步应用到其它类型的字符识别中。  相似文献   

3.
图像拼接技术关键在于图像配准和算法效率,针对传统的图像特征匹配算法数据量大、计算耗时长的缺点,将K-means聚类算法应用到图像匹配算法中,提出了一种解决该问题的改进算法。该方法利用K-means聚类算法对图像提取出的角点对先进行聚类分组,然后采用预判断模型和分组随机选取的方法来提高传统算法效率。实验结果表明,该算法相比于传统的RANSAC算法,在保持较高的精度和鲁棒性的情况下,大大提高了计算效率,有助于提高图像的自动拼接的效率。  相似文献   

4.
融合底层、语义特征的医学图像检索算法及实现   总被引:1,自引:0,他引:1  
针对医学胃窥镜图像,在分别研究颜色聚类、语义单一特征检索算法基础上,提出了结合底层颜色和高层语义的特征融合检索算法。并用VC#和SQLserver2000实现了一个图像检索原型系统.论述了系统的结构、特征提取、相似度匹配方法及部分实验结果,实验表明该方法具有良好的检索效果。  相似文献   

5.
《中学生数理化》2010,(4):36-37,45
知识梳理 1.复习相似三角形概念时,要注意四点.(1)对应角相等,对应边成比例的三角形叫做相似三角形(相似三角形对应边的比叫做相似比);相似的符号为“~”,读作“相似于”.(2)相似三角形的“对应性”,即两个三角形相似时,通常把表示对应顶点的字母写在对应位置上,  相似文献   

6.
针对摄像头离散区域存在的光照变化、视角变化等干扰,提出一种结合Lab模型以及扩展梯度方向直方图特征的方法来改善人物外表匹配的准确率.对于描述目标全局信息的Lab模型,提出一种排序最近邻聚类算法进行颜色聚类,然后使用分块颜色匹配算法计算观察值之间的颜色相似度.对于描述目标局部信息的扩展梯度方向直方图特征,使用巴氏距离计算2个观察值之间的相似度.全局信息可以很好地描述目标外形,并且能够适应摄像头视角的变化以及目标尺度上的改变.局部信息对光照变化具有更强的鲁棒性,它能够增强模型的辨别能力.全局信息和局部信息的结合保证了所提出算法的精确度和鲁棒性.室内实验结果显示所提出的算法具有较高的正确匹配率.  相似文献   

7.
提出使用文本相似度算法与DBSCAN聚类算法相结合的方法对文本进行聚类,实现对文本的管理。首先对文本进行特征提取和分词操作,在分词过程中会产生大量的特征词汇,而有些特征词汇对文本特征的表达并无实际意义。因此,在文本特征提取过程中根据特征词汇对文本特征表达的贡献度进行取舍,以提高文本聚类的效率和准确性。利用TF IDF方法对特征词汇进行加权,并且对文本进行相似度计算,将相似度低于阈值的文本作为孤立点进行处理。利用DBSCAN算法对文本进行聚类,将相似的文本聚为一类。  相似文献   

8.
一 相似三角形的判定方法(1)对应角相等,对应边成比例的两个三角形相似(定义);(2)两角对应相等,两三角形相似;(3)三边对应成比例,两三角形相似.了解了相似三角形的判定方法后,我们可以归纳出判定相似三角形的思路.  相似文献   

9.
聚类分析在数据挖掘领域中占有重要地位,到目前为止学者们提出了许多的聚类算法.本文提出了一种基于k NN的聚类算法k-Nearest Neighbor Cluster(k NNC).该算法首先找到每个数据点的k个邻居点,然后设置匹配点数n,通过使用每个点的邻居点进行匹配进而达到聚类效果.本文通过三个实验去验证该算法,并且与k-means算法进行比较.实验结果表明,该算法具有稳定的正确率,而其最大的优点是不需要预先设定聚类簇数,它可以大致的找到聚类的簇数.  相似文献   

10.
1.观察下面这些三角形,选出相似的三角形. 2.下面这些图形中,有没有相似的三角形。如果相似。用“一”把它们连接起来.  相似文献   

11.
为改进随机采样一致性算法模型参数估计可能不是最优导致图像特征点配准率不高的问题,缩短特征点提取时间,提出一种结合Delaunay三角网格约束的自适应多尺度图像重叠域配准方法。采用自适应通用加速分割检测算法,快速检测出均匀稳定的特征点,并且用二进制特征描述子解决尺度不变性和旋转不变性问题。因传统随机采样一致性算法阈值选取和迭代次数的局限性,会掺杂部分难筛的误配点,在此前提下借助Delaunay算法剖分粗匹配点集,遍历计算网格间对应三角形相似度并储存在相似性度量矩阵中。依据Delaunay三角网特性,剔除相似度差异大的三角形,重构网格保存余下的匹配点集。实验结果表明,该方法特征点提取速率比FAST快15%~20%,特征点正确配准率比随机采样一致性算法提高约4.9%,不仅可自适应多尺度快速提取特征点,而且在保证特征点正确配准率基础上尽量多地保留有效特征点数量。  相似文献   

12.
聚类分析是数据挖掘和机器学习的一个重要分支,应用范围广,但在聚类分析过程中大量敏感信息的泄露对用户构成威胁。因此,在聚类分析过程中实现隐私保护至关重要。传统基于差分隐私(DP)的k-means聚类算法由于存在盲目选择初始中心点、对异常点敏感度较高等问题,导致在保护数据隐私时,出现聚类可用性较低的情况。针对该问题提出一种改进的基于差分隐私保护的(IDP)k-means聚类算法以提高聚类可用性,并进行理论分析和对比实验。理论分析表明,该算法满足ε-差分隐私;仿真实验结果表明,在同一隐私预算下,k-means算法改进后在聚类可用性上优于其它差分隐私k-means聚类算法,在同一数据集与同一隐私参数下,改进k-means算法在数据可用性方面比传统算法提高了将近5个百分点。  相似文献   

13.
针对基于罚函数的排挤小生境遗传算法的缺陷,提出了改进的K-均值聚类排挤小生境遗传算法。该算法将改进的K-均值聚类分析与排挤技术有机地结合起来,无需事先确定小生境的数目和半径,可以通过调节最小聚类距离控制收敛到的小生境的数目,避免找到无效的极值点。理论分析和数值实验表明,该算法对于非均匀分布的多峰函数具有较好的搜索性能。  相似文献   

14.
为了改善传统K-Modes聚类算法相异度度量公式弱化了类内相似性,忽略了属性间差异,以及单一属性值的Modes忽视了某一属性可能存在多属性值组合,且算法受初始中心点影响很大的缺点,基于多属性值Modes的相异度度量方法提出MAV-K-Modes算法,并采用一种基于预聚类的初始中心选取方法。使用UCI数据集进行实验,结果表明,MAV-K-Modes算法相比于传统K-Modes算法,其正确率、类精度和召回率都有明显提升,且MAV-K-Modes算法适合于并行化改造。  相似文献   

15.
相比较于其它聚类算法,密度峰值聚类算法可将任意形状的数据与较少的参数和高效的聚类速度结合起来。针对当某个类中出现多个密度峰值时,聚类结果缺乏准确性的问题,提出一种改进的密度峰值聚类结果有效性造成的影响,算法通过比较类簇之间的密度属性,实现动态的子簇合并,减少主观因素对算法结果的影响。通过实验与已有密度聚类算法对比,改进算法不仅很好地避免了原算法人为确定参数给实验结果造成的影响,而且具有更好的聚类性能。  相似文献   

16.
随着智慧农业的发展,农业生产中海量数据不断涌现。在海量数据中难免存在噪声数据,这些数据不仅难以提供有效价值,还会影响信息挖掘。针对该问题,采用基于密度的DBSCAN聚类算法进行异常数据处理。鉴于DBSCAN算法对参数敏感,结合数据集本身特性与统计学思想以绘制各点之间的距离升序曲线,预估出DBSCAN的Eps参数。仿真实验结果表明,改进算法平均准确率达到99.6%,较传统算法提高了1.7个百分点,并且在10次检测中,改进算法只有3个数据判定错误,证明该参数设置方法对异常数据处理准确率更高,稳定性也更好。  相似文献   

17.
典型的基于空间约束的划分聚类算法采用基于梯度下降的搜索方法,存在着易陷入局部极值和对初始值敏感的问题,因此提出带障碍的量子粒子群聚类算法。新算法重新定义了数据点绕过障碍物的距离函数,提出了粒子逃逸原则以避免聚类中心点陷入障碍物中,并且在很大程度上克服了划分聚类的缺点。实验结果证明了该算法的有效性和准确性。  相似文献   

18.
李晓飞  李好 《唐山学院学报》2010,(3):44-44,45,46
连续属性离散化问题是机器学习的重要方面,是数据预处理问题之一。文章提供的基于粗糙集的层次聚类算法(RAHCA)是对层次聚类算法的一种改进,它能够自动调整参数,以寻求更优的聚类结果。实验结果验证了该算法的可行性,特别是在符号属性聚类方面有着较好的聚类性能。  相似文献   

19.
流数据是近年来关注比较多的一种数据形式,但由于它自身的特点,无法使用传统的算法对它进行聚类分析.数据挖掘是从大规模数据库中提取感兴趣的信息.聚类是数据挖掘的重要工具,它根据数据间的相似性将数据库分成多个类,每类中数据要求尽可能相似.针对流数据的特点,引入一种采用渔夫捕鱼策略的新的聚类算法.该算法采用动态多点随机投鱼网方法,并且根据捕鱼环境的不同采用不同的探测策略.流数据聚类的捕鱼算法是一种即时更新模型的在线聚类算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号