首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
K-means算法作为较为普遍的聚类算法,聚类效果受孤立点、噪声点和初始聚类中心影响较大。结合Isolation Forest算法计算数据中每个样本的异常度系数,根据离群值过滤比例计算得到异常度系数阈值,对高度异常值加以隔离,并对隔离后的数据集使用平均插值法求得初始聚类中心。运用改进K-means算法对真实数据集进行聚类分析,与此同时,通过比较多个离群值过滤比例下的聚类结果,找到离群值过滤比例的最优取值。仿真结果表明,相比于原始算法,新算法显著提升了聚类准确性,聚类效果更佳。  相似文献   

2.
离群点又称特异点、兴趣点、偏离点、新颖点、异常点等。通过离群点识别可发现异常事件与新现象。随着信息技术的发展和信息量爆炸式增长,通过识别数据中的离群点获得潜在信息成为研究热点。首先简要介绍几种主要的离群点识别方法,并分析各种方法的优缺点,为相关使用者学习、选择和改进算法提供参考。阐述离群点识别的研究热点和应用邻域,并分析现有算法在识别高维、空间和时序数据离群点的难点,便于研究者提出新的相关离群点识别方法。  相似文献   

3.
针对标准FCM算法在算法迭代中忽略像素的空间信息,提出了一种结合像素空间邻域信息改进的FCM图像分割算法(SAFCM)。新算法首先计算出像素的邻域平均值,然后求出邻域平均值和像素的差异,把该差异值作为空间信息的影响权值,利用像素值和空间信息构造新的目标函数,从而实现图像的分割。仿真实验表明,新算法能够更好的抑制噪声,降低噪声敏感性,提高图像的分割质量。  相似文献   

4.
离群数据检测是找出与正常数据不一致的数据。学生评教中由于某种原因,会出现一些评教噪声数据。针对学生评教中噪声数据的特征,提出了一个基于熵值距离的离群点检测算法,该算法通过比较每个数据点所对应的熵值和整个数据集的熵值,来判断数据点的离群程度。仿真结果表明该算法对学生评教中出现的噪声数据具有较好的过滤效果。  相似文献   

5.
为了更有效地改善手势以延长其生命周期,采用量化指标指导手势改善方向的决策。基于属性重要度,给出了复杂人因条件下手势改善方向的决策算法。根据模糊层次分析法计算指定手势每个属性的全局权重,并根据用户反馈计算指定手势每个属性的局部权重,全局权重与局部权重调和得到综合权值向量。依据用户对指定手势的综合印象,将各属性评分分为两类分别进行处理。根据各属性的正向与负向影响力,得到权值向量中各属性权值分布。对各属性评分分别计算标准化评分偏置,各属性改善需求程度排序通过权值分布与标准化评分偏置进行计算。实验结果表明,基于该算法比基于问卷调查决策制定的手势,支持率平均提高了25%,从而得出结论:手势优化过程中各属性的权值排序是稳定的。  相似文献   

6.
在考虑像素邻域相似性的基础上,对Morel等人提出的非局部均值滤波算法进行优化.该算法充分考虑图像中存在的大量冗余信息,通过计算邻域内像素点灰度值的加权平均来恢复中心点的灰度值,并对邻域内的点进行一次预分类,只考虑邻域内与中心点相似性大的点,而忽略与中心点相似性小的点,从而减小了算法的计算复杂度.实验结果表明,用该算法处理的图像,其视觉效果和峰值信噪比均不低于非局部均值算法,而运行速度提高了45%以上.  相似文献   

7.
为了提高高维数据集合离群数据挖掘效率,在分析了传统的离群数据挖掘算法优点和缺点的基础上,提出了一种离群点检测算法,首先将非线性问题转化为高维特征空间中的线性问题,然后利用非线性数据变换进行维数约减,对从高维采样数据中恢复得到低维数据集,通过本文提出的离群数据假设,并结合本文给出的离群聚类方法对所得数据对象投影分量是否是离群数据进行判别。仿真实验的结果表明了该方法能够有效地发现高维数据集中的离群点。与此同时,该算法具有参数估计简单、参数影响不大等优点,为离群点检测问题的机器学习提供了一条新的途径。  相似文献   

8.
针对传统离群点检测算法的局限性进行研究,利用数据对象之间的相邻关系,提出了一种基于密度和距离相结合的离群检测算法,该算法解决了基于距离的离群检测算法不能准确识别局部离群点的问题,有效避免由于稀疏和密集簇过于邻近的而出现离群点误判的情况。通过在人工模拟数据及真实数据集上的实验测试证明改进算法的可行性,该算法能更有效地检测出数据集中的离群对象。  相似文献   

9.
介绍了天线调谐器阻抗匹配网络的结构和调谐的本质,提出采用基于启发式算法的邻域搜索算法来解决这一个NP-hard问题;给出了基于固定步长的最近邻域搜索算法的迭代步骤,通过对邻域结构和搜索方式的改进,降低了搜索空间、加快了调谐速度;最后采用基于最近邻域搜索的4种算法对10 m短波鞭状天线进行匹配仿真,验证了改进算法的有效性。  相似文献   

10.
改进的邻域均值滤波去噪算法研究   总被引:1,自引:0,他引:1  
邻域均值滤波算法作为图像去噪算法的经典方法,不仅可以有效地消除噪声对图像的干扰程度,并且能够快速平滑图像,但它的缺点是会使图像边缘模糊,窗口越大,模糊程度越明显。本文针对椒盐噪声,分析原邻域均值滤波算法,通过与能量最小化原理相结合,提出新的改进的邻域均值滤波算法,这个算法构造了两个不同能量最小化函数模型,即E1模型和E2模型。两个模型均从图像像素点局部邻域出发,通过求解局部邻域能量最小判断是否利用邻域均值替换原像素灰度值。这个新的去噪算法不仅改变了原邻域均值滤波算法单一的替换灰度值的做法,降低了将非噪声点误判为噪声点的可能性,并且可以根据图像的大小自适应调节阈值,最后达到去除噪声的效果。通过与邻域均值滤波算法进行实验对比,取得较好的去除噪声效果。  相似文献   

11.
Young children appear to know when a novel label for a novel object is a common noun. The present study was concerned with the properties of a named object that children assume to be true of other members of the category that is specified by such a noun. Preschoolers, second graders, and college students were shown drawings of objects and given nonsense labels for those objects. They then viewed other objects that varied from the labeled ones along 4 particular attributes and were asked to decide if those other objects should also receive the same label. Preschoolers focused mostly on single attributes in making category decisions, and their choices of attributes were evenly distributed among the 4 types. Older individuals primarily exhibited multiple attribute rules. The results are discussed in terms of developmental differences in the modes of processing that are used and in the types of knowledge that are brought to bear on the word learning situation.  相似文献   

12.
提出了一种分类规则的蚁群挖掘算法.算法首先对所有的连续属性值离散化,得到相应的离散属性,然后让各只蚂蚁按照某种策略选择相关属性,对所选属性再选择理想的属性值,循环地构造单个规则,接着更新训练集,最终形成各类规则集.最后用新规则约简算法进行约简操作.对两个公用数据的实验及其与Ant-Miner和C4.5的对比表明,算法能够发现更好的分类规则.实验同时表明该算法是有效的.  相似文献   

13.
从人工智能的角度考虑,在具体的知识领域中,所有个体和属性构成了不同的形式背景。对于属性集合有穷,但是所有个体集合基数很大甚至无穷的研究领域的形式背景。我们设计扩充的属性探索算法求特定知识领域的Duquenne-Guigues基,并通过实例计算展示算法的功能。  相似文献   

14.
Preschoolers' (2-, 3-, and 4-year-olds) understanding of attributes and dimensions was examined in 3 experiments. Attribute knowledge is the knowledge that a particular attribute--for example, red--can be instantiated in a variety of distinct objects. Dimension knowledge is the knowledge that there are qualitatively distinct kinds of attributes; for example, red and blue are attributes of the same kind, a kind that is different from that of big. Preschoolers' understanding of attributes and dimensions was assessed by both a conceptual measure and a linguistic measure. A language-free follow-the-leader task served as the conceptual measure. In this task, all the children showed strong attribute knowledge. However, 2-year-olds did not appear to differentiate attributes into their dimensional kinds. The observed trend in the linguistic task was not isomorphic to that observed in the conceptual task. The acquisition of some attribute and dimension labels appears to follow closely the trend in conceptual development, whereas the acquisition of others (specifically, size-attribute labels) lags severely behind the attainment of the basic concepts. The results provide new information about the development of object comparison and the acquisition of dimensional terms.  相似文献   

15.
为了缩减知识推理空间,提高分布式环境下知识处理的效率,提出分布式概念格属性约简的理论框架.基于粗糙集理论的思想,从子形式背景和全局形式背景的角度,刻画了核心属性、相对必要属性和绝对不必要属性的属性特征,给出属性约简的判定定理.在此基础上,给出概念格的分布式属性约简方法:首先,使用现有的约简方法分别计算各子形式背景的约简,然后,逐一利用各子背景的约简,通过合并计算得到全局形式背景的约简.给出了算法的实现并用实例验证了它的有效性.分布式约简有效避免了使用现有方法而引起的数据安全和网络通信等问题,提高了约简的计算效率.  相似文献   

16.
1 Introduction Data miningis currently receiving much research at-tention. Real-life data are frequently i mperfect : Erro-neous ,incomplete , uncertain and vague .In this pa-per , we investigate data incompleteness ,i.e., miss-ing of attribute values .Fo…  相似文献   

17.
在复杂地物类型背景条件下,多目标跟踪算法通常表现出目标识别与跟踪能力较差问题,特别在被其它地物遮挡后目标跟踪丢失更严重。提出一种改进的基于多源特征提取与特征融合的多目标跟踪算法。为提高目标在复杂背景下的空间分辨力,充分利用对异类物体判别能力较强的高层特征和针对同类不同物体判别能力较强的浅层特征,提高复杂背景下地物目标的识别能力。同时,为了解决物体被遮挡后导致跟踪算法丢失目标问题,利用滤波器获得追踪目标的空间尺度大小,提高跟踪算法的准确性与可靠性。实验表明,多目标跟踪算法识别目标的准确性可达87.5%,误差在[±2.31%]左右,具有良好的尺度估计效果。  相似文献   

18.
粗糙集理论被广泛应用于人工智能、模式识别、数据挖掘和知识发现等领域。而对象的属性约简是是粗糙集理论中的重要问题之一。由于属性约简计算量较大,影响了的粗糙集的实际应用。本文用RBF神经网络高效和OLS对称性的特点,研究粗糙集属性的约简,解决了属性约简的难题,完成了算法的实现,取得了较好的效果。  相似文献   

19.
This paper focuses on document clustering by clustering algorithm based on a DEnsityTree (CABDET) to improve the accuracy of clustering. The CABDET method constructs a density-based treestructure for every potential cluster by dynamically adjusting the radius of neighborhood according to local density. It avoids density-based spatial clustering of applications with noise (DBSCAN) 's global density parameters and reduces input parameters to one. The results of experiment on real document show that CABDET achieves better accuracy of clustering than DBSCAN method. The CABDET algorithm obtains the max F-measure value 0.347 with the root node's radius of neighborhood 0.80, which is higher than 0.332 of DBSCAN with the radius of neighborhood 0.65 and the minimum number of objects 6.  相似文献   

20.
为了改善传统K-Modes聚类算法相异度度量公式弱化了类内相似性,忽略了属性间差异,以及单一属性值的Modes忽视了某一属性可能存在多属性值组合,且算法受初始中心点影响很大的缺点,基于多属性值Modes的相异度度量方法提出MAV-K-Modes算法,并采用一种基于预聚类的初始中心选取方法。使用UCI数据集进行实验,结果表明,MAV-K-Modes算法相比于传统K-Modes算法,其正确率、类精度和召回率都有明显提升,且MAV-K-Modes算法适合于并行化改造。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号