共查询到20条相似文献,搜索用时 31 毫秒
1.
谢枫平 《闽西职业技术学院学报》2009,11(4):124-128
高维数据能充分表达复杂事物的信息,但高维数据自身表达和处理复杂,妨碍了它的实际应用。阐述了用降维算法和构建索引结构来解决高维数据降维问题。以数据对象变异最大方向的投影作为特定数据对象集的主成份,将聚类分析引入高校数据资源的预处理环节,实现了数据对象集合的聚类归约。给出应用实例,为深入探索相关模式提供有效的分析方法。 相似文献
2.
为了对高维的基因表达数据进行有效的降维,本研究采用基于Fisher准则的思想对特征空间进行特征组合,从而得到新的特征空间。实验结果表明,在无法对数据再进行降维的原特征空间中,经过线性变换的方法得到的新特征空间可继续对其数据进行降维。通过这种方法,能将四川省医学科学院动物研究所所提供的抑郁症大鼠DNA的基因表达数据有效地从4353维降到1393维。 相似文献
3.
4.
黄利文 《通化师范学院学报》2013,(4):9-11
针对高维数据的判别问题,采用改进的主成分分析法进行降维,按85%的贡献率提取判别数据的主成分,然后以近邻原则建立距离判别准则,并以该准则对待判样品进行判别归类.实例表明,对于高维数据的判别问题,通过降维的方法,有助于提高判别模型的判别正确率. 相似文献
5.
投影寻踪技术是国际统计界于70年代中期发展起来的、用来处理和分析高维观测数据,尤其是非正态、非线性高维数据的一种新兴统计方法。它利用计算机直接对高维数据进行投影降维分析,进行数据客观投影诊断,自动找出能反映高维空间规律的数据结构,达到研究分析高维数据的目的。本文对30多年来投影寻踪技术在应用领域方面的文献进行收集整理,探讨投影寻踪技术在相关领域的应用和发展状况,为从事投影寻踪研究或应用的专业人员获取和利用相关信息提供线索和参考。 相似文献
6.
景明利 《西安文理学院学报》2014,(4):48-52
分类介绍了目前具有代表性的数据降维方法,重点阐述了一种新的数据降维方法 -压缩感知,在此基础上,分析了各种数据降维算法的优缺点,并对数据降维研究中存在的问题进行了剖析. 相似文献
7.
8.
<正>数学中,维是指一个问题中元素的自由度,即该元素的坐标数,如数轴上点的维数是1,平面内点和直线的维数是2,在空间中点和平面的维数是3等等.降维则是通过一些数学方法,将高维的数学问题降为低维的数学问题,从而使问题简化,达到解决问题的目的.降维,作为一种数学方法,意指如:一般问题的特殊值解法,多元减为少元,立体几何问题转化为平面几何问题等等.降维方法是处理数学问题的一种行之有效的方法,但在教学中还不仅要介绍降维方法, 相似文献
9.
为了提高高维数据集合离群数据挖掘效率,在分析了传统的离群数据挖掘算法优点和缺点的基础上,提出了一种离群点检测算法,首先将非线性问题转化为高维特征空间中的线性问题,然后利用非线性数据变换进行维数约减,对从高维采样数据中恢复得到低维数据集,通过本文提出的离群数据假设,并结合本文给出的离群聚类方法对所得数据对象投影分量是否是离群数据进行判别。仿真实验的结果表明了该方法能够有效地发现高维数据集中的离群点。与此同时,该算法具有参数估计简单、参数影响不大等优点,为离群点检测问题的机器学习提供了一条新的途径。 相似文献
10.
数据分析处理是软件工程类教学中不可缺少的程序实验,传统的此类实验忽视了学生的创新和实践等综合能力的培养。城市交通轨迹作为近年来生成的一种新数据,在数据处理方法上与传统数据有较大差别。分析了交通数据的产生和定义,并结合城市交通轨迹数据处理大学生创新实验项目,分析了大学生如何在解决交通数据处理方面的新问题过程中提高创新能力,总结了大学生创新实验的成效和体会。 相似文献
11.
在大数据技术迅速发展的今天,利用海量的学习数据对学习者的学习过程进行数据分析、建模和解读是在线教育研究的热点和难点问题。文章提出了一种使用主成分分析对实时学习数据进行分析,最终得到对学习者评价的方法。本文通过使用大数据量的样本分析,提出了包括行为数量、行为得分、考试得分等三类共计11个指标,使用主成分分析法将这些指标降维,得到5个表征学习过程的主成分,然后使用主成分回归对5个主成分进行回归分析,最终得到对学习者的评价模型。结果显示模型能准确评估学生学习效果,并已应用于实际系统。 相似文献
12.
针对基于项目的协同过滤推荐算法(Item-CF)在处理高维项目评分数据时出现计算效率急剧下降的不足,提出一种将改进的多探寻局部敏感哈希算法(MPLSH)和Item-CF相结合的推荐算法。改进的MPLSH通过将待搜索哈希桶的探寻方式由原始的哈希值差异导向替换为由距离远近导向,从而减少MPLSH需要探寻哈希桶的个数,缩小了Item-CF中相似项目集合的查找范围。并利用MPLSH本身具有的高效数据降维特性,提高Item-CF在高维项目评分数据中寻找相似项目集合的速度,从而有效改善Item-CF在处理高维项目评分数据时计算效率下降的问题。通过在MovieLens电影评分数据集上进行实验和算法比较,验证了该算法的有效性。 相似文献
13.
《兰州石化职业技术学院学报》2021,(3)
传统的K最近邻算法(KNN)是机器学习领域中思想简单、易于学习、对低维数据处理效率较高的分类方法之一,但是在高维数据的分类中效率不高、性能会降低。针对传统KNN算法在处理多维数据集上的不足,提出了一种新的KNN改进算法:将线性回归方法引入该算法中,利用属性间的决定系数选择合适的属性集合,降低高维数据集的维数,并采用卡方距离作为KNN算法的距离度量函数,克服欧式距离不能体现特征向量之间相对关系的不足。实验结果分析表明,在标准数据集的测试中,基于线性回归方法的改进KNN算法达到了较高的分类准确度,相对于传统KNN算法在属性识别度上有了一定的提高。 相似文献
14.
15.
16.
近年来,各种复杂数据得到广泛应用。但复杂数据的高维性,比如说三维人体运动数据。给后续分析和处理带来了困难。本文对等测地线距离(ISOMAP)的非线性流型学习方法进行扩展,克服了其无法应用到新数据集的先天缺陷,然后应用到运动捕获数据的降维中。实验结果显示,该降维方法很好地揭示了数据的内在结构,实现了高效的降维。能够有效地应用于计算机专业课程教学研究领域。 相似文献
17.
针对微震信号的非线性、复杂性等特点,提出一种基于等距特征映射(Isometric feature mapping)和支持向量机(Support vector machine)相结合的微震前兆辨识方法。利用ISOMAP把数据从高维空间投影到低维空间而不改变数据内在属性的特点,对高维的微震信号进行降维,以发现嵌入在高维数据空间中的低维流形结构,作为冲击矿压灾变的最优敏感特征,采用Gauss核函数支持向量机作为分类器进行监测预警。实验结果表明,该方法可有效实现冲击地压微震前兆辨识。 相似文献
18.
19.
廖律超 《福建工程学院学报》2012,(3):266-270
分析了公众出行信息特征及影响出行线路选择的因素,设计了多源交通数据融合挖掘的系统框架,并研究了其中的多源数据相关度计算、层次化子空间聚类及联合聚类挖掘等关键技术。理论分析及实验结果表明,系统对于多源交通数据的融合分析及高维数据的降维聚类具有良好的处理能力及可扩展性。 相似文献
20.
《赤峰学院学报(自然科学版)》2016,(20)
离群点研究在实际应用中有着重要的意义,随着数据规模的不断扩大,传统的离群点检测方法已经不适用于高维空间数据,本文在遗传算法的基础上结合模拟退火算法,一方面利用遗传算法对高维数据处理有很好的全局搜索能力,一方面利用模拟退火算法的局部搜索能力,最后经实验证明,本文提出的新算法能有效的提高高维空间离群点检测的效率. 相似文献