首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
针对数据挖掘中高维数据多分类问题,提出了一种基于二分K均值的SVM决策树的高维数据分类方法.该方法先利用二分K-均值将高维数据基本聚为k类,再构造SVM多分类模型,利用它对各类进行细分.本文给出了该模型的构造及应用方法,并在标准数据集上验证了该方法的有效性.  相似文献   

2.
本文利用数据挖掘领域的基因表达式编程算法,对软件失效数据进行数据挖掘,得出失效表达式,从而对软件的可靠性程度进行评价或预测。实验证明:该软件评测系统具有较高的预测精度。  相似文献   

3.
将关联规则挖掘用于奖学金评测信息分析中,借助数据挖掘技术对奖学金信息进行深度挖掘,寻找与各个奖项相关联的因素.算法上,直接采用Apriori算法进行频繁项目集的发现.  相似文献   

4.
知识发现中的数据离散化处理   总被引:1,自引:0,他引:1  
主要讨论了基于粗集的数据挖掘的连续数据离散化处理过程.  相似文献   

5.
随着当前我国科学技术的不断进步与发展,数据挖掘技术其实际的应用范围也变得越来越广泛,但是在实际使用过程中数据都存在着缺失值现象,因此在实际使用过程中研究缺失数据相应的数据挖掘方法就起着至关重要的作用,当前较为常见的方法有直接删除、特殊值填充以及平均值填充等方法,利用这类方法来建立相应的缺失值处理模型,还需要建立相应的朴素贝叶斯分类器模型,将实际所获得的数据集进行比较分析,并且利用相应的验证方法对最终模型的实际性能进行检验,结合实际的应用分析,利用模型构建的方法来处理由缺失值构建而成的朴素贝叶斯分类器效果是十分显著的。  相似文献   

6.
基于数据挖掘的重整风机状态监测系统的研究   总被引:1,自引:0,他引:1  
研究了数据挖掘技术在重整风机状态监测系统的应用。论述重整风机监测系统的组成原理,着重讨论了位移、振动信号数据知识库建立和采用粗集理论对重整风机进行监测和故障预报的方法。  相似文献   

7.
取样是一种通用有效的近似技术。在数据挖掘研究中,取样方法可显著减小所处理数据集的规模,使得众多数据挖掘算法得以应用到大规模数据集以及数据流数据上。文章在研究了统计学上随机均匀取样方法误差统计和衡量方法的基础上,着重探讨和研究了适用于数据挖掘领域的取样方法衡量标准以及影响取样方法选择的因素等问题,提出了能更好地评估取样质量,尤其是偏倚取样方法取样质量的"取样方法代表性"和"取样偏差"等概念并进行了量化,最后对数据挖掘取样方法的衡量标准和选用研究的后续工作与研究方向进行了阐述。  相似文献   

8.
总结了数据挖掘的基本方法、文本数据挖掘的关键技术,讨论了文本挖掘的定义和文本分类的一些形式,并对文本数据的数据挖掘算法进行了研究。  相似文献   

9.
因特网上有海量的数据信息,数据挖掘是从大量的数据中发现隐含的规律性内容,充分利用有用数据,废弃无用数据,解决数据的应用质量问题。通过对Web的数据挖掘和XML特点进行分析,讨论了使用XML实现基于Web的数据挖掘方法,提出了一种结合HTML、XMLJ、AVA的新型数据挖掘技术。  相似文献   

10.
数据挖掘技术在高校图书馆中的应用   总被引:1,自引:0,他引:1  
该文在介绍数据挖掘技术和数据挖掘方法的基础之上,结合目前高校图书馆的实际情况,就如何应用数据挖掘技术进行了研究,并提出了电子数据的数据挖掘模型。  相似文献   

11.
数据仓库与数据集市   总被引:3,自引:0,他引:3  
文章主要从数据仓库和数据集市的概念入手,讨论了数据仓库和数据集市的特点、区别和联系,以及它们创建等问题。  相似文献   

12.
浅谈数据挖掘与数据仓库   总被引:1,自引:0,他引:1  
数据挖掘和数据仓库,两者是相辅相成,融合与互动发展的。在金融行业引入数据仓库、数据挖掘技术,能使银行的信息技术应用从业务操作层提升到管理决策层,使其内部管理和流程优化。  相似文献   

13.
数据仓库与数据挖掘技术   总被引:1,自引:0,他引:1  
较为详细地阐述了数据仓库和数据挖掘的概念 ,同时指出了开发数据仓库的流程和数据挖掘技术的方法  相似文献   

14.
阐述了数据清理的概念和意义,介绍了缺失值修补和孤立点识别采用的主要方法,并指出有待进一步研究的问题。  相似文献   

15.
16.
17.
This paper contributes a theoretical framework informed by historical, philosophical and ethnographic studies of science practice to argue that data should be considered to be actively produced, rather than passively collected. We further argue that traditional school science laboratory investigations misconstrue the nature of data and overly constrain student agency in their production. We use our “Data Production” framework to analyze activity of and interviews with high school students who created data using sensors and software in a ninth-grade integrated science class. To understand the opportunities for students to develop act with and perceive agency in data production, we analyze in detail the case of one student as she came to use unfamiliar technologies to produce data for her own personally relevant purposes. We find that her purposes for producing data emerged as she worked, and that resistances to her purposes were opportunities to act with and perceive her own agency, and to see data in new ways. We discuss implications for designing science learning experiences in which students act as agents in producing and using data.  相似文献   

18.
材料数据库建设存在着诸多问题,已不适应材料科学研究的发展需要。采用数据集成技术是解决问题的关键。通过分析数据仓库技术特点,以及材料研究的数据要求和管理特点,提出了采用数据仓库进行材料数据集成和分析的新思路。  相似文献   

19.
大多数半结构化数据都具有一定的结构规律,将它们转化为基于关系数据库存储的结构化数据,可有效地应用DBMS技术进行处理,部分不便于转化的数据作特殊处理,以保证整个数据的无损映射,本在完成DTD的转换后,从一种最简单的映射方式入手,提出改进方案,利用一种基于数据挖掘的模式抽取方法,对不同类型的元素分别处理,设计了一套有效的溢出数据处理办法,实现了半结构化数据到结构化数据的无损映射。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号