首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
研究者在设计测量方案时,不仅仅要考虑与所研究的问题有关联的变量,也要考虑到出现高比例无回答的可能性,要设计与缺失机制相关的变量。对于处理无回答的技术而言,多重插补是目前相对较优的方法。本文运用全国概率抽样调查数据,针对政治学敏感问题的无回答处理技术进行了探讨,介绍了多重插补的使用方法,并指出了认知、兴趣和担忧这三种变量对政治学敏感问题进行插补的功效与意义。  相似文献   

2.
统计调查中,经常会遇到数据缺失的现象.缺失数据会影响统计分析的质量.文中提出了一种先对数据的缺失机制进行统计检验,针对是否存在显著分布偏性,分别采取相应的插补算法的统计方法.该系统算法可以全面处理离散数据和时间序列数据的不同缺失机制的缺失数据.  相似文献   

3.
针对数据缺失这一普遍情况,提出一种改进的微粒群优化特征选择方法.首先,采用多重插补方法对缺失的数据进行插补,得到完整数据集;然后,采用k折交叉验证法计算分类器的精度,并在算法运行后期,对微粒群进行K均值聚类,从中选择微粒的全局最优点;最后,通过UCI中4个典型测试问题,仿真验证了所提算法的有效性.  相似文献   

4.
利用旅游微观数据平台中获取的大量旅游消费类数据,建立了一个旅游者消费类型预测模型,在部分缺失旅游消费数据的情况下可以对旅游者的消费类型进行预测和判断。该模型基于监督性学习理论,首先针对已有的完整的消费数据进行学习,使用学习算法不断降低模型的判断误差,直到可以进行比较准确的数据预测;再根据数据缺失情况的不同,采用BP神经网络和均值插补的方式进行补足;然后通过K-means聚类分析方法,对已经补足的数据进行聚类,从而达到预测判断旅游者消费类型和层次的效果,进而达到在已知部分旅游数据的情况下能对旅游者的消费类型进行预测判断的效果。  相似文献   

5.
针对基于深度神经网络填补多变量时序数据缺失值时存在误差引入的问题,将强化学习和图神经网络结合,提出了基于强化学习的多变量时序数据缺失值补全方法(reinforcement learning based missing value completion method for multivariate time series data, RL-CFMTS)。具体地,设计了一个图神经网络模块,用于预测最终的缺失值。同时,该模块还为强化学习模块提供状态向量和奖励,指导强化学习为目标时序节点挑选其认为最相似的b个节点来建立时序关系,以减少误差的引入。在3个真实世界数据集上的实验结果表明,RL-CFMTS在插补准确性方面优于近年来的多变量时序数据缺失值填补方法,在天气、股票和疫情数据集中平均绝对误差(mean absolute error, MAE)指标分别提升了12.78%、15.80%和55.73%。  相似文献   

6.
文章以苏州科技学院青年教师讲课竞赛(决赛)的评分数据为实例,通过对缺评数据的插补、原始分与标准分和MFRM计分方法导致的选手排名对比等细节问题的研究,认为标准分计分方法并不适用于这一赛事,而数据插补和MFRM计分方法则较为合理、可靠。  相似文献   

7.
BP神经网络是目前应用最广泛的人工神经网络模型之一,在分类和识别上表现出良好的特性,因此被研究者用于认知诊断评估以对被试进行诊断分类。通过模拟研究,考查属性个数、属性层级关系、测验长度、题目质量、测试样本量5个因素对BP神经网络在认知诊断中分类准确性的影响。结果表明:1)基于BP神经网络的认知诊断分类准确率不依赖于测试样本量;2)题目质量和测验长度对BP神经网络的诊断准确率有显著的积极影响;3)属性个数对BP神经网络的分类准确率有消极影响;4)题目质量一定程度上会影响BP诊断方法在不同属性层级结构上的分类准确率。  相似文献   

8.
缺失数据的处理和挑战   总被引:1,自引:0,他引:1  
在数据挖掘研究中,缺失数据是一个非常普遍的问题,如何处理缺失数据也是一个热门的研究领域.介绍了缺失数据产生的原因,分类总结了缺失数据的处理方法,最后,提出了处理缺失数据的一些挑战性课题。  相似文献   

9.
文章研究因变量缺失下的线性回归模型,借助单点插补方法,首先给出模型的估计.研究参数估计量的渐近正态性,其次,对于模型系数的线性约束检验问题,基于wald方法构造检验统计量并给出其渐近分布.最后.通过数值模拟验证所提方法的有效性.  相似文献   

10.
提出了一种基于RBF的时序缺失数据修复方法,利用RBF构建模板数据和当前存在缺失的数据之间的训练关系,并通过该训练关系修复缺失数据.实验表明,该方法能够应用于刚性体以及非刚形体运动或形变追踪,是一种有效的时序缺失数据修复方法.  相似文献   

11.
随着当前我国科学技术的不断进步与发展,数据挖掘技术其实际的应用范围也变得越来越广泛,但是在实际使用过程中数据都存在着缺失值现象,因此在实际使用过程中研究缺失数据相应的数据挖掘方法就起着至关重要的作用,当前较为常见的方法有直接删除、特殊值填充以及平均值填充等方法,利用这类方法来建立相应的缺失值处理模型,还需要建立相应的朴素贝叶斯分类器模型,将实际所获得的数据集进行比较分析,并且利用相应的验证方法对最终模型的实际性能进行检验,结合实际的应用分析,利用模型构建的方法来处理由缺失值构建而成的朴素贝叶斯分类器效果是十分显著的。  相似文献   

12.
陈天炎 《闽江学院学报》2010,31(5):40-43,112
介绍了一种实用高效的轨迹插补方法——比较积分法的插补原理及其特点,对比较积分法插补运算原理进行了理论分析,给出了直线、圆弧插补的插补公式和计算实例,并对此插补方法进行了软件仿真.  相似文献   

13.
考虑响应变量随机缺失下线性模型响应变量均值的估计问题,分别获得了基于完全观测样本数据、线性回归插补后的"完全样本"和逆概率加权插补后的"完全样本"得到的响应变量均值估计,并证明了其渐近正态性.  相似文献   

14.
将时间分割法插补原理用于开环CNC系统;研制了系统的硬件和软件;分析了插补精度和插补速度;提出了圆弧自动过象原理和步进电机升降速的控制方法。这种插补方法可获得较高的插补速度和插补精度,易于用八位微计算机实现  相似文献   

15.
数据缺失是临床试验中常见但又不可避免的问题之一。由于医疗设备欠缺或者病患忽略检测白蛋白,可能造成白蛋白指标缺失。随着机器学习的广泛应用,很多研究者将机器学习应用在缺失数据估计上。提出一种基于随机森林与聚类方法结合的算法——双随机森林回归法,并将该算法应用于估计白蛋白缺失值。在准确率和鲁棒性方面,双随机森林回归法相比于最近邻法、决策树与随机森林方法,均有不同程度提高。该算法为缺失值的有效处理提供了一种新思路,可以为其它的缺失值估计研究提供参考。  相似文献   

16.
本文对传统的数控直线插补方法进行了算法改进,使插补过程中各坐标轴分配的脉冲序列保持均匀,以克服步进电机失步问题,提高了插补精度。  相似文献   

17.
几种不同缺失值填充方法的比较   总被引:1,自引:0,他引:1  
在数据挖掘和机器学习领域,缺失数据经常出现,本文从理论和实验两方面分析了常用的几种处理缺失数据的方法的优、缺点。  相似文献   

18.
项目反应理论模型的参数估计一般需要较大样本量,小样本量条件下参数型与非参数型项目反应理论模型的相对优势并无定论。通过计算机模拟数据比较两类模型在小样本量时(n<=200)估计项目特征曲线所产生的偏误及均方根误差。当模拟数据基于3PL模型生成时,参数型与非参数型模型在样本量低于200时估值偏误方面无差别,但前者均方根误差较小。在样本量为200时,两模型估算值类似。当真实数据基于3PL模型且样本量小于200时,参数型Rasch模型比非参数核平滑模型更值得推荐。  相似文献   

19.
基于计算机数控系统中逐点比较法的基本思想,提出一种新的插补算法.对该算法原理进行研究,并由教学方法导出了直线插补和圆弧插补的偏差函数.分析了传统算法及改进算法的插补速度及插补精度.  相似文献   

20.
针对并联机床高速高精度加工需要,深入研究了NURBS曲线直接插补方法,提出一种适合并联机床的NURBS插补算法,在提高插补的实时性的同时,降低了运算的复杂性,提高了误差精度。插补实例表明该算法能保证高速、高精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号