共查询到20条相似文献,搜索用时 15 毫秒
1.
【目的/意义】针对多组时间序列的海量数据集和以预测为目标的信息分析方法,提出了基于数据挖掘技术 的预测模型,在大数据环境下,提高了预测精度,以期在其他领域的信息分析和情报预测能有所借鉴。【方法/过程】 以集装箱海运价格预测为例,提出集装箱海运价格预测模型,设计自适应的网格搜索策略,高效准确地确定数据挖 掘算法中的超参数组合,提出基于时间序列留出法的评估方法,降低了集装箱运价这种多组时间序列数据集在数 据挖掘结果上的泛化误差,针对海量运价信息,对GBDT算法进行并行计算设计和预排序后的损失函数迭代计算 优化策略,提高了算法在大数据环境下的计算效率。【结果/结论】模型和算法运行结果仿真显示:对于传统的时间 序列问题,基于数据挖掘方法的预测模型取得了比传统时间序列方法更优的结果。 相似文献
2.
3.
组合方法首先选取支持向量机预测算法和一阶指数平滑法对经济时间序列分别进行预测,来建立模糊自适应变权重组合预测模型。为对比模糊自适应变权重的经济时间序列组合预测模型的预测效果,选取了两种定值加权组合预测模型:平均加权模型、误差平方和最小组合预测模型。通过实验比较分析:模糊自适应变权重组合预测可以综合利用各单项预测方法的优点,比单一模型预测结果精度有了很大提高,且优于定值加权组合预测,在经济时间序列的预测方面有较高的应用价值。 相似文献
4.
【目的/意义】图书借阅数据的预测对于图书馆的资源建设和精准服务具有重要的指导意义。本文收集了
中国东北地区某双一流高校图书馆管理系统十年的借阅数据,并分别按图书类别、借阅者所属学院分类,对未来的
借阅趋势进行了预测。【方法/过程】本文使用一种基于时间序列的混合预测模型进行图书借阅数量的预测,其中混
合预测是一元时间序列预测与多元时间序列预测的结合。【结果/结论】实验结果表明,时间序列算法用于高校图书
馆借阅数据预测,2008 年到 2017 年借书数量由 300 左右增加到近 4000,2018 年到 2021 年 C、D、G、J、S、U、I类图书
中,D类、S类图书的借阅数量下降幅度最大,U类图书借阅数量下降幅度最小,T类、E类借阅量的上升幅度最大,Q
类、X类的误差率较大,研究结论供高校图书馆管理工作参考。【创新/局限】学界上针对图书馆馆藏资源建设和服务
创新研究较多,但以一元时间序列与多元时间序列预测角度进行研究的相对较少,本文弥补了此方面的不足。 相似文献
5.
【目的/意义】提出基于Stacking集成学习的问答信息采纳行为识别策略,促进在线健康社区问答的精准化推送、助推数字化医疗服务高质量发展。【方法/过程】构建以集成学习方法和非集成学习方法为基学习器、以逻辑回归算法(LR)为元学习器的Stacking集成学习模型,比较单预测模型、同类预测模型组合、不同类预测模型组合的Stacking集成学习模型预测精度,选取“寻医问药”平台的慢性病问答构建数据集验证模型的优越性,并选取“快速问医生有问必答120”平台数据验证模型的可移植性。【结果/结论】Stacking集成模型相比于单预测模型能够更精准识别被采纳问答信息,模型具有较强的泛化性,可以适用于不同的在线健康社区。【创新/局限】本文基于Stacking集成思想构建两阶段预测模型,并借助机器学习构建最佳预测模型组合,显著提高在线健康社区问答信息采纳识别精度,但伴随问答信息积累,在线健康社区问答模式不断发展变化,考虑结合历史数据和每日更新数据的动态预测方法是未来研究工作重点。 相似文献
6.
7.
【目的/意义】挖掘药物筛选工作中的隐性知识,借助机器学习的预测能力替代生物实验方法,减少制药流程的研发时间和经济成本。【方法/过程】提出一种面向知识发现的ADMET情报预测理论框架,以4种传统机器学习方法和2种集成学习方法,分别构建6种分类预测模型,提取药物的隐性知识,比较不同模型的优越性,评估最优模型的经济价值。【结果/结论】以药物分子描述符信息预测ADMET具有可行性,6种模型性能表现综合排序结果为随机森林、梯度提升决策树、Logistic回归、支持向量机、K近邻、高斯朴素贝叶斯。前沿信息技术能够有效应用于药物知识发现,信息经济学分析可预见创造可观收益,是未来制药工艺降本增效的重要手段。【创新/局限】未来应融合专家知识、追加试验验证、丰富参考指标。 相似文献
8.
9.
【目的/意义】为了支持高价值专利培育工作开展,面向潜在高价值专利预测的需求,提出基于随机森林算法的潜在高价值专利预测方法。【方法/过程】梳理现有研究,选择用于潜在高价值专利预测的指标,构建基于随机森林算法的潜在高价值专利预测模型。使用“语音信号识别”领域的19647条专利进行实证分析,模型预测准确率达96.01%。【结果/结论】目前适于从海量早期申请中发掘潜在高价值专利的方法研究较少,本方法能够在专利申请早期发挥作用,同时具有预测准确率高、处理数据量大、模型可解释性好的优点。 相似文献
10.
《科技通报》2017,(9)
水质的时间变化趋势预测是进行水环境管理的前提,预测模型在很大程度上决定了预测精度的高低,如何选取有效的时间序列水质预测模型是目前的研究热点之一。以平西湖为研究对象,根据2009-2011年间TN、TP和CODMn月监测数据,提出了一种基于ARIMA和RBF-NN的组合模型,该模型能同时反映水质的渐变性和非线性变化的特点,最后用5个精度评价指标对组合模型的预测结果进行了评价,并和基于ARMMA和时间序列神经网络预测模型的预测结果进行了比较。结果表明,大部分指标显示ARIMA/RBF-NN组合模型对受内生变量影响较大的TN、TP的预测效果最好,ARIMA模型对受外生变量影响较大的CODMn的预测效果最优。 相似文献
11.
【目的/意义】当前全球信息化时代下信息过载问题日趋严峻,在深度挖掘信息的基础上,结合用户行为特
征进行智能匹配显得尤为重要。【方法/过程】本文在基于潜在因子模型的个性化推荐算法的基础上,构建了结合时
间序列的语义信息挖掘及匹配模型。通过引入用户历史行为的时间序列语义信息,提高已有模型预测用户偏好的
准确性,结合因子分解机的思想实现对扩展模型的构建,并通过 movielens数据集对该方法的有效性进行验证。【结
果/结论】实验结果表明,新模型能够有效提高已有推荐模型预测用户偏好的准确性,从而实现了良好的数据挖掘
及匹配效果。 相似文献
12.
【目的/意义】针对现有主题演化方法难以满足预测目的的需求,本文从知识动态发展的角度出发,构建知
识主题演化预测模型,为探究科学领域发展脉络与研究趋势提供方法。【方法/过程】通过Lda模型抽取知识主题,利
用马尔可夫和隐马尔可夫构建主题稳态与主题热度的演化预测模型。【结果/结论】以云计算领域的科学文献作为
实证分析对象,结果表明本模型可以根据历史数据来预测知识主题稳态分布情况与未来热度趋势,且在热度预测
精度上较灰色模型更高。【创新/局限】本文只考虑了横向主题内部的热度高低变化,没有进行纵向维度上各知识主
题间的对比。 相似文献
13.
运用回归分析预测法和时间序列分析法两种模型,以文献计量学为例,对近年来相关文献量的统计数据进行拟合与预测,并对两种预测模型的结果进行对比分析。结果表明,时间序列预测模型对文献计量学研究的模拟预测效果较好。两种预测模型不仅适用于文献计量学发展研究,对于其他领域也同样适用。针对不同领域的学科发展趋势,在进行数据模拟和分析预测时要根据统计数据的多少和分布情况,选取一种相对效果更好并且方便可行的预测方法。 相似文献
14.
15.
《内蒙古科技与经济》2017,(13)
以金融时间序列(1990年~2014年上证指数)为研究对象,金融时间序列数据本身带有较大的波动性,有高频和低频的数据情况贯穿于整个时间序列。小波分析对于数据降噪较于传统的降噪方式有着明显的优势,分析对比小波变换在处理两种不同波频情况下的优势和方法。采用其适合小波分析和神经网络相结合的组合模型对其进行分析和预测,其思想是,先将时间序列进行小波分解,得到各级小波变换序列和尺度变换序列。根据不同级小波变换系数的情况,选择合适的神经网络训练函数建立预测模型,得到各级小波变换序列和最后一层尺度序列,运用小波重建技术得出原时间序列的预测值。最后和常规的BP神经网络比较预测效果。 相似文献
16.
【目的/意义】突发事件类网络舆情演化情况的掌握对舆情监管部门而言至关重要。鉴于此,本文致力于构 建能够准确预测舆情演化的模型,此预测模型的建立可拓宽舆情预测的渠道,为舆情参与主体和监管部门及时掌 握舆情演化态势提供方法依据。【方法/过程】基于随机森林(RF)算法建立突发事件网络舆情演化预测模型,以微博 和第三方舆情监测平台作为变量数据来源,以R语言为操作环境,然后进行模型的训练与预测。【结果/结论】实验 表明,较之其它方法,本文构建的模型有更高的拟合度和更低的误差值。从结果来看,本模型的预测输出值与真实 值最为接近,较好地实现了对舆情演化的预测,将RF算法应用在舆情预测的研究中具有一定的先进性。 相似文献
17.
18.
【目的/意义】将时间序列分析方法引入情感分析,可以对微博突发事件衍生舆情作出科学预测,为政府掌 握舆情情感走势,从而根据舆情发生的不同阶段采取相应的导控策略提供合理的意见与指导。【方法/过程】结合 突发事件衍生舆情的特点,采用词集合并法、SO-PMI、PMI-IR等方法构建了微博突发事件衍生舆情专属情感词 典,随后利用该情感词典和时间序列分析方法对“6.22”杭州保姆纵火案衍生舆情事件进行实证分析。【结果/结论】 对该事件的日均情感值进行计算,与实际情感值拟合程度较好,证明了建立的衍生舆情情感词典及时间序列模型 较为科学,可以为政府选择相应的策略及应对时机提供一定的参考。 相似文献
19.
【目的/意义】基于机器学习算法对信息进行聚类及预测引起了广泛关注,本文将以航空公司客户信息为对
象构建出k-means,BP神经网络模型,对航空用户进行聚类及预测,实现用户的精准营销。【方法/过程】首先,对航
空公司的客户信息进行预处理,并根据信息聚类和信息预测理论,构建出k-means客户聚类模型与BP神经网络的
流失预测模型。【结果/结论】实证结果表明,在聚类模型上,k-means算法将客户聚为五类,实现了不同价值客户的
差异化识别;在客户预测模型上,BP神经网络的准确性更高。【创新/局限】本次研究将LRFMC模型引入到用户聚
类模型的实验中,使得模型泛化能力上存在了一定的局限,但也为该问题的未来研究提供了新的方式。 相似文献