高维数据下基于云平台的随机森林算法的研究与实现 |
| |
引用本文: | 许旻.高维数据下基于云平台的随机森林算法的研究与实现[J].科技通报,2014(6). |
| |
作者姓名: | 许旻 |
| |
作者单位: | 苏州市职业大学; |
| |
基金项目: | 江苏省现代教育技术研究2012年度课题(2012-R-21903) |
| |
摘 要: | 随机森林算法在数据挖掘领域中得到了广泛的应用,该算法通过构建多个不同的决策树可以获得更高的分类结果。但是,随着数据规模的增大,人们开始接触到各大规模的数据以及更高维度的数据属性。传统的随机森林构建算法不能有效、快速地处理海量高维数据,严重影响了数据的分类效率,从而影响预测效率。本文针对高维、海量数据下随机森林构建算法,改进并提高了该算法的效率,提出了基于云计算平台的随机森林构建算法。该算法可以快速的完成数据分类预测,并通过实验结果进一步展示了该算法的效率以及可扩展性。
|
关 键 词: | 高维数据 海量数据 云平台 随机森林 决策树 |
本文献已被 CNKI 等数据库收录! |
|