作者: 岳宗胜[1] 李敬改[1] 周磊[2] 张辉国[1]
作者机构: [1]大学数学与系统科学学院,乌鲁木齐830046 [2]大学信息科学与工程学院,乌鲁木齐830046出版物刊名: 科技创新与应用页码: 21-22页年卷期: 2015年 第4期
主题词: RHadoop 数据统计 平台
摘要:Hadoop是当前非常流行的大数据分布式处理基础架构,通过HDFS和Mapredue实现了对海量数据的高速运算和存储。R软件是具有完善数据统计分析功能且被广泛使用的开源系统。文章叙述了基于R和Hadoop构建大数据统计分析平台的过程,藉此实现对大数据的统计分析。