阅读135 返回首页    go 阿里云 go 技术社区[云栖]


hadoop整体结构图及服务组件详解

hadoop服务组件简单解释
1、core  分布式系统和通用IO组件和接口(序列化、java远程调用等等服务)
2、avro  支持跨语言过程调用,持久数据存储的数据序列化系统
3、MapReduce  构建在廉价的pc机器上分布式数据处理模型和运行环境
4、hdfs  构建廉价的pc机器上分布式文件系统
5、pig  处理海量数据集的数据流语言和运行环境 ,pig运行在HDFS和MapReduce之上
6、HBase  分布式面向列的数据库 ,HBase使用HDFS作为底层存储, 同时使用MapReduce支持批处理模式的计算机和随机查询
7、 Zookeeper  提供分布式、高效的协作服务以及分布式锁这样的原子操作、可以用来构建分布式应用
8、hive  分布式数据仓库 、 Hive使用Hdfs存储数据,提供类似sql的语句(转换为MapReduce任务) 查询数据
9、chukwa  分布式数据采集和分析系统  、 使用HDFS 存储数据 、 使用MapReduce输出分析报告

最后更新:2017-04-03 12:55:47

  上一篇:go 一种在BIOS中嵌入应用程序的方法及实现
  下一篇:go 归并排序及代码实现