hadoop集群部署 http://alleyz.iteye.com/blog/2313310
1. 准备三台机器,如10.8.177.23
,10.8.177.24
,10.8.177.25
2. 修改主机名称,配置hosts
文件(root用户下操作):
3. 每台机器上创建一个用户,如hadoop:
4. 设置免密登录(==hadoop用户,下同==)
> 只需要设置master对于其他两台机器进行免密登录即可
5. 下载jdk、hadoop、hbase、zookeeper
6. 解压以上文件
7. 配置环境变量
8. 配置hadoop
hadoop的配置文件位于hadoop-2.7.2/etc/hadoop
下,需要配置core-site.xml
,hdfs-site.xml
,yran-site.xml
,mapred-site.xml
,hadoop-env.sh
,slaves
core-site.xml
hdfs-site.xml
yarn-site.xml
mapred-site.xml,这个文件如果不存在的话cp mapred-site.xml.template mapred-site.xml
一个
hadoop-env.sh 将JAVA_HOME配置进去
slaves 文件中加入25,24
9. 打包发送至其他机器
jdk、hadoop、hbase、zookeeper都可以采用这种方式配置后,进行发送,zookeeper稍有不同(详见后文)
10. 格式化名称节点
11. 启停hadoop集群
12. jsp查看
13. 浏览器查看
zookeeper集群部署
1. 配置,配置文件位于/home/hadoop/zookeeper-3.4.8/conf
2. 数据目录
> zoo.cfg定义了dataDir,需要在每个服务器的创建此目录,并建立myid文件,内部存储zoo.cfg中server.{id}的id数值
3. 启停
HBase部署
1、 配置hbase-site.xml
2、配置regionservers
3、 scp发送至其他机器
> 具体方式参见第一章第9节
4、 启停hbase
==启动hbase之前须先启动hdfs==
5、 jps查看
6、 浏览器查看
http://hd-23:16030/
结语
总结
通过以上步骤快速搭建了hadoop环境,在此期间,只有进行SSH免密登录时需要登录其他两台机器进行添加公钥文件,其余均通过一个SSH客户端窗口搞定(其实免密登录也可以)。linux发行版本为centos7,如果使用centos 6.x的版本,修改主机名称略有不同(etc/sysconfig/network
,hosts
,reboot
)。
> – 猜想
> 搭建此环境的目的有两点:
> 1、 提供一个hadoop测试环境。
> 2、 为后续采用docker进行快速部署做预研。通过以上搭建过程可知,除了zookeeper的dataDir目录中myid文件内容不同之外,其余的内容均相同,而myid的内容可以通过读取zoo.cfg文件获取,故如果此时要做多机docker集群的话,只要解决了多机docker容器能互相访问(同个局域网),就可以采用同一个镜像进行快速部署。而使多机docker的容器能够访问,可以采用open vSwitch搭建一个局域网,这个也是下个实验的目标。