hadoop集群部署  http://alleyz.iteye.com/blog/2313310

 

1. 准备三台机器,如10.8.177.23,10.8.177.24,10.8.177.25

2. 修改主机名称,配置hosts文件(root用户下操作):

 

3. 每台机器上创建一个用户,如hadoop:

4. 设置免密登录(==hadoop用户,下同==)

> 只需要设置master对于其他两台机器进行免密登录即可

5. 下载jdk、hadoop、hbase、zookeeper

6. 解压以上文件

7. 配置环境变量

8. 配置hadoop

hadoop的配置文件位于hadoop-2.7.2/etc/hadoop下,需要配置core-site.xml,hdfs-site.xml,yran-site.xml,mapred-site.xml,hadoop-env.sh,slaves

core-site.xml

hdfs-site.xml

yarn-site.xml

mapred-site.xml,这个文件如果不存在的话cp mapred-site.xml.template mapred-site.xml一个

hadoop-env.sh 将JAVA_HOME配置进去

 slaves 文件中加入25,24

 9. 打包发送至其他机器

jdk、hadoop、hbase、zookeeper都可以采用这种方式配置后,进行发送,zookeeper稍有不同(详见后文)

10. 格式化名称节点

11. 启停hadoop集群

12. jsp查看

13. 浏览器查看

 

zookeeper集群部署

1. 配置,配置文件位于/home/hadoop/zookeeper-3.4.8/conf

 

2. 数据目录

 

> zoo.cfg定义了dataDir,需要在每个服务器的创建此目录,并建立myid文件,内部存储zoo.cfg中server.{id}的id数值

 

3. 启停

 

 

 

 

HBase部署

1、 配置hbase-site.xml

 

2、配置regionservers

 

 

3、 scp发送至其他机器

 

> 具体方式参见第一章第9节

4、 启停hbase

==启动hbase之前须先启动hdfs==

5、 jps查看

6、 浏览器查看

 

http://hd-23:16030/

结语

总结

通过以上步骤快速搭建了hadoop环境,在此期间,只有进行SSH免密登录时需要登录其他两台机器进行添加公钥文件,其余均通过一个SSH客户端窗口搞定(其实免密登录也可以)。linux发行版本为centos7,如果使用centos 6.x的版本,修改主机名称略有不同(etc/sysconfig/network,hosts,reboot)。

 

> – 猜想

 

> 搭建此环境的目的有两点:

 

>  1、 提供一个hadoop测试环境。

 

>  2、 为后续采用docker进行快速部署做预研。通过以上搭建过程可知,除了zookeeper的dataDir目录中myid文件内容不同之外,其余的内容均相同,而myid的内容可以通过读取zoo.cfg文件获取,故如果此时要做多机docker集群的话,只要解决了多机docker容器能互相访问(同个局域网),就可以采用同一个镜像进行快速部署。而使多机docker的容器能够访问,可以采用open vSwitch搭建一个局域网,这个也是下个实验的目标。