hadoop安装配置-白红宇

hadoop安装配置

阅读量：7061 次

发布时间：2019-06-28

本文共 5413 字，大约阅读时间需要 18 分钟。

centos7 安装hadoop 2.7 - 准备工作

三台机器（内存大于2G）分别写hosts、设定hostname

10.10.13.246 master

10.10.13.249 slave1

10.10.13.254 slave2

关闭selinux

关闭firewalld

systemctl disable firewalld

systemctl stop firewalld

yum install -y iptables-services

systemctl enable iptables

systemctl start iptables

service iptables save

centos7 安装hadoop 2.7 - 密钥登陆

master可以通过密钥登陆本机和两台slave

master上生成密钥对：

ssh-keygen 一直回车

复制~/.ssh/id_rsa.pub 内容到本机和两台slave的 ~/.ssh/authorized_keys

设置本机和两台slave机器上的~/.ssh/authorized_keys文件权限为600

chmod 600 ~/.ssh/authorized_keys

在master上

ssh master

ssh slave1

ssh slave2

可以直接登陆

centos7安装hadoop 2.7 - 安装jdk(所有机器都做)

hadoop2.7 需要安装jdk1.7版本

下载地址http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html

解压压缩包 tar zxf jdk1.7.0_79.tar.gz

mv jdk1.7.0_79 /usr/local/

编写环境变量配置 vim /etc/profile.d/java.sh 写入

export JAVA_HOME=/usr/local/jdk1.7.0_79

export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export PATH=$PATH:$JAVA_HOME/bin

source /etc/profile.d/java.sh

java -version 查看是否生效

slave1 和 slave2 重复上面的操作

centos7 安装hadoop 2.7 - 安装hadoop

以下操作在master上执行

下载地址 wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.7.1/hadoop-2.7.1.tar.gz

解压 tar zxf hadoop-2.7.1.tar.gz

mv hadoop-2.7.1 /usr/local/hadoop

cd /usr/local/hadoop

mkdir tmp dfs dfs/data dfs/name

把/usr/local/hadoop 目录分别拷贝至两个slave上

rsync -av /usr/local/hadoop slave1:/usr/local/

rsync -av /usr/local/hadoop slave2:/usr/local/

#注意如果此处空多于一格会报错

centos7 安装hadoop 2.7 - 配置hadoop

master上 vim /usr/local/hadoop/etc/hadoop/core-site.xml

<name>fs.defaultFS</name>

</property>

<name>hadoop.tmp.dir</name>

<value>file:/usr/local/hadoop/tmp</value>

</property>

<name>io.file.buffer.size</name>

</property>

</configuration>

master上 vim /usr/local/hadoop/etc/hadoop/hdfs-site.xml

<name>dfs.namenode.name.dir</name>

<value>file:/usr/local/hadoop/dfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:/usr/local/hadoop/dfs/data</value>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.namenode.secondary.http-address</name>

</property>

<name>dfs.webhdfs.enabled</name>

</property>

</configuration>

master上

cd /usr/local/hadoop/etc/hadoop/

mv mapred-queues.xml.template mapred-site.xml #重命令模板文件

vim /usr/local/hadoop/etc/hadoop/mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobhistory.address</name>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

</property>

</configuration>

master上 vim /usr/local/hadoop/etc/hadoop/yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<name>yarn.resourcemanager.address</name>

</property>

<name>yarn.resourcemanager.scheduler.address</name>

</property>

<name>yarn.resourcemanager.resource-tracker.address</name>

</property>

<name>yarn.resourcemanager.admin.address</name>

</property>

<name>yarn.resourcemanager.webapp.address</name>

</property>

<name>yarn.nodemanager.resource.memory-mb</name>

</property>

</configuration>

以下在master上操作

cd /usr/local/hadoop/etc/hadoop

vim hadoop-env.sh //更改JAVA_HOME

export JAVA_HOME=/usr/local/jdk1.7.0_79

vim yarn-env.sh //更改JAVA_HOME

export JAVA_HOME=/usr/local/jdk1.7.0_79

vim slaves //改为如下

10.10.13.249

10.10.13.254

将master上的etc目录同步至两个slave

rsync -av /usr/local/hadoop/etc/ slave1:/usr/local/hadoop/etc/

rsync -av /usr/local/hadoop/etc/ slave2:/usr/local/hadoop/etc/

在master上操作即可，两个slave会自动启动

初始化

/usr/local/hadoop/bin/hdfs namenode -format

使用 echo $?看返回值是不是0

启动服务

/usr/local/hadoop/sbin/start-all.sh

使用ps 和netstat 在两个slave上检测是否成功

停止服务

/usr/local/hadoop/sbin/stop-all.sh

访问

浏览器打开http://10.10.13.246:8088/

浏览器打开http://10.10.13.246:50070/

以下操作在master上实现

cd /usr/local/hadoop

建立测试目录 bin/hdfs dfs -mkdir /123

如果提示 copyFromLocal: Cannot create directory /123/. Name node is in safe mode.

这是因为开启了安全模式，解决办法

bin/hdfs dfsadmin -safemode leave

将当前目录下的LICENSE.txt复制到hadopp中

bin/hdfs dfs -copyFromLocal ./LICENSE.txt /123

查看/123/下有哪些文件 bin/hdfs dfs -ls /123

用wordcount分析LICENSE.txt bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /123/LICENSE.txt /output/123

#如果此时界面停留在分析界面不动，需要更改三台服务器的配置文件的内存大小，如果出现其他错误看出错提示比如进入安全模式

vim /usr/local/hadoop/etc/hadoop/yarn-site.xml

修改

<name>yarn.nodemanager.resource.memory-mb</name>

</property>

为

<name>yarn.nodemanager.resource.memory-mb</name>

</property>

停止服务

/usr/local/hadoop/sbin/stop-all.sh

启动服务

/usr/local/hadoop/sbin/start-all.sh

再重新分析

bin/hdfs dfs -ls /output/123 查看分析后的文件

bin/hdfs dfs -cat /output/123/part-r-00000 查看分析结果

转载于:https://blog.51cto.com/riverxyz/1831329

你可能感兴趣的文章

H5打造属于自己的视频播放器（HTML篇）

centos7使用kubeadm配置高可用k8s集群的另一种方式

查看>>

深入探索 Kdump

查看>>

three.js 坐标系、camera位置属性、点、线、面

查看>>

kubernetes1.9安装dashboard，以及token认证问题

查看>>

linux tcpdump

查看>>

ASP.NET (Web) + C#算法 | 生成随机数字序列（随机数字+每个数字取随机不重复的位置和颜色）...

查看>>

理解神经网络：从神经元到RNN、CNN、深度学习

查看>>

我国第一部太赫兹视频合成孔径雷达成功研制

查看>>

外卖新零售品牌佐大狮完成数千万元天使轮融资，高榕资本领投

查看>>

GrooveX研发情感治愈机器人lovot，可与人类完成亲密互动

查看>>

使用kubeadm安装k8s-1.11版本

查看>>

美联邦调查局 FBI 网站被黑，数千特工信息泄露

查看>>

超燃！Apache Flink 全球顶级盛会强势来袭

查看>>

约你一起来写作

查看>>

修改arcgis infowindow 放大和缩小的模板

查看>>