文章目录

1. 安装前提
2. 下载安装包，依赖包
3. 虚拟机新增磁盘（磁盘空间有余则跳过此步骤）
- 3.1 关机新增磁盘
- 3.2 开机挂载磁盘
4. 配置本地 yum 源
- 4.1 上传安装包解压
- 4.2 配置本地yum源信息
5. 安装Impala
- 5.1 集群规划
- 5.2 主节点安装
- 5.3 从节点安装
6. 修改Hadoop、Hive配置
- 6.1 修改hive配置
- 6.2 修改hadoop配置
- 6.3 重启hadoop、hive
- 6.4 复制hadoop、hive配置文件
7. 修改impala配置
- 7.1 修改impala默认配置
- 7.2 添加mysql驱动
- 7.3 修改bigtop配置
8. 启动、关闭impala服务
- 8.1 impala web ui

1. 安装前提

集群前提安装好hadoop，hive。
　　 hive安装包scp在所有需要安装impala的节点上，因为impala需要引用hive的依赖包。
　　 hadoop框架需要支持C程序访问接口，查看下图，如果有该路径下有这么文件，就证明支持C接口。

在这里插入图片描述

2. 下载安装包，依赖包

由于impala没有提供tar包进行安装，只提供了rpm包。因此在安装impala的时候，需要使用rpm包来进行安装。rpm包只有cloudera公司提供了，所以去cloudera公司网站进行下载rpm包即可。
　　但是另外一个问题，impala的rpm包依赖非常多的其他的rpm包，可以一个个的将依赖找出来，也可以将所有的rpm包下载下来，制作成我们本地yum源来进行安装。这里就选择制作本地的yum源来进行安装。
　　所以首先需要下载到所有的rpm包，下载地址如下
　　下载地址

3. 虚拟机新增磁盘（磁盘空间有余则跳过此步骤）

由于下载的cdh5.14.0-centos6.tar.gz包非常大，大概5个G，解压之后也最少需要5个G的空间。而我们的虚拟机磁盘有限，可能会不够用了，所以可以为虚拟机挂载一块新的磁盘，专门用于存储的cdh5.14.0-centos6.tar.gz包。

注意事项：新增挂载磁盘需要虚拟机保持在关机状态。
在这里插入图片描述

3.1 关机新增磁盘

虚拟机关机的状态下，在VMware当中新增一块磁盘。
在这里插入图片描述

3.2 开机挂载磁盘

开启虚拟机，对新增的磁盘进行分区，格式化，并且挂载新磁盘到指定目录。
在这里插入图片描述

下面对分区进行格式化操作：

[root@node-3 /]# mkfs -t ext4 /dev/sdb1

创建挂载目录：

[root@node-3 /]# mount -t ext4 /dev/sdb1 /cloudera_data/

在这里插入图片描述
添加至开机自动挂载：

[root@node-3 /]# vim /etc/fstab

修改成以下内容：

/dev/sdb1   /cloudera_data    ext4    defaults    0 0

在这里插入图片描述

4. 配置本地 yum 源

4.1 上传安装包解压

使用sftp的方式把安装包大文件上传到服务器/cloudera_data目录下。
在这里插入图片描述

[root@node-3 /]# cd /cloudera_data
[root@node-3 cloudera_data]# tar -zxvf cdh5.14.0-centos6.tar.gz

4.2 配置本地yum源信息

安装 Apache Server服务器

 ## 安装httpd服务
[root@node-3 /]# yum -y install httpd## 启动httpd服务
[root@node-3 /]# service httpd start## 开机自动启动httpd服务
[root@node-3 /]# chkconfig httpd on

配置本地 yum 源的文件

## 进入yum 配置文件
[root@node-3 /]# cd /etc/yum.repos.d/
## 创建文件夹
[root@node-3 yum.repos.d]# mkdir bk 
## 备份资源配置
[root@node-3 yum.repos.d]# mv * bk 
## 复制需要的配置文件
[root@node-3 yum.repos.d]# cp bk/CentOS-Media.repo .
## 修改配置文件名称
[root@node-3 yum.repos.d]# mv CentOS-Media.repo local.repo 
## 编辑配置文件
[root@node-3 yum.repos.d]# vim local.repo

编辑成以下内容：

[c6-media]
name=CentOS-$releasever - Media
baseurl=http://node-3/CDH
## http://node-3/CDH (注: node-3为httpd服务节点  CDH为httpd的读取链接)
gpgcheck=0
enabled=1

创建apache httpd的读取链接

[root@node-3 /]# ln -s /cloudera_data/cdh/5.14.0 /var/www/html/CDH

确保linux的Selinux关闭
临时关闭：

[root@node-3 ~]# getenforce
Enforcing
[root@node-3 ~]# setenforce 0
[root@node-3 ~]# getenforce

永久关闭:

[root@node-3 ~]# vim /etc/sysconfig/selinux
## 将 SELINUX=enforcing 改为 SELINUX=disabled
## 重启服务reboot

在这里插入图片描述
通过浏览器访问本地yum源，如果出现下述页面则成功。
http://192.168.100.101/CDH (填自己的 ip 地址)

将本地yum源配置文件localimp.repo发放到所有需要安装impala的节点。

[root@node-3 ~]# cd /etc/yum.repos.d/
[root@node-3 yum.repos.d]# scp local.repo  node-2:$PWD
[root@node-3 yum.repos.d]# scp local.repo  node-3:$PWD

5. 安装Impala

5.1 集群规划

在这里插入图片描述

5.2 主节点安装

在规划的主节点node-3执行以下命令进行安装：

[root@node-3 /]# yum install -y impala impala-server impala-state-store impala-catalog impala-shell

5.3 从节点安装

在规划的从节点node-1、node-2执行以下命令进行安装：

[root@node-1 /]# yum install -y impala-server
[root@node-2 /]# yum install -y impala-server

6. 修改Hadoop、Hive配置

需要在3台机器整个集群上进行操作，都需要修改。hadoop、hive是否正常服务并且配置好，是决定impala是否启动成功并使用的前提。

6.1 修改hive配置

可在node-1机器上进行配置，然后scp给其他2台机器。

[root@node-1 /]# vim /export/servers/hive/conf/hive-site.xml

添加以下内容:

<configuration> <property> <name>javax.jdo.option.ConnectionURL</name>  <value>jdbc:mysql://node-1:3306/hive?createDatabaseIfNotExist=true</value> </property>  <property> <name>javax.jdo.option.ConnectionDriverName</name>  <value>com.mysql.jdbc.Driver</value> </property>  <property> <name>javax.jdo.option.ConnectionUserName</name>  <value>root</value> </property>  <property> <name>javax.jdo.option.ConnectionPassword</name>  <value>hadoop</value> </property>  <property> <name>hive.cli.print.current.db</name>  <value>true</value> </property>  <property> <name>hive.cli.print.header</name>  <value>true</value> </property>  <!-- 绑定运行hiveServer2的主机host,默认localhost -->  <property> <name>hive.server2.thrift.bind.host</name>  <value>node-1</value> </property>  <!-- 指定hive metastore服务请求的uri地址 -->  <property> <name>hive.metastore.uris</name>  <value>thrift://node-1:9083</value> </property>  <property> <name>hive.metastore.client.socket.timeout</name>  <value>3600</value> </property> 
</configuration>

将hive安装包cp给其他两个机器。

[root@node-1 /]# cd /export/servers/
[root@node-1 servers]# scp -r hive-1.1.0-cdh5.14.0/ node-2:$PWD
[root@node-1 servers]# scp -r hive-1.1.0-cdh5.14.0/ node-3:$PWD

6.2 修改hadoop配置

所有节点创建下述文件夹

[root@node-1 ~]# mkdir -p /var/run/hdfs-sockets
[root@node-2 ~]# mkdir -p /var/run/hdfs-sockets
[root@node-3 ~]# mkdir -p /var/run/hdfs-sockets

修改所有节点的hdfs-site.xml添加以下配置，修改完之后重启hdfs集群生效

[root@node-1 ~]# vim /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/hdfs-site.xml

添加以下内容:

<property><name>dfs.client.read.shortcircuit</name><value>true</value></property><property><name>dfs.domain.socket.path</name><value>/var/run/hdfs-sockets/dn</value></property><property><name>dfs.client.file-block-storage-locations.timeout.millis</name><value>10000</value></property><property><name>dfs.datanode.hdfs-blocks-metadata.enabled</name><value>true</value></property>

dfs.client.read.shortcircuit 打开DFSClient本地读取数据的控制， dfs.domain.socket.path是Datanode和DFSClient之间沟通的Socket的本地路径。

把更新hadoop的配置文件，scp给其他机器。

[root@node-1 ~]# cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/
[root@node-1 hadoop]# scp -r hdfs-site.xml node-2:$PWD
[root@node-1 hadoop]# scp -r hdfs-site.xml node-3:$PWD

注意：root用户不需要下面操作，普通用户需要这一步操作。
给这个文件夹赋予权限，如果用的是普通用户hadoop，那就直接赋予普通用户的权限，例如：

[root@node-1 ~]# chown  -R  hadoop:hadoop   /var/run/hdfs-sockets/

因为这里直接用的root用户，所以不需要赋权限了。

6.3 重启hadoop、hive

在node-1上执行下述命令分别启动hive metastore服务和hadoop。

[root@node-1 ~]# cd  /export/servers/hive-1.1.0-cdh5.14.0
[root@node-1 hive-1.1.0-cdh5.14.0]# nohup bin/hive --service metastore &
[root@node-1 ~hive-1.1.0-cdh5.14.0# nohup bin/hive --service hiveserver2 &

重启集群:

[root@node-1 /]# cd /export/servers/hadoop-2.6.0-cdh5.14.0/
[root@node-1 hadoop-2.6.0-cdh5.14.0]# sbin/stop-dfs.sh  
[root@node-1 hadoop-2.6.0-cdh5.14.0]# sbin/start-dfs.sh

6.4 复制hadoop、hive配置文件

impala的配置目录为/etc/impala/conf，这个路径下面需要把core-site.xml，hdfs-site.xml以及hive-site.xml。
所有节点执行以下命令

[root@node-1 /]# cp -r /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/core-site.xml  /etc/impala/conf/core-site.xml
[root@node-1 /]# cp -r /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/hdfs-site.xml /etc/impala/conf/hdfs-site.xml
[root@node-1 /]# cp -r /export/servers/hive-1.1.0-cdh5.14.0/conf/hive-site.xml /etc/impala/conf/hive-site.xml

7. 修改impala配置

7.1 修改impala默认配置

所有节点更改impala默认配置文件

[root@node-1 /]# vim /etc/default/impala
IMPALA_CATALOG_SERVICE_HOST=node-3
IMPALA_STATE_STORE_HOST=node-3

在这里插入图片描述

7.2 添加mysql驱动

通过配置/etc/default/impala中可以发现已经指定了mysql驱动的位置名字。
使用软链接指向该路径即可（3台机器都需要执行）

[root@node-1 /]# ln -s /export/servers/hive-1.1.0-cdh5.14.0/lib/mysql-connector-java-5.1.38.jar /usr/share/java/mysql-connector-java.jar
[root@node-2 /]# ln -s /export/servers/hive-1.1.0-cdh5.14.0/lib/mysql-connector-java-5.1.38.jar /usr/share/java/mysql-connector-java.jar
[root@node-3 /]# ln -s /export/servers/hive-1.1.0-cdh5.14.0/lib/mysql-connector-java-5.1.38.jar /usr/share/java/mysql-connector-java.jar

7.3 修改bigtop配置

修改bigtop的java_home路径（3台机器）

[root@node-1 /]# vim /etc/default/bigtop-utils

添加以下内容:

export JAVA_HOME=${JAVA_HOME}

在这里插入图片描述

8. 启动、关闭impala服务

主节点node-3启动以下三个服务进程

[root@node-3 /]# service impala-state-store start
[root@node-3 /]# service impala-catalog start
[root@node-3 /]# service impala-server start

从节点启动node-1与node-2启动impala-server

[root@node-1 /]# service  impala-server  start
[root@node-2 /]# service  impala-server  start

查看impala进程是否存在

[root@node-3 /]# ps -ef | grep impala

在这里插入图片描述

启动之后所有关于impala的日志默认都在/var/log/impala

如果需要关闭impala服务把命令中的start该成stop即可。注意如果关闭之后进程依然驻留，可以采取下述方式删除。正常情况下是随着关闭消失的。

解决方式：

在这里插入图片描述

8.1 impala web ui

访问impalad的管理界面http://node-3:25000/
在这里插入图片描述
访问statestored的管理界面http://node-3:25010/

Impala 安装部署

文章目录

1. 安装前提

2. 下载安装包，依赖包

3. 虚拟机新增磁盘 （磁盘空间有余则跳过此步骤）

3.1 关机新增磁盘

3.2 开机挂载磁盘

4. 配置本地 yum 源

4.1 上传安装包解压

4.2 配置本地yum源信息

5. 安装Impala

5.1 集群规划

5.2 主节点安装

5.3 从节点安装

6. 修改Hadoop、Hive配置

6.1 修改hive配置

6.2 修改hadoop配置

6.3 重启hadoop、hive

6.4 复制hadoop、hive配置文件

7. 修改impala配置

7.1 修改impala默认配置

7.2 添加mysql驱动

7.3 修改bigtop配置

8. 启动、关闭impala服务

8.1 impala web ui

相关文章

3. 虚拟机新增磁盘（磁盘空间有余则跳过此步骤）