Cloudera Manager 5和CDH5离线安装

CDH (Cloudera’s Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建,并集成了很多补丁,可直接用于生产环境。 Cloudera Manager则是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监控管理的组件,对集群中主机、Hadoop、Hive、Spark等服务的安装配置管理做了极大简化。 相关包的下载地址: Cloudera Manager地址: CDH安装包地址: 由于我们的操作系统为CentOS6.5,需要下载以下文件: CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha1 manifest.json JDBC:

准备工作:系统环境搭建(阿里云平台)

以下操作均需要(root)管理员权限 1.网络配置(所有节点) 修改主机名:vim /etc/sysconfig/network

PEERNTP=no

通过service network restart重启网络服务 修改ip与主机名的对应关系:vim /etc/hosts

192.168.1.101 cdh1192.168.1.102 cdh2192.168.1.103 cdh3

2.打通SSH,设置ssh无密码登陆(所有节点) 执行ssh-keygen -t rsa,一路回车,生成无密码的密钥对。 将公钥添加到认证文件中:cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys,并设置authorized_keys的访问权限:chmod 600 ~/.ssh/authorized_keys。 通过scp命令将各节点的认证文件拷贝到所有其他节点使得各节点能够相互访问。 3.安装Oracle的Java(所有节点) CentOS自带OpenJdk,不过运行CDH5需要使用Oracle的JDK,需要Java 7的支持。 卸载自带的OpenJdk,使用rpm -qa | grep java查询java相关的包,使用rpm -e –nodeps 包名卸载之。 去Oracle的官网下载jdk的rpm安装包,并使用rpm -ivh 包名安装,最后配置环境变量。 4.安装配置MySql(主节点) 通过yum install mysql-server安装mysql服务器。chkconfig mysqld on设置开机启动,并service mysqld start启动mysql服务,并根据提示设置root的初试密码:mysqladmin -u root password ‘xxxx’。 mysql -uroot -pxxxx进入mysql命令行,创建以下数据库:

#hivecreate database hive DEFAULT CHARSET utf8 COLLATE utf8_general_ci;#activity monitorcreate database amon DEFAULT CHARSET utf8 COLLATE utf8_general_ci;

设置root授权访问以上所有的数据库:

#授权root用户在主节点拥有所有数据库的访问权限*.* ;flush privileges;

5.关闭防火墙和SELinux 注意: 需要在所有的节点上执行,因为涉及到的端口太多了,临时关闭防火墙是为了安装起来更方便,安装完毕后可以根据需要设置防火墙策略,保证集群安全。 关闭防火墙:

service iptables stop (临时关闭) chkconfig iptables off (重启后生效)

关闭SELINUX(实际安装过程中发现没有关闭也是可以的,不知道会不会有问题,还需进一步进行验证):

setenforce 0 (临时生效) 修改 /etc/selinux/config 下的 SELINUX=disabled (重启后永久生效)

6.所有节点配置NTP服务 集群中所有主机必须保持时间同步,如果时间相差较大会引起各种问题。 具体思路如下: master节点作为ntp服务器与外界对时中心同步时间,随后对所有datanode节点提供时间同步服务。 所有datanode节点以master节点为基础同步时间。 所有节点安装相关组件:yum install ntp。完成后,配置开机启动:chkconfig ntpd on,检查是否设置成功:chkconfig –list ntpd其中2-5为on状态就代表成功。 主节点配置 在配置之前,先使用ntpdate手动同步一下时间,免得本机与对时中心时间差距太大,使得ntpd不能正常同步。这里选用65.55.56.206作为对时中心,ntpdate -u 65.55.56.206。 ntp服务只有一个配置文件,配置好了就OK。 这里只给出有用的配置,不需要的配置都用#注掉,这里就不在给出:

driftfile /var/lib/ntp/drift-nomodify notrap server preferincludefile /etc/ntp/crypto/pwkeys /etc/ntp/keys

配置文件完成,保存退出,启动服务,执行如下命令:service ntpd start 检查是否成功,用ntpstat命令查看同步状态,出现以下状态代表启动成功:

synchronised mspolling server every 128 s

如果出现异常请等待几分钟,一般等待5-10分钟才能同步。 配置ntp客户端(所有datanode节点)

driftfile /var/lib/ntp/drift-kod nomodify notrap nopeer noqueryrestrict -6 default kod nomodify notrap nopeer noquery#这里是主节点的主机名或者ipserver cdh1includefile /etc/ntp/crypto/pwkeys /etc/ntp/keys

ok保存退出,请求服务器前,请先使用ntpdate手动同步一下时间:ntpdate -u cdh1 (主节点ntp服务器) 这里可能出现同步失败的情况,请不要着急,一般是本地的ntp服务器还没有正常启动,一般需要等待5-10分钟才可以正常同步。启动服务:service ntpd start 因为是连接内网,,这次启动等待的时间会比master节点快一些,但是也需要耐心等待一会儿。

正式开工

安装Cloudera Manager Server 和Agent 主节点解压安装 cloudera manager的目录默认位置在/opt下,解压:tar xzvf cloudera-manager*.tar.gz将解压后的cm-5.3.3和cloudera目录放到/opt目录下。 为Cloudera Manager 5建立数据库 首先需要去MySql的官网下载JDBC驱动,,解压后,找到mysql-connector-java-5.1.35-bin.jar,放到/opt/cm-5.3.3/share/cmf/lib/中。 在主节点初始化CM5的数据库:

/opt/cm/share/cmf/schema/scm_prepare_databasescm-host localhost scm scm scm

Agent配置 修改/opt/cm-5.3.3/etc/cloudera-scm-agent/config.ini中的server_host为主节点的主机名。 同步Agent到其他节点

scp -r /opt/cm-5.3.3 root@n2:/opt/

在所有节点创建cloudera-scm用户

useradd /run/clouderanoshell=/bin/false –comment “Cloudera SCM User” cloudera-scm思想如钻子,必须集中在一点钻下去才有力量

Cloudera Manager 5和CDH5离线安装

相关文章:

你感兴趣的文章:

标签云: