一、搭建本地仓库
1.1 安装Web服务器
1.安装Apache1
yum install httpd
2.添加支持文件的类型1
sed -i '/AddType application\/x-compress .Z/a\ AddType application/x-gzip .gz .tgz .parcel' /etc/httpd/conf/httpd.conf
3.启动服务1
2systemctl start httpd
systemctl enable httpd
4.创建本地MySQL仓库的文件夹1
mkdir -p /var/www/html/mysql
5.下载MySQL的驱动文件1
wget http://central.maven.org/maven2/mysql/mysql-connector-java/5.1.46/mysql-connector-java-5.1.46.jar -P /var/www/html/mysql
6.创建本地Cloudera仓库的文件夹1
mkdir -p /var/www/html
7.下载Cloudera的文件(这一步的时间比较久,一般都是几个到十几个小时)1
2
3
4
5
6wget --recursive --no-parent --no-host-directories https://archive.cloudera.com/cm6/6.3.0/redhat7/ -P /var/www/html
wget https://archive.cloudera.com/cm6/6.3.0/allkeys.asc -P /var/www/html/cm6/6.3.0/
wget --recursive --no-parent --no-host-directories https://archive.cloudera.com/cdh6/6.3.0/redhat7/ -P /var/www/html
wget --recursive --no-parent --no-host-directories https://archive.cloudera.com/cdh6/6.3.0/parcels/ -P /var/www/html
wget --recursive --no-parent --no-host-directories https://archive.cloudera.com/gplextras6/6.3.0/parcels/ -P /var/www/html
8.对本地仓库目录进行授权1
2
3chmod -R ugo+rX /var/www/html/cm6
chmod -R ugo+rX /var/www/html/cdh6
chmod -R ugo+rX /var/www/html/gplextras6
1.2使用方式:
添加Cloudera Manager的本地仓库1
2
3
4
5
6
7echo "
[cloudera-cm]
name=Cloudera Manager 6.3.0
baseurl=https://repo.car-house.net/cm6/6.3.0/redhat7/yum/
gpgcheck=1
enabled=1
" > /etc/yum.repos.d/cloudera-cm.repo
添加Cloudera CDH的本地仓库1
2
3
4
5
6
7echo "
[cloudera-cdh]
name=Cloudera CDH, Version 6.3.0
baseurl=https://repo.car-house.net/cdh6/6.3.0/redhat7/yum
gpgcheck=1
enabled=1
" > /etc/yum.repos.d/cloudera-cdh.repo
清除和更新缓存1
2yum clean all
yum makecache
二、安装CM+CDH
为了更方便安装,我把部分的命令都写到脚本里面了,下载完之前记得先看脚本里面的提示,点这里下载:
apache-repo-setup.sh
nginx-repo-setup.sh
mysql-setup.sh
db_init.sql
cloudera-setup.sh
manager-install.sh
2.1 安装本地仓库
选择一种Web服务器来进行安装,这里提供了Nginx和Apache两种的安装方式,请按需选择,一般情况建议是Apache比较简单点;脚本上默认是使用repo.car-house.net作为本地仓库的域名,请改成自己实际的域名
安装Apache
1 | chmod u+x apache-repo-setup.sh |
安装Nginx
1 | chmod u+x nginx-repo-setup.sh |
2.2 安装数据库
把mysql-setup.sh和db_init.sql上传到所有需要安装的机器上,记得提前修改好db_init.sql上的密码1
2chmod u+x mysql-setup.sh
./mysql-setup.sh
2.3 服务器的基础配置
把cloudera-setup.sh上传到所有需要安装的机器上1
2chmod u+x cloudera-setup.sh
./cloudera-setup.sh
2.4 安装Cloudera管理系统
把manager-install.sh上传到所有需要安装的机器上1
2chmod u+x manager-install.sh
./manager-install.sh
进入欢迎页面
系统协议
选择要安装的版本
进入集群安装的欢迎页面
配置要安装的主机
选择存储库
在”Cloudera Manager Agent”下面选择自定义,并输入下面的地址1
https://repo.car-house.net/cm6/6.3.0
配置Parcel的地址
在”CDH and other software”下面选择”使用Parcel(建议)”,然后点击”更多选项”来配置我们已经下载好的地址1
https://repo.car-house.net/cdh6/6.3.0/parcels/
JDK安装选项
因为我们已经安装过了,所以这里不需要选中
配置SSH登录
这里我们选中使用dev-master这个主机的私钥来进行SSH登录,也可以使用密码的方式,但是使用密码方式的前提是所有主机的账号密码都是一样的
安装客户端
安装客户端完成
在各主机上安装Parcel
开始检查主机的配置
检查出来主机的配置问题
选择要安装的服务
这里选择的是最基础的服务
定义服务器的角色
一般需要安装的都会默认配置好,如果不需要特殊处理的话就不需要调整了
数据库设置
这里请按照db_init.sql文件上面已经创建好的进行填写,要注意的是默认的数据库主机的地址可能是不对的,先确认下对不对
安装完成
进入首页
三、可能出现的问题
3.1 检查出来有问题
如果出现下面的问题的话可以先忽略,后面安装后了再进行逐一修复即可1
2
3
4
5
6
7Cloudera 建议将 /proc/sys/vm/swappiness 设置为最大值 10。当前设置为 30。使用 sysctl 命令在运行时更改该设置并编辑 /etc/sysctl.conf,以在重启后保存该设置。您可以继续进行安装,但 Cloudera Manager 可能会报告您的主机由于交换而运行状况不良。以下主机将受到影响:
查看详细信息
已启用透明大页面压缩,可能会导致重大性能问题。请运行“echo never > /sys/kernel/mm/transparent_hugepage/defrag”和“echo never > /sys/kernel/mm/transparent_hugepage/enabled”以禁用此设置,然后将同一命令添加到 /etc/rc.local 等初始化脚本中,以便在系统重启时予以设置。以下主机将受到影响:
查看详细信息
已满足 CDH 5 Hue Python 版本依赖关系。
Starting with CDH 6, PostgreSQL-backed Hue requires the Psycopg2 version to be at least 2.5.4, see the documentation for more information. This warning can be ignored if hosts will not run CDH 6, or will not run Hue with PostgreSQL, or is not RHEL 6 compatible. The following hosts have an incompatible Psycopg2 version of '2.5.1':
查看详细信息
修复的方式请查考cloudera-setup.sh
3.2 在添加Kafka服务的时候,有两项是需要填写的,输入Kafka Broker所在的主机即可,如下面
1 | dev-node3:9092,dev-node4:9092,dev-node5:9092 |
3.3 安装Zookeeper出错
在安装Zookeeper的时候出现下面的错误信息1
Error found before invoking supervisord: 'getpwnam(): name not found: zookeeper'
解决方式:
- 检查是否有zookeeper的账号,没有的话就添加
1
useradd -d /var/lib/zookeeper -s /sbin/nologin zookeeper
- 可能cloudera-manager-agent的安装有问题,卸载了重新安装后再试试
3.4 提示发布收集有问题
1 | Telemetry Publisher (dev-master): Altus Data Collection Account must be configured to enable collection for any Altus service. |
解决办法:
重新部署和重启YARN的客户端
本站版权使用署名-非商业性使用-禁止演绎 4.0 国际,转载请保留原文链接及作者。