Spark在HA情况下,以Tachyon为内存文件系统,如何运行在Yarn上?
测试环境
1 | 测试环境: |
Scala安装
Scala环境变量
1 | /** |
测试Scala
1 | scala -version |
Java环境安装
请参考:Ubuntu下安装JDK环境
ZooKeeper集群安装
请参考:Zookeeper集群环境搭建
Tachyon集群安装
请参考:Tachyon集群部署
Hadoop2.X集群安装
请参考:Hadoop集群环境搭建
Tachyon集群High Available
Spark集群安装
Spark下载
下载地址:Spark官方下载地址
下载前请先查看,Tachyon和Spark相关版本支持
spark环境变量
1 | vim /etc/profile |
目录权限
1 | sudo chmod -R 775 spark-1.5.2-bin-hadoop2.6/ |
spark-env.sh配置文件
1 | cp ./conf/spark-env.sh.template ./conf/spark-env.sh |
配置slaves
1 | cp ./conf/slaves.template ./conf/slaves |
新建core-site.xml
1 | vim ./conf/core-site.xml |
分发Spark目录
分发Spark目录到所有主机
启动Zookeeper集群
1 | /** |
启动Hadoop集群
1 | /** |
启动Tachyon集群
1 | /** |
启动Spark集群
1 | ./sbin/start-all.sh |
查看各自集群情况
1 | root@spark-master: jps |
1 | /** |
Spark With Tachyon测试
1 | //上传文件至Tachyon |
Spark On Yarn测试
cluster模式
1 | /** |
client模式
1 | ./bin/spark-shell --master yarn --deploy-mode client |
转载请注明出处