第九章 spark独立模式部署Standalone

武飞扬头像

开朗小哥

2024-05-03 帮助1人

系列文章：
第一章 Hadoop集群搭建的准备
 第二章 Hadoop集群搭建
 第三章 Zookeeper分布式集群部署（2n 1台虚拟机）
第四章 Hadoop高可用集群搭建（HA）
第五章 Hive的安装与配置
待更新
第九章 spark独立模式部署（Standalone）
第十章 spark配置历史服务
 第十一章搭建Spark高可用（HA）
第十二章 spark配置Yarn模式（混合部署模式）
待更新

一、下载安装包

清华镜像下载连接：https://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-3.1.2/

二、上传安装包，并解压至/export/servers目录下

进入/export/sofware/目录，用rz命令上传spark压缩包至虚拟机的/export/sofware/目录下。
解压至/export/servers目录下：

tar -zxvf spark-3.1.2 -C /export/servers

三、修改配置文件（先进入spark-3.1.2的conf目录）

1、修改slaves文件，执行以下操作。

mv slaves_template slaves
vim slaves

添加以下内容：

#work节点
node1
node2
node3

2、修改spark-env.sh文件，执行以下操作。

cp spark-env.sh.template spark-env.sh
vim spark-env.sh

添加以下内容：

#添加JAVA_HOME环境变量和集群对应的master节点
export JAVA_HOME=/export/servers/jdk1.8.0
SPARK_MASTER_HOST=node1
SPARK_MASTER_PORT=7077

注意：7077端口相当于Hadoop的内部通信的9000端口，此处的端口需要确认自己的Hadoop配置

3、将配置好后的spark-3.1.2安装包分发到其他虚拟机。

scp -r /export/servers/spark-3.1.2 node2:/export/servers
scp -r /export/servers/spark-3.1.2 node3:/export/servers

4、启动集群(spark）。

进入/export/servers/spark-3.1.2目录，执行以下命令：

#spark
sbin/start-all.sh

查看Master资源监控Web UI界面，浏览器地址栏输入：http://node1:8080或http://192.168.1.134:8080
（Master的IP地址和端口号）

5、提交应用测试集群。

bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://node1:7077 \
./examples/jars/spark-examples_2.12-3.1.2.jar \
10

–class 表示要执行程序的主类。
–master spark://node1:7077 表示独立部署模式，spark运行的环境。
./examples/jars/spark-examples_2.12-3.1.2.jar 是运行类的jar包。
数字10 表示命令行参数（程序的入口参数），这里用于设定当前的任务数量。

这篇好文章是转载于：学新通技术网

版权申明：本站部分内容来自互联网，仅供学习及演示用，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，请提供相关证据及您的身份证明，我们将在收到邮件后48小时内删除。
本站站名：学新通技术网
本文地址： /boutique/detail/tanhgikega

系列文章

同类精品

继续加载