• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

第九章 spark独立模式部署Standalone

武飞扬头像
开朗小哥
帮助1

系列文章:
第一章 Hadoop集群搭建的准备
第二章 Hadoop集群搭建
第三章 Zookeeper分布式集群部署(2n 1台虚拟机)
第四章 Hadoop高可用集群搭建(HA)
第五章 Hive的安装与配置
待更新
第九章 spark独立模式部署(Standalone)
第十章 spark配置历史服务
第十一章 搭建Spark高可用(HA)
第十二章 spark配置Yarn模式(混合部署模式)
待更新



一、下载安装包

   清华镜像下载连接:https://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-3.1.2/

二、上传安装包,并解压至/export/servers目录下

   进入/export/sofware/目录,用rz命令上传spark压缩包至虚拟机的/export/sofware/目录下。
   解压至/export/servers目录下:

tar -zxvf spark-3.1.2 -C /export/servers

三、修改配置文件(先进入spark-3.1.2的conf目录)

1、修改slaves文件,执行以下操作。

mv slaves_template slaves
vim slaves

   添加以下内容:

#work节点
node1
node2
node3

2、修改spark-env.sh文件,执行以下操作。

cp spark-env.sh.template spark-env.sh
vim spark-env.sh

   添加以下内容:

#添加JAVA_HOME环境变量和集群对应的master节点
export JAVA_HOME=/export/servers/jdk1.8.0
SPARK_MASTER_HOST=node1
SPARK_MASTER_PORT=7077

注意:7077端口相当于Hadoop的内部通信的9000端口,此处的端口需要确认自己的Hadoop配置

3、将配置好后的spark-3.1.2安装包分发到其他虚拟机。

scp -r /export/servers/spark-3.1.2 node2:/export/servers
scp -r /export/servers/spark-3.1.2 node3:/export/servers

4、启动集群(spark)。

   进入/export/servers/spark-3.1.2目录,执行以下命令:

#spark
sbin/start-all.sh

   查看Master资源监控Web UI界面,浏览器地址栏输入:http://node1:8080或http://192.168.1.134:8080
(Master的IP地址和端口号)

5、提交应用测试集群。

bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://node1:7077 \
./examples/jars/spark-examples_2.12-3.1.2.jar \
10
  • –class 表示要执行程序的主类。
  • –master spark://node1:7077 表示独立部署模式,spark运行的环境。
  • ./examples/jars/spark-examples_2.12-3.1.2.jar 是运行类的jar包。
  • 数字10 表示命令行参数(程序的入口参数),这里用于设定当前的任务数量。

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhgikega
系列文章
更多 icon
同类精品
更多 icon
继续加载