(三十一)大数据实战——一键式DolphinScheduler高可用工作流任务调度系统部署安装

2023-09-16 19:20:42

前言

DolphinScheduler(Dolphin Scheduler)是一个分布式、易扩展的开源 DAG(有向无环图)工作流任务调度系统,可用于构建大规模数据处理、数据仓库、ETL 等复杂的数据处理和数据分析场景。DolphinScheduler 支持多种任务类型,包括 Shell、SQL、Spark、Python、Sub-Process、HTTP、Flink 等,同时也支持用户自定义任务类型。本节内容我们完成DolphinScheduler工作流系统的搭建。

正文

①集群服务规划

- 关于jdk、zookeeper、hadoop、mysql等安装部署内容这里不再介绍,请查看作者往期博客内容。

DS集群服务规划
hadoop101hadoop102hadoop103
jdkjdkjdk
zookeeperzookeeperzookeeper
hadoophadoophadoop
DolphinScheduler-masterDolphinScheduler-masterDolphinScheduler-master
DolphinScheduler-workerDolphinScheduler-workerDolphinScheduler-worker

②分别在hadoop101、hadoop102、hadoop103安装psmisc

 sudo yum install -y psmisc

③上传DolphinScheduler安装包到hadoop101服务器/opt/software目录

④将此安装包解压到当前目录

tar -zxvf apache-dolphinscheduler-2.0.5-bin.tar.gz

⑤创建dolphinscheduler的元数据库及用户,这里使用mysql数据库

- 创建数据库

CREATE DATABASE dolphinscheduler DEFAULT CHARACTER SET utf8 
DEFAULT COLLATE utf8_general_ci;

- 创建用户,出现错误,修改密码等级权限

CREATE USER 'dolphinscheduler'@'%' IDENTIFIED BY 
'dolphinscheduler';

- 修改密码等级并重新创建用户

set global validate_password_policy=0;
set global validate_password_length=4;

- 授权用户

GRANT ALL PRIVILEGES ON dolphinscheduler.* TO 
'dolphinscheduler'@'%';

- 刷新用户权限

 flush privileges;

⑥ 通过修改DolphinScheduler部署脚本,一键式部署DolphinScheduler

- 进入dolphinscheduler解压目录/opt/software/apache-dolphinscheduler-2.0.5-bin/conf/config下,修改部署脚本

- 修改ips服务器配置参数

- 修改masters主节点配置参数

- 修改workers节点配置参数

- 配置告警服务所在服务器主机名

- 配置api服务所在服务器主机名

- 配置dolphinscheduler安装路径,如果不存在会创建,这里的安装路径配置为/opt/module/dolphinscheduler

- 部署用户配置,任务执行服务是以 sudo -u {linux-user} 切换不同 Linux 用户的方式来实现多租户运行作业,因此该用户必须有免密的sudo 权限,这里使用hadoop账号

- 配置JAVA_HOME路径

- 配置mysql数据库连接

- 配置zookeeper注册中心

- 配置hdfs存储资源

- yarn配置,yarn的resource节点在hadoop102

⑦ 上传mysql驱动到mysql-connector-java-8.0.16.jar到dolphinscheduler解压目录lib下

⑧在/opt/software/apache-dolphinscheduler-2.0.5-bin/script目录下执行dolphinscheduler的数据库初始化脚本

⑨启动zookeeper集群、mysql、以及hadoop集群

- 启动zookeeper

- 启动mysql

- 启动hadoop

⑩ 在/opt/software/apache-dolphinscheduler-2.0.5-bin目录下执行一键式部署安装脚本install.sh

 ⑪查看dolphinscheduler服务进程

⑫使用客户端连接dolphinscheduler

⑬dolphinscheduler服务的启停

- 在dolphinscheduler的安装目录/opt/module/dolphinscheduler/bin下有启动脚本

- 启停 Master

./bin/dolphinscheduler-daemon.sh start master-server
./bin/dolphinscheduler-daemon.sh stop master-server

- 启停 Worker

./bin/dolphinscheduler-daemon.sh start worker-server
./bin/dolphinscheduler-daemon.sh stop worker-server

- 启停 Api Server

./bin/dolphinscheduler-daemon.sh start api-server
./bin/dolphinscheduler-daemon.sh stop api-server

- 启停 Logger

./bin/dolphinscheduler-daemon.sh start logger-server
./bin/dolphinscheduler-daemon.sh stop logger-server

- 启停 Alert

./bin/dolphinscheduler-daemon.sh start alert-server
./bin/dolphinscheduler-daemon.sh stop alert-server

- 集群启停

./bin/start-all.sh
./bin/stop-all.sh

结语

至此,关于一键式DolphinScheduler高可用工作流任务调度系统部署安装到这里就结束了,我们下期见。。。。。。

更多推荐

Linux下生成可执行程序的每一步过程以及链接库的初步认识

程序的翻译程序在形成可执行程序之前都经历过一系列十分复杂的过程,也就是我们程序的翻译,程序的翻译经过以下阶段:预处理(进行宏替换)编译(生成汇编)汇编(生成机器可识别代码)连接(生成可执行文件或库文件)就以C语言代码为例,当我们写好了一份C语言代码,第一部要进行头文件的包含,然后在主函数下咔咔一顿写,再开始翻译,也就是

esh的snapshot快照备份

1)Elasticsearch的snapshot快照备份优点:通过snapshot拍摄快照,然后定义快照备份策略,能够实现快照自动化存储,可以定义各种策略来满足自己不同的备份缺点:还原不够灵活,拍摄快照进行备份很快,但是还原的时候没办法随意进行还原,类似虚拟机快照1、配置备份目录在elasticsearch.yml的配

Prometheus+Grafana可视化监控【MySQL状态】

文章目录一、安装Docker二、安装MySQL数据库(Docker容器方式)三、安装Prometheus四、安装Grafana五、Pronetheus和Grafana相关联六、安装mysqld_exporter七、Grafana添加MySQL监控模板一、安装Docker注意:我这里使用之前写好脚本进行安装Docker,

rsyslog-日志管理 logrotate-日志轮转

日志的管理的方式,以及怎么自己写一个管理日志的小脚本,其实也不能算脚本管理日志的进程rsyslogd:绝大部分日志记录,和系统操作有关,安全,认证sshd,su,计划任务at,cron…httpd/nginx/mysql:可以自己的方式记录日志psaux|greprsyslogd|grep-vgrep#最后这个管道后面

pytorch学习1

前言王者之争核心之争在于动态图优先还是静态图优先pytorch是动态计算生成新变量tf是先定义变量,再生成回归问题1、梯度下降算法了解[梯度算法是深度学习的核心,deeplearning求解复杂问题主要靠的是梯度下降算法,故deeplearning近似等于gradientprograming.]类似于高中所学的求导问题

Python 文件介绍和正则表达式

文章目录Python文件和正则表达式文件打开文件读取文件直接读取read():逐行读取采用**for**循环:采用readlines():正则表达式匹配规则re模块match方法:search方法group方法split方法编译:compile方法Python文件和正则表达式文件打开文件open函数用来打开文件,常用模

5个小功能掌握正则表达式的使用

点击下方关注我,然后右上角点击...“设为星标”,就能第一时间收到更新推送啦~~~这篇文章通过实现5个小功能,来讲述在Java中如何使用正则。Java中如何使用正则Java中正则相关类位于java.util.regex包下,主要使用2个类,如下:Pattern类:Pattern是正则表达式regex的编译表示形式Mat

手机上免费更改地址大全

大家好!今天我要分享一篇关于在手机上如何更改地址的文章。在互联网时代,地址是我们在网络世界中的身份标识,而更改地址可以为我们带来诸多便利。掌接下来,就让我们一起来了解手机上如何更改地址的全面指南吧!1.使用虚拟专用网络(虚拟私人网络)虚拟专用网络是一个常用并且有效的方法,可以帮助您更改手机上的地址。通过连接到虚拟专用网

xss渗透(跨站脚本攻击)

一、什么是XSS?XSS全称是CrossSiteScripting即跨站脚本,当目标网站目标用户浏览器渲染HTML文档的过程中,出现了不被预期的脚本指令并执行时,XSS就发生了。这里我们主要注意四点:1、目标网站目标用户;2、浏览器;3、不被预期;4、脚本。二、XSS有什么危害?当我们知道了什么是XSS后,也一定很想知

【Linux基础命令】nmtui命令使用实战

前言linux常用命令专栏已进入尾声,大约90个命令是日常工作中常用的,在拓展一些不常用的,也就100左右。是不是总结下来后,就感觉要学的内容没有那么多了。当然有些专属的基础命令不在本专栏内,比如LVM管理命令,RAID管理命令。后面还会继续添加一些shell中常用的命令。文章目录前言一.nmcui的介绍二.语法格式及

shared_ptr用法

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、初步了解二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,

热文推荐