博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
azkaban调度
阅读量:4984 次
发布时间:2019-06-12

本文共 2106 字,大约阅读时间需要 7 分钟。

azkaban调度

1、概述

azkaban是一套调度系统,常用大数据作业调度。azkaban包括web和executor两套程序,web主要完成展示和交互,executor上完成调度和作业提交执行。

2、安装

3、启动

3.1 启动web程序

$>/soft/azkaban/web/bin/azkaban-web-start.sh

3.2 执行executor程序

$>/soft/azkaban-exec/bin/azkaban-executor-start.sh

4、登录webui

http://s101:8081

5、登录界面

azkaban-001

azkaban-002

6、创建工程

6.1 点击创建项目按钮

azkaban-003

6.2 输入项目信息

azkaban-004

6.3 查看创建项目

azkaban-005

7、创建job文件和依赖关系

7.1 编写job文件

job文件以job作为扩展名,job中涉及的sh脚本需要保证在executor节点上存在,实际执行时都是由executor在本机上执行特定的shell脚本。

7.1.1 加载数据到原生表job

[1_load_data_to_hive_raw_logs.job],该job是第一个job,没有依赖。

type=commandcommand=sh /home/centos/umeng/load_data_to_hive_raw_logs.sh

##### 7.1.2 叉分startuplogs并转储job

[2_1_fork_startuplogs.job]

type=commandcommand=sh /home/centos/umeng/fork_logs.sh fork_startuplogs.sql forkstartuplogsdependencies=1_load_data_to_hive_raw_logs
7.1.3 叉分eventlogs并转储job

[2_2_fork_eventlogs.job]

type=commandcommand=sh /home/centos/umeng/fork_logs.sh fork_eventlogs.sql forkeventlogsdependencies=1_load_data_to_hive_raw_logs
7.1.4 叉分errorlogs并转储job

[2_3_fork_errorlogs.job]

type=commandcommand=sh /home/centos/umeng/fork_logs.sh fork_errorlogs.sql forkerrorlogsdependencies=1_load_data_to_hive_raw_logs
7.1.5 叉分usagelogs并转储

[2_4_fork_usagelogs.job]

type=commandcommand=sh /home/centos/umeng/fork_logs.sh fork_usagelogs.sql forkusagelogsdependencies=1_load_data_to_hive_raw_logs
7.1.6 job 叉分pagelogs并转储job

[2_5_fork_pagelogs.job]

type=commandcommand=sh /home/centos/umeng/fork_logs.sh fork_pagelogs.sql forkpagelogsdependencies=1_load_data_to_hive_raw_logs
7.1.7 编写收尾job

job之间可以指定依赖,多个依赖使用,分割。

[3_end.job]

type=noopdependencies=2_1_fork_startuplogs,2_2_fork_eventlogs,2_3_fork_errorlogs,2_4_fork_usagelogs,2_5_fork_pagelogs
7.1.8 总结

以上共生成7个job文件,如下图所示:

azkaban-006

8、将所有job打成一个zip文件

8.1 安装zip命令

centos 7默认没有集成zip命令,需要单独安装。

#安装zip命令$>sudo yum install -y zip

8.2 打包job文件到一个zip中

$>cd /home/centos/umeng/job#将当前所有文件打成1.zip文件$>zip 1.zip *

8.3 1.zip文件内容如下

azkaban-009

9、上传zip文件

9.1 点击上传按钮

azkaban-007

9.2 选中zip文件

azkaban-008

9.3 查看上传结果

azkaban-010

9.4 展开job,查看依赖关系

azkaban-011

10、job的执行与调度

job在上传之后,可以单独执行某个job,带依赖关系也可以不带依赖关系。执行通常用来测试,测试通过后就可以进行调度作业。

10.1 job执行

10.1.1 展开job的依赖列表

azkaban-012

azkaban-013

10.1.2 执行无依赖job

azkaban-014

azkaban-015

10.1.3 执行有依赖job

azkaban-016

azkaban-017

10.1.4 执行无依赖job

转载于:https://www.cnblogs.com/xupccc/p/9545703.html

你可能感兴趣的文章
Latest Common Ancestor
查看>>
getByClass--获取指定标签且class为指定的所有元素
查看>>
三点顺序
查看>>
拟物化设计与扁平化设计
查看>>
PS小实验-去除水印
查看>>
IS-IS完整笔记
查看>>
★如何解释特修斯之船问题?
查看>>
玩转PS路径,轻松画logo!
查看>>
Python简介及学习
查看>>
!!!后续博客写到简书 + 博客园留博客目录
查看>>
小白学数据分析-----> 利用SPSS对DAU/MAU进行比率分析
查看>>
js中this与srcElement的区别
查看>>
第一个MyBatis程序
查看>>
.net 数据库缓存依赖:【实例与解释】
查看>>
Android Service小试 启动和停止service
查看>>
一天一个设计模式:适配器模式
查看>>
第5题 查找字符串中的最长回文字符串---Manacher算法
查看>>
HDOJ 1069 Monkey and Banana 解题报告
查看>>
11锚点与图像对象
查看>>
Ios中比较两个日期之间的时间差距
查看>>