博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
2-10 就业课(2.0)-oozie:2、介绍和安装1
阅读量:4981 次
发布时间:2019-06-12

本文共 1826 字,大约阅读时间需要 6 分钟。

oozie的安装及使用

1、  oozie的介绍

Oozie是运行在hadoop平台上的一种工作流调度引擎,它可以用来调度与管理hadoop任务,如,MapReduce、Pig等。那么,对于OozieWorkflow中的一个个的action(可以理解成一个个MapReduce任务)Oozie是根据什么来对action的执行时间与执行顺序进行管理调度的呢?答案就是我们在数据结构中常见的有向无环图(DAGDirect Acyclic Graph)的模式来进行管理调度的,我们可以利用HPDL语言(一种xml语言)来定义整个workflow,实现工作流的调度oozie的架构以及执行流程

2、oozie的架构

 

oozie的执行流程

 

oozie的组件介绍

workFlow:工作流,定义我们的工作流的任务的执行,主要由一个个的action,在xml中进行配置即可

Coordinator :协作器,说白了就是oozie当中的定时任务调度的模块

Bundle :多个Coordinator 的抽象,可以通过bundle将多个Coordinator 进行组装集合起来,形成一个bundle。(用得很少)

 

3、oozie的安装

第一步:修改core-site.xml

修改core-site.xml添加我们hadoop集群的代理用户

cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop

vim  core-site.xml

       <property>

                <name>hadoop.proxyuser.root.hosts</name>

                <value>*</value>

        </property>

        <property>

                <name>hadoop.proxyuser.root.groups</name>

                <value>*</value>

        </property>

注意:hadoop的历史任务的服务必须启动,即19888端口可以查看,具体如何配置19888请查看hadoop课程的环境搭建

修改完成之后,记得重启hadoop的hdfs与yarn集群,还要记得启动jobhistory

重启hdfs与yarn集群

cd /export/servers/hadoop-2.6.0-cdh5.14.0

sbin/stop-dfs.sh

sbin/start-dfs.sh

sbin/stop-yarn.sh

sbin/start-yarn.sh

 

第二步:上传oozie的安装包并解压

将我们的oozie的安装包上传到/export/softwares

cd /export/softwares/

tar -zxvf oozie-4.1.0-cdh5.14.0.tar.gz -C ../servers/

 

第三步:解压hadooplibs到与oozie平行的目录

cd /export/servers/oozie-4.1.0-cdh5.14.0

tar -zxvf oozie-hadooplibs-4.1.0-cdh5.14.0.tar.gz -C ../

 

第四步:创建libext目录

在oozie的安装路径下创建libext目录

cd /export/servers/oozie-4.1.0-cdh5.14.0

mkdir -p libext

 

第五步:拷贝依赖包到libext

拷贝一些依赖包到libext目录下面去

拷贝所有的依赖包

cd /export/servers/oozie-4.1.0-cdh5.14.0

cp -ra hadooplibs/hadooplib-2.6.0-cdh5.14.0.oozie-4.1.0-cdh5.14.0/* libext/

拷贝mysql的驱动包

cp /export/servers/hive-1.1.0-cdh5.14.0/lib/mysql-connector-java-5.1.38.jar /export/servers/oozie-4.1.0-cdh5.14.0/libext/

 

第六步:添加ext-2.2.zip压缩包

拷贝ext-2.2.zip这个包到libext目录当中去

将我们准备好的软件ext-2.2.zip拷贝到我们的libext目录当中去

 

转载于:https://www.cnblogs.com/mediocreWorld/p/11154892.html

你可能感兴趣的文章
问卷调查
查看>>
软件工程第五次作业
查看>>
Spring MVC 向前台页面传值-ModelAndView
查看>>
安卓开发之内容提供者案例
查看>>
阿里电话面试问题----100万个URL怎样找到出现频率最高的前100个?
查看>>
socket编程之obj压缩加密传输
查看>>
连载:面向对象葵花宝典:思想、技巧与实践(36) - 设计原则怎样用?
查看>>
代码清除页面切换过渡现象
查看>>
UIPageControll 的属性和用法
查看>>
(024)[工具软件]截屏录屏软件FSCapture(转)
查看>>
easyui datagrid 获取行号及根据行号获取该行数据
查看>>
ubuntu下SiLabs EC3调试C8051F 单片机
查看>>
php使用递归创建多级目录
查看>>
windows下配置nginx+php环境
查看>>
阿里云时间服务器
查看>>
流密码_电子科大慕课笔记_七八讲
查看>>
Mac系统下安装ipython分别支持python2和python3
查看>>
数学图形(1.45)毛雷尔玫瑰(Maurer rose)
查看>>
python中的关键字---3(内置函数)
查看>>
移动端键盘定制
查看>>