Apache SeaTunnel
综述
SeaTunnel
任务类型,用于创建并执行 SeaTunnel
类型任务。worker 执行该任务的时候,会通过 start-seatunnel-spark.sh
、 start-seatunnel-flink.sh
和 seatunnel.sh
命令解析 config 文件。
点击 这里 获取更多关于 Apache SeaTunnel
的信息。
创建任务
- 点击项目管理 -> 项目名称 -> 工作流定义,点击“创建工作流”按钮,进入 DAG 编辑页面;
- 拖动工具栏的 任务节点到画板中。
任务参数
- 默认参数说明请参考DolphinScheduler任务参数附录
默认任务参数
一栏。 - 启动脚本:选择你想要运行任务的启动脚本,包括
seatunnel.sh
,start-seatunnel-flink-13-connector-v2.sh
,start-seatunnel-flink-15-connector-v2.sh
,start-seatunnel-flink-connector-v2.sh
,start-seatunnel-flink.sh
,start-seatunnel-spark-2-connector-v2.sh
,start-seatunnel-spark-3-connector-v2.sh
,start-seatunnel-spark-connector-v2.sh
,start-seatunnel-spark.sh
- FLINK
- 运行模型:支持
run
和run-application
两种模式 - 选项参数:用于添加 Flink 引擎本身参数,例如
-m yarn-cluster -ynm seatunnel
- SPARK
- 部署方式:指定部署模式,
cluster
client
- Master:指定
Master
模型,yarn
local
spark
mesos
,其中spark
和mesos
需要指定Master
服务地址,例如:127.0.0.1:7077 - SEATUNNEL_ENGINE
部署方式:指定部署模式,
cluster
local
> 点击 [这里](https://seatunnel.apache.org/docs/2.3.3/command/usage) 获取更多关于`Apache SeaTunnel command` 使用的信息
自定义配置:支持自定义配置或从资源中心选择配置文件
点击 这里 获取更多关于
Apache SeaTunnel config
文件介绍脚本:在任务节点那自定义配置信息,包括四部分:
env
source
transform
sink
任务样例
该样例演示为使用 Flink 引擎从 Fake 源读取数据打印到控制台。
在 DolphinScheduler 中配置 SeaTunnel 环境
若生产环境中要是使用到 SeaTunnel 任务类型,则需要先配置好所需的环境,配置文件如下:/dolphinscheduler/conf/env/dolphinscheduler_env.sh
。
配置 SeaTunnel 任务节点
根据上述参数说明,配置所需的内容即可。
Config 样例
env {
execution.parallelism = 1
}
source {
FakeSource {
result_table_name = "fake"
field_name = "name,age"
}
}
transform {
sql {
sql = "select name,age from fake"
}
}
sink {
ConsoleSink {}
}
支持 SeaTunnel 版本
- 2.3.1
- 2.3.2
- 2.3.3