Apache SeaTunnel

综述

SeaTunnel 任务类型,用于创建并执行 SeaTunnel 类型任务。worker 执行该任务的时候,会通过 start-seatunnel-spark.shstart-seatunnel-flink.shseatunnel.sh 命令解析 config 文件。 点击 这里 获取更多关于 Apache SeaTunnel 的信息。

创建任务

  • 点击项目管理 -> 项目名称 -> 工作流定义,点击“创建工作流”按钮,进入 DAG 编辑页面;
  • 拖动工具栏的SeaTunnel - 图1 任务节点到画板中。

任务参数

  • 默认参数说明请参考DolphinScheduler任务参数附录默认任务参数一栏。
  • 启动脚本:选择你想要运行任务的启动脚本,包括 seatunnel.sh, start-seatunnel-flink-13-connector-v2.sh, start-seatunnel-flink-15-connector-v2.sh, start-seatunnel-flink-connector-v2.sh, start-seatunnel-flink.sh, start-seatunnel-spark-2-connector-v2.sh, start-seatunnel-spark-3-connector-v2.sh, start-seatunnel-spark-connector-v2.sh, start-seatunnel-spark.sh
  • FLINK
  • 运行模型:支持 runrun-application 两种模式
  • 选项参数:用于添加 Flink 引擎本身参数,例如 -m yarn-cluster -ynm seatunnel
  • SPARK
  • 部署方式:指定部署模式,cluster client
  • Master:指定 Master 模型,yarn local spark mesos,其中 sparkmesos 需要指定 Master 服务地址,例如:127.0.0.1:7077
  • SEATUNNEL_ENGINE
  • 部署方式:指定部署模式,cluster local

    1. > 点击 [这里](https://seatunnel.apache.org/docs/2.3.3/command/usage) 获取更多关于`Apache SeaTunnel command` 使用的信息
  • 自定义配置:支持自定义配置或从资源中心选择配置文件

    点击 这里 获取更多关于Apache SeaTunnel config 文件介绍

  • 脚本:在任务节点那自定义配置信息,包括四部分:env source transform sink

任务样例

该样例演示为使用 Flink 引擎从 Fake 源读取数据打印到控制台。

在 DolphinScheduler 中配置 SeaTunnel 环境

若生产环境中要是使用到 SeaTunnel 任务类型,则需要先配置好所需的环境,配置文件如下:/dolphinscheduler/conf/env/dolphinscheduler_env.sh

seatunnel_task01

配置 SeaTunnel 任务节点

根据上述参数说明,配置所需的内容即可。

seatunnel_task02

Config 样例

  1. env {
  2. execution.parallelism = 1
  3. }
  4. source {
  5. FakeSource {
  6. result_table_name = "fake"
  7. field_name = "name,age"
  8. }
  9. }
  10. transform {
  11. sql {
  12. sql = "select name,age from fake"
  13. }
  14. }
  15. sink {
  16. ConsoleSink {}
  17. }

支持 SeaTunnel 版本

  • 2.3.1
  • 2.3.2
  • 2.3.3