DB-媒体集
更新时间:2026-07-03
媒体集目标端支持文件写入(MediaSet)一类 sink 插件,用于将 FTP/SFTP/HDFS 等文件源采集的文件写入项目内媒体集。本文以 FTP 文件数据源作为源端示例。
媒体集插件类型
| 插件 | plugin_name | _db_pluginId | 作业类型 | 说明 |
|---|---|---|---|---|
| 媒体集文件写入 | MediaSet |
MediaSet |
file |
将文件写入媒体集,支持同名文件覆盖、跳过或重命名 |
脚本 Demo 与参数说明
一、文件任务:FTP → MediaSet
适用于将 FTP 服务器上的图片、视频、PDF 等非结构化文件采集并写入 DataBuilder MediaSet(媒体集)的场景。作业类型为 file,source 使用 Ftp-File(参数详见 FTP 文件数据源文档),sink 使用 MediaSet。
JSON
1{
2 "_db_jobMeta": {
3 "name": "ftp_to_mediaset_file",
4 "description": "FTP 非结构化文件同步到 MediaSet",
5 "parentFolderId": "project_91cc_799bd26eee94",
6 "type": "file",
7 "mode": "script"
8 },
9 "env": {
10 "job.mode": "BATCH",
11 "parallelism": 1
12 },
13 "source": [
14 {
15 "plugin_name": "FtpFile",
16 "_db_pluginId": "Ftp-File",
17 "plugin_output": "source_file",
18 "_db_connectionId": "ftp-conn-001",
19 "path": "/data/in/documents/",
20 "filename_extension": "pdf"
21 }
22 ],
23 "sink": [
24 {
25 "plugin_name": "MediaSet",
26 "_db_pluginId": "MediaSet",
27 "plugin_input": "source_file",
28 "_db_sinkMediaSetFileId": "file-mediaset-001",
29 "_db_sinkMediaSetId": "media-app-001",
30 "_db_mediaSetFormat": "PDF",
31 "duplicate_file_strategy": "OVERWRITE"
32 }
33 ]
34}
Writer 参数:MediaSet
| 参数 | 描述 | 是否必选 | 默认值 |
|---|---|---|---|
plugin_name |
SeaTunnel 插件名,固定填 MediaSet |
是 | 无 |
_db_pluginId |
DataBuilder 侧插件 ID,固定填 MediaSet |
是 | 无 |
plugin_input |
对应 source 的 plugin_output 值 |
是 | 无 |
_db_sinkMediaSetFileId |
MediaSet 文件 ID,目标 MediaSet 的唯一标识 | 是 | 无 |
_db_sinkMediaSetId |
MediaSet 应用 ID | 否 | 无 |
_db_mediaSetFormat |
文件格式类型(如 PDF) |
否 | 无 |
duplicate_file_strategy |
同名文件处理策略:OVERWRITE(覆盖)/ SKIP(跳过)/ RENAME(重命名) |
否 | OVERWRITE |
配置编写注意事项
- plugin_name 与 _db_pluginId 均为
MediaSet:MediaSet 的引擎插件名和 DataBuilder 平台侧标识相同。 - _db_sinkMediaSetFileId 是必填:该字段是目标 MediaSet 的唯一标识,需在 DataBuilder 项目界面预先创建 MediaSet 并获取对应 FileId 后填写。
- 同名文件策略:默认
OVERWRITE会覆盖目标路径下的同名文件;如需保留历史版本,使用RENAME。 - MediaSet 仅支持 file 作业类型:
env.job.mode固定为BATCH,不支持 streaming。
评价此篇文章
