AllData数据中台核心菜单十三:数据湖平台

作者:AllData公司负责人2025.02.17 11:22浏览量:5

简介:AllData大数据产品是可定义数据中台,以数据平台为底座,以数据中台为桥梁

🔥🔥 AllData大数据产品是可定义数据中台,以数据平台为底座,以数据中台为桥梁,以机器学习平台为中层框架,以大模型应用为上游产品,提供全链路数字化解决方案。

「 AllData数据中台 - 主页 」

「 数据湖平台 - 功能描述 」

1、AllData数据同步平台基于开源项目Paimon建设。

2、Paimon是一种数据湖格式,支持使用 Flink 和 Spark 构建实时 Lakehouse 架构,用于流式和批处理操作。创新地结合了 Lake 格式和 LSM 结构,将实时流式更新引入数据湖架构。

3、Paimon数据湖通过一套完善的入湖工具,实现了实时数据同步至数据湖的功能,支持MySQL等多元数据库系统的数据变化快速捕捉与存储。它融合了Flink的流处理能力和Spark等计算引擎的批处理能力,实现了数据湖上的批流一体处理,降低了数据处理的复杂性和成本。

4、Paimon数据湖注重生态集成,与Hive、Trino、Presto等大数据典型计算引擎深度整合,提供了统一的数据存储和访问接口。其底层采用先进的存储架构和技术,如LSM树等,确保了高效的数据写入和查询性能。

5、Paimon数据湖是一个功能强大、易于使用且成本效益高的存储解决方案,适用于各种大数据场景,为数据分析和实时计算提供了坚实的基础。

「 数据湖平台 - 模块功能汇总 」

「 数据湖平台 - 功能点展示 」

「 数据湖任务 」

「 数据湖查询 」查询

「 数据湖查询 」工作台

「 基础元数据 」创建Catalog

「 基础元数据 」创建Database

「 基础元数据 」数据表-Table信息

「 基础元数据 」数据表-Option信息

「 基础元数据 」数据表-Schema信息

「 基础元数据 」数据表-Snapshot信息

「 基础元数据 」数据表-Manifest信息

「 基础元数据 」数据表-数据文件

「 基础元数据 」创建Table

「 CDC集成 」

「 CDC集成 」创建同步作业

「 CDC集成 」创建同步作业-编辑(MySQL-Paimon)

「 CDC集成 」创建同步作业-编辑(Kafka-Paimon)

「 CDC集成 」创建同步作业-编辑(MongoDB-Paimon)

「 CDC集成 」创建同步作业-编辑(PostgreSQL-Paimon)

「 CDC集成 」创建同步作业-运行

「 数据湖集群 」

「 数据湖集群 」新增集群

「 数据湖集群 」更新集群

「 数据湖集群 」集群连通性检测