简介:AllData大数据产品是可定义数据中台,以数据平台为底座,以数据中台为桥梁
🔥🔥 AllData大数据产品是可定义数据中台,以数据平台为底座,以数据中台为桥梁,以机器学习平台为中层框架,以大模型应用为上游产品,提供全链路数字化解决方案。
「 AllData数据中台 - 主页 」
「 数据湖平台 - 功能描述 」
1、AllData数据同步平台基于开源项目Paimon建设。
2、Paimon是一种数据湖格式,支持使用 Flink 和 Spark 构建实时 Lakehouse 架构,用于流式和批处理操作。创新地结合了 Lake 格式和 LSM 结构,将实时流式更新引入数据湖架构。
3、Paimon数据湖通过一套完善的入湖工具,实现了实时数据同步至数据湖的功能,支持MySQL等多元数据库系统的数据变化快速捕捉与存储。它融合了Flink的流处理能力和Spark等计算引擎的批处理能力,实现了数据湖上的批流一体处理,降低了数据处理的复杂性和成本。
4、Paimon数据湖注重生态集成,与Hive、Trino、Presto等大数据典型计算引擎深度整合,提供了统一的数据存储和访问接口。其底层采用先进的存储架构和技术,如LSM树等,确保了高效的数据写入和查询性能。
5、Paimon数据湖是一个功能强大、易于使用且成本效益高的存储解决方案,适用于各种大数据场景,为数据分析和实时计算提供了坚实的基础。
「 数据湖任务 」
「 数据湖查询 」查询
「 数据湖查询 」工作台
「 基础元数据 」创建Catalog
「 基础元数据 」创建Database
「 基础元数据 」数据表-Table信息
「 基础元数据 」数据表-Option信息
「 基础元数据 」数据表-Schema信息
「 基础元数据 」数据表-Snapshot信息
「 基础元数据 」数据表-Manifest信息
「 基础元数据 」数据表-数据文件
「 基础元数据 」创建Table
「 CDC集成 」
「 CDC集成 」创建同步作业
「 CDC集成 」创建同步作业-编辑(MySQL-Paimon)
「 CDC集成 」创建同步作业-编辑(Kafka-Paimon)
「 CDC集成 」创建同步作业-编辑(MongoDB-Paimon)
「 CDC集成 」创建同步作业-编辑(PostgreSQL-Paimon)
「 CDC集成 」创建同步作业-运行
「 数据湖集群 」
「 数据湖集群 」新增集群
「 数据湖集群 」更新集群
「 数据湖集群 」集群连通性检测