数据湖管理与分析平台EasyDAP

EasyDAP (EDAP) 是一站式数据湖管理与分析平台,提供数据采、建、管、用全生命周期的大数据能力, 帮助企业数据资产建设和开发分析应用。EDAP 提供多种计算平台支持及可拓展的开放能力,降低企业大数据开发应用门槛、提高大数据开发效率。

  • 概述及架构
  • 产品功能
  • 产品优势
  • 应用场景
  • 客户案例
  • 相关产品

产品概述

数据湖管理与分析平台EasyDAP , 封装了数据从汇聚、管理、开发、分析及服务流程,屏蔽了大数据底层技术,提供简易的可视化开发操作界面,一站完成数据集成、数据管理、批&流数据开发、数据分析服务等。降低了数据资产构建和开发分析应用的门槛,帮助企业高效实现数据价值释放。 此外,无缝对接主流大数据存储计算集群与百度云产品生态打通,可降低企业数据中台建设成本。

产品概述

产品功能

  • 数据管理

    数据湖存储管理
    支持接入并管理BOS、HDFS等数据湖存储location。
    数据源链接管理
    支持管理DB、MPP数仓、Nosql等数据源链接。
    元数据管理
    基于物理表、映射表管理各类型数据源系统数据进行统一元数据管理,数据高效查找。
  • 数据集成

    离线数据同步
    数据库、MPP数仓、Nosql、对象存储、HDFS分布式文件系统等异构数据源的定时、周期性同步。
    实时流采集
    支持http ,kafka 实时流数据同步到 DB、MPP数仓、Nosql、对象存储、HDFS分布式文件系统等数据源。
    0代码数据集成
    可视化拖拽式,拖拽式建立数据集成流水线。
  • 数据开发

    可视化开发
    拖拽式插件式开发流水线作业,作业组编排同步支持可视化拖拽。
    实时流开发
    集成Spark-streaming等流计算引擎,支持简易的在线SQL、自定义Jar程序等开发模式,高吞吐低延迟的实时计算,全方位多角度的监控告警机制等。
    离线开发
    集成MR、Spark离线数据处理引擎,提供Sparksql、Hsql、python、scala多语言支持。
  • 数据分析

    交互式分析
    支持PB级数据高并发实时查询分析,完全兼容PostgreSQL协议。
    实时分析
    与大数据生态(如:BMR、PALO、BOS)无缝打通,支持海量实时和离线数据的实时分析。
    多源联邦分析
    直接分析RDS、PALO、BMR-HBASE、BOS、BMR-HIVE、BMR-HDFS 等数据仓库、大数据存储的数据。

产品优势

全场景

数据集成、数据管理、数据开发、数据分析应用一站完成。

低门槛

拖拽式零代码数据集成、批&流可视化开发Studio、拖拽式作业编排和配置  、多源即席联合分析。

兼容开放

无缝对接主流大数据存储计算平台和云计算存储生态,丰富的开放Api等。

安全可靠

多租户资源隔离 ;行、列级数据权限管控、审计日志等。

应用场景

数据集成、开发
数据治理、管理
数据融合分析
数据中台建设
数据集成、开发

场景概述

通过EasyDAP实现异构数据源的数据集成、交换。

我们能提供

数据集成

帮助企业高效实现异构数据源之间的数据同步,以及数据仓库、数据湖构建。 支持常见各类源端、目的端,可视化拖拽式,门槛低,并且提供不需要写代码的数据清洗、处理组件。

批&流开发

可视化拖拽式批量开发Studio, 支持Spark、MR引擎。 可视化拖拽实时流开发Studio, 支持SparkStreaming引擎、Flink 引擎(敬请期待)。

客户案例

百度信息流

基于百度智能云EasyDAP 和MapReduce 高效完成手百信息流视频播放带宽的实时多维分析,优化分发策略和运营。

某制造业数据中台

采用百度智能云EasyDAP 高效完成数据集成,构建行业数据仓库,对行业数据进行统一的治理和管理。并可基于业务需求对数据进行低门槛的批&流开发、交互式的融合分析分析,释放数据价值。

相关产品