产品概述
Pingo是集成的批量和流式数据处理系统,它在弹性计算资源管理和改进的数据访问管理层之上,运行优化的Spark计算引擎,提供SQL分析和DataFrame API,支持低延时的批量和流式数据加工和处理,对外提供REST Service任务执行接口。
产品功能

ETL
支持SQL及Spark DataFrame API编写ETL程序,支持Java、Python、Scala编写的第三方或者本地代码。

任务调度
支持ETL工作流例行调度,支持按指定周期定时执行作业以及创建依赖作业触发自动执行。

外部数据访问
支持JDBC、ODBC、数据API的方式进行外部数据访问,支持从HDFS、BOS等直接读取数据进行计算。

交互式代码调试
Pingo-Notebook提供了SQL-Kernel,允许用户在Notebook中直接书写SQL进行查询,支持写入多行SQL。
产品优势

自动化的集群管理能力
快速创建新计算集群,支持动态扩容,有效降低成本,提供快速、简单、可扩展的数据计算服务。

多种计算引擎兼容
支持批量计算和流式计算,提供SQL计算引擎和Spark Dataframe、Spark Streaming等计算框架,且支持Streaming SQL。

多存储后端数据联合查询
提供存储资源接入层,不仅自身具备文件存储能力,还能无缝接入多种外部存储系统,支持BOS、HDFS等存储资源数据接入Pingo。

多结构化元数据管理
提供自建表和同步表的元数据管理,完善的元数据权限管理功能,保护用户数据不被轻易删除的同时,能让数据安全执行联合查询。
客户案例
相关产品
未登录
需要实名认证