百度BigSQL

Baidu BigSQL

通过SQL接口实现超大规模(TB级至PB级)结构化与非结构化数据集上的即席查询,洞察行业实现智能商业,而无须担心集群与运维。

产品概述

百度BigSQL是一个全托管服务,基于大规模分布式集群,用户可以导入超大量数据并通过SQL语句进行交互式分析,获取数据中的洞察。此外,百度BigSQL提供了JDBC驱动,开发人员可以将此项服务编译进他们的代码中,分析师可以通过BI工具与大数据集进行交互分析。

产品功能

数据导入

支持从百度对象存储服务BOS导入文件数据,同时支持市面流行的Proto Buffer、JSON、Parquet、CSV格式。

高吞吐率SQL查询

支持对于PB级海量结构化与半结构化数据,进行无需预处理的大批量查询;基于百度强大的计算集群保证时延可控的交互查询体验。

数据导出

支持将表数据以文件形式导出到百度对象存储服务BOS,同时支持市面流行的Proto Buffer、JSON、Parquet、CSV等格式。

支持主流BI工具

支持JDBC接口,可内嵌到Web应用或者对接BI工具。

产品优势

大规模即席查询

支持PB级数据集的即席查询,1PB数据扫描完成仅需9秒左右

标准SQL接口

此服务同时支持WEB控制台、Command Line、REST API方式进行操作,SQL语法兼容Apache Spark SQL,将兼容性做到最好

全托管服务

此服务为SQL as a Service,用户无需关注数据集的上限限制,计算集群需要多少计算、存储、网络资源,无需关注设备和服务运维,只需专注于数据分析本身,享用奇快无比的超大规模数据查询服务

按量付费

百度BigSQL服务构建于共享式大规模分布式集群之上,所有的用户共享百度巨大的计算资源池,采取按实际使用量付费的商业模式,性价比极高