访问模式 通过BLB访问ClickHouse集群 前提条件 用户已创建BMR Clickhouse集群。 操作步骤 具体配置流程如下,参考 https://cloud.baidu.com/doc/BLB/s/cjwvxnr91 创建BLB实例,仅支持应用型BLB,根据IP绑定clickhouse实例。 配置clickh
产品功能 产品功能 便捷易用的容器化集群管理:BMR on CCE 提供可视化操作界面,用户可轻松创建、管理和升级云原生大数据集群。集群部署基于容器化架构,支持 Spark、Flink、Kyuubi 等组件的一键化安装和配置,无需复杂运维操作即可快速构建稳定可靠的计算环境。 高效作业开发与运行:BMR on CCE 提
Instance(实例) 查询实例列表 如下代码可查询指定集群和实例组的实例: Plain Text 复制 1 public void listInstances(BmrClient client, String clusterId, String instanceGroupId) { 2 try { 3 ListIn
创建表 本地表 创建本地表 Plain Text 复制 1 CREATE TABLE `check_local` ( 2 `Id` UInt16, 3 `Name` String, 4 `CreateDate` Date) 5 ENGINE = MergeTree() 6 PARTITION BY CreateDate
查看作业 注:自2024年6月30日起,MapReduce暂不提供作业相关功能支持,可通过第三方平台EasyDAP或开源组件Airflow提交任务。 在“产品服务>MapReduce>MapReduce-作业列表”中,点击作业名称,可查看作业基本信息。 Hadoop将job分成若干个task进行处理,共有两种类型的ta
BmrClient 配置BmrClient BmrClient是BMR服务的Python客户端,为调用者与BMR服务进行交互提供一系列的方法。 在新建BmrClient之前,需要先创建配置文件对BmrClient进行配置,以下将此配置文件命名为 bmr_client_conf.py ,具体配置信息如下所示: Plain
Spark示例 前提条件 已完成创建 BMR 集群,并且配置了 Paimon、Spark 组件,详情请参见创建集群。 注意事项 Paimon 的 JAR 文件已存放到 ${SPARK_HOME}/jars 目录; 默认使用 Hive Catalog; Hive 用户可以直接使用 Spark 创建的表; 启动 Spark
定时任务 注:自2024年6月30日起,MapReduce暂不提供作业相关功能支持,可通过第三方平台EasyDAP或开源组件Airflow提交任务。 简介 通过定时任务您可定时启动集群运行作业。需预先规划时间策略,并依据时间策略存储输入数据,再创建定时任务,并可对已创建的定时任务修改时间策略。 规划准备 请预先规划时间
基础使用 Spark SQL 基础操作 Spark SQL允许用户直接运用SQL语句对数据进行操作,在此过程中,Spark会负责对SQL语句进行解析、优化以及执行。 以下示例展示了如何使用Spark SQL进行读取文件。示例如下: 示例1:Spark支持多种数据格式,本示例读取了JSON格式文件的数据,并输出为Parq
Hive迁移 操作步骤 本文档描述如何把 Hive 数据库从一个 Hadoop 集群迁移到另一个 Hadoop 集群。 本文档假定新集群的 Hive 元数据库的内容可以清空。 停止老集群 Hive 集群 的 hive-metastore 和 hive-server2 停止方法:使用命令 systemctl stop h