hadoop-mapreduce-examples.jar") .withMainClass("org.apache.hadoop.examples.WordCount") .withArguments("bos://path/to/input bos://path/to/java_output") ); // Streaming作业 steps.add
steps = [ BmrClient . step ( 'Java' , 'Continue' , BmrClient . java_step_properties ( 'bos://benchmark/hadoop/hadoop-mapreduce-examples.jar' , 'org.apache.hadoop.examples.WordCount' , 'bos://helloworld
BceServerException 服务器异常 获取事件异常 用户可以使用try获取某个事件所产生的异常,例如: try { CreateClusterResponse response = bmrClient . createCluster ( new CreateClusterRequest ( ) . withName ( java-sdk-test ) . withImageType ( hadoop
2022-07 BMR发布全新BMR1.6.0版本,支持Hadoop 2.8.5、Spark 2.4.8、Hive 2.3.9等版本。 支持删除已释放集群和修改标签和批量编辑标签功能。 默认不再开启dns解析按钮。 提供集群名称、实例ID、作业ID等复制功能。 修复BMR 3.0.0镜像选中spark后不关联hive的问题。
使用远程文件 如果您的作业参数需要依赖本地文件,可以选择使用“附加文件”功能,将远程文件映射到本地路径,即可直接使用远程文件。例如hadoop中的-libjars参数只支持本地文件,通过添加附加文件参数就可以让-libjars使用BOS上的文件,您只需将文件上传至BOS,Hadoop作业即可读取到文件。 需要注意的是,在应用程序参数中使用的文件名需要和本地文件路径设置的文件名保持一致。
适用范围 诊断或调优Hadoop MR作业,Hadoop Streaming作业,Spark作业。后续会增加Hive、Pig、HBase的诊断或调优。 查看失败作业的诊断信息 在集群作业页面,点击已失败作业的作业名称可查看该作业详情。 在作业详情页面,点击“诊断”,进入诊断页面。 如上图所示,诊断的内容包含了用户的配置或者程序出错的信息,以及给出的建议。
登录RDS后,选择一个数据库导入下载的sql文件,构建bmr_public_data_logs数据表,导入公共数据集。 步骤如下: 选中数据库sqoop; 点击导入; 选择下载的sql文件,注意如果是自己的sql文件,不能超过8M,超过8M可以先尝试压缩成zip文件,注意压缩文件结尾为.sql.zip。
Spark提供了Java、Scala、Python和R语言的高水平API,同时Spark已无缝融合了丰富的工具:Spark SQL(SQL)、MLlib(机器学习)、GraphX(图形处理)、Spark Streaming(流式处理)。Spark可访问存储在HDFS、HBase、Cassandra、本地文件系统等上的数据,支持文本文件、序列文件、以及任何Hadoop的输入文件。
点击“删除”,可以删除该BMR账号。 点击表格右上角“去Ranger配置权限”,为创建的BMR账号配置在集群中的组件及数据访问权限。请注意,若不配置权限,默认无法使用组件及访问数据。Ranger的初始账号密码为admin、rangeradmin123,请管理员用户及时修改密码。
登录控制台( 百度智能云登录平台 ),选择“产品服务->MapReduce BMR”,点击“创建集群”,进入集群创建页,并做如下配置: 设置集群名称 设置管理员密码 关闭日志开关(如果打开,需要选择存放日志用的bos目录,bos目录的bucket必须已经存在 选择镜像版本“BMR 2.0(hadoop 3.1)“ (只有BMR2.0 及以上版本的zeppelin方可用) 选择内置模板“zeppelin