具体操作请参照 创建Bucket 。 注意: 本文中所有的数据及示例程序目前只存储在“华北-北京”区域的BOS中,“华南-广州”区域的BOS没有。 对象存储BOS与需要建立的BMR集群应在同一区域内。区域说明请参考 区域选择说明 。
平台去重策略 平台提供了可去重的数据集,即对您上传的数据进行重复样本的去重。注意:当您确定了数据集为去重或非去重的属性后,便不可修改。 当您创建了一个去重的数据集时,在后续上传数据的过程中,平台可通过检验您当前上传的样本与已上传到此数据集下的样本是否相同,如果相同,则会使用新的样本替代旧的样本。
平台去重策略 平台提供了可去重的数据集,即对您上传的数据进行重复样本的去重。注意:当您确定了数据集为去重或非去重的属性后,便不可修改。 当您创建了一个去重的数据集时,在后续上传数据的过程中,平台可通过检验您当前上传的样本与已上传到此数据集下的样本是否相同,如果相同,则会使用新的样本替代旧的样本。
鉴权认证机制的详细内容请参见 鉴权认证机制 。 通信协议 支持HTTP和HTTPS两种调用方式。为了提升数据的安全性,建议通过HTTPS调用。 请求结构说明 数据交换格式为JSON,所有request/response body内容均采用UTF-8编码。
Tips:如果您在模型训练过程中,需要通过增加某个类别标签的预测权重,可以通过增加此标签的重复样本来达到此目标 平台去重策略 平台提供了可去重的数据集,即对您上传的数据进行重复样本的去重。
小Tips:“如何利用好重复样本” 如果您的数据存在样本种类不均衡的现象,您可以通过将重复样本数量小的那一类,使其样本数量增加到与数据量大的那一类样本数量相近,以提高模型训练的效果,这种方法也称为“上采样”。 平台去重策略 平台提供了可去重的数据集,即对您上传的数据进行重复样本的去重。
群内添加如流机器人,复制webhook地址,参考操作步骤填写到 报警回调 中即可。 3. 配置成功后,当报警通知被触发时,您可以在如流群收到报警通知。
前提条件 已在Hive中创建了UDF,详情请参见 开发UDF 。 使用Hive UDF 使用文件传输工具,上传生成的JAR包至集群任意目录(本文以test目录为例)。 上传JAR包至HDFS或BOS(本文以HDFS为例)。 a.通过SSH方式登录集群,详情请参见 登录集群 。
前提条件 已创建 BMR 集群,且选择了 Hive 服务,创建集群详情请参见 创建集群 。 用户如需使用安全模式集群,在创建集群时,需将安全模式开关设置为开启。 通过Hive客户端连接 普通集群 SSH登录集群,参考 SSH连接到集群 。 执行 hive 命令即可完成连接。 安全模式集群 SSH登录集群,参考 SSH连接到集群 。
重启实例,实例中部署的服务会被重新拉起,但可能会造成您历史数据的丢失,请谨慎操作。 绑定公网 IP:单击 “绑定公网 IP” 可为未分配公网 IP 的节点绑定。 节点管理支持对节点进行扩缩容、规格变更、新增实例类型和磁盘变更。