千帆大模型平台 ModelBuilder 千帆大模型平台 ModelBuilder包含预置服务(System)、定制服务(Custom)2种监控对象类型,各个类型包含的监控指标列表如下: 预置服务(System) 指标英文名称(metric name) 指标中文名称 单位 维度 备注 SystemInternalErrorCode 系统内部错误 次 error_code,serviceId,appId
训练效果监控Tensorboard 概述 TensorBoard是一个用于可视化TensorFlow模型训练过程和结果的工具。它可以帮助开发人员和研究人员更好地理解和调试他们的模型,从而提高模型的性能和效率。百舸AI计算平台AIHC中集成了Tensorboard的能力,本文将介绍如何在百舸平台使用Tensorboard。
训练任务资源监控 百舸平台针对于训练任务的资源使用,提供了全面的监控指标,帮助您更好地掌握资源负载情况。下面将介绍如何查询训练任务的监控。 前提条件 资源池已经接入百度云 Prometheus监控服务 。请参考 资源池接入Prometheus监控实例 。 已经创建训练任务,详情可参考 创建任务 。 查询入口 登录 百舸控制台 。
查看集合通信监控 登录 百舸AI计算平台AIHC控制台 。 左侧菜单栏单击 分布式训练 ,进入训练任务列表页面 选择需要查询的训练任务,单击 监控 > 集合通信带宽监控, 即可查询该任务的集合通信监控大盘
附录-监控指标内置标签说明 百舸平台在监控指标体系中内置的标准标签(label) ,用于对训练任务与资源进行统一标识与多维度区分。平台会自动在系统级与自定义监控指标中附加这些标签,无需用户手动维护,主要用于任务溯源、按租户/队列/地域等维度进行统计与运维分析。
工作流接口 新建工作流接口 接口描述 创建工作流Workflow。 请求(Request) 请求语法: Http 复制 1 POST /v{version}/workflow HTTP/1.1 2 x-bce-date: {utc-date-string} 3 host: bvw.bj.baidubce.com 4 c
通知接口 新建通知接口 接口描述 创建通知。 请求(Request) 请求语法: Http 复制 1 POST /v{version}/notification HTTP/1.1 2 x-bce-date: {utc-date-string} 3 host: bvw.bj.baidubce.com 4 content-
配置长视频审核策略 使用前须知 如果您还未阅读长视频审核 接口简介 建议先阅读,本章节将会指导您如何在内容审核平台配置长视频审核策略。 因产品能力升级,在2026年2月27日前接入的客户,在「策略管理」页面部分审核维度下能同时看到新旧两个版本的标签配置,建议尽快全量使用新版标签能力,旧版也可继续使用,如需技术指导,可提交工单,将有专人指导您使用。
功能描述 多种检测算法:支持阈值比例、边缘检测、直方图三种黑边检测算法,适应不同视频内容 智能核心区域保护:自动保护视频中心区域,避免误裁剪重要内容 连续黑边过滤:可配置连续黑边行/列阈值,过滤掉小范围黑色区域 音频保留:可选择是否保留原始音频流 批量处理:支持对多个视频文件并行处理 CPU环境即可运行,无需GPU 视频上传前的预处理(去除平台黑边) 老旧视频修复(去除胶片黑边) 内容平台适配(统一画面比例
VideoMind提升视频平台内容分析和生产效率。