推理服务监控告警
更新时间:2025-06-20
前置依赖
需要拥有BCMFullControlAccessPolicy权限才能完整查看BCM监控面板和配置BCM报警策略。 如何授权可参考账号创建与权限分配
支持的监控报警指标
- 错误码(包括V1及V2错误码)
- TPM(实际使用量)
- TPM限额
- TPM余量
- RPM(实际使用量)
- RPM限额
- RPM余量
- QPS
- 首token时延均值
- 整句时延均值
千帆侧操作指南
1.在控制台调用统计页面右上角会出现BCM云监控的超链接,点击【BCM监控告警】即可跳转BCM页面
2.BCM页面展示效果如下
BCM侧操作指南
监控报表查看
1.可以通过实例列表筛选【预置服务】列表及【定制服务】列表
2.在服务列表页面,点击任一服务名称,进入该服务的监控页面
报警策略配置
支持by服务纬度配置报警策略。
1.通过服务监控页面,选择报警策略
2、点击【添加策略】按钮
3、报警策略配置
策略规则配置支持按照监控指标、appid、error_code自定义配置报警策略。并且支持选择按照报警频率,域值进行策略选择,且支持添加“且”“或”规则
若想对报警策略进行高效复用,也可以通过报警模版配置,可以参考BCM报警通知模板
报警通知模版处可以选择通知方式和接口回调的uri,报警回调可以参考BCM报警回调
查看报警历史及报警详情
当报警发生后,您可以在报警历史页面通过产品类型、报警等级、当前状态等条件筛选想要关注的报警信息,可以参考报警历史
短信报警示例
以错误码告警为例