千帆大模型平台 ModelBuilder
更新时间:2026-06-03
千帆大模型平台 ModelBuilder包含预置服务(System)、定制服务(Custom)2种监控对象类型,各个类型包含的监控指标列表如下:
预置服务(System)
| 指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 | 备注 |
|---|---|---|---|---|
| SystemInternalErrorCode | 系统内部错误 | 次 | error_code,serviceId,appId | |
| AuthErrorCode | 鉴权错误 | 次 | error_code,serviceId,appId | |
| UserInputErrorCode | 用户输入错误 | 次 | error_code,serviceId,appId | |
| QuotaExceededErrorCode | 配额超限错误 | 次 | error_code,serviceId,appId | |
| PluginErrorCode | 插件错误 | 次 | error_code,serviceId,appId | |
| TokenizerErrorCode | Tokenizer错误 | 次 | error_code,serviceId,appId | |
| ImageTextErrorCode | 图文类错误 | 次 | error_code,serviceId,appId | |
| ServiceErrorCode | 其他服务错误 | 次 | error_code,serviceId,appId | |
| PromptOptimizationErrorCode | Prompt优化服务错误 | 次 | error_code,serviceId,appId | |
| TPMRateLimit | TPM限额 | TPM | serviceId,appId | |
| TPM | TPM | TPM | serviceId,appId | |
| AvailableTPM | TPM余量 | TPM | serviceId,appId | |
| RPMRateLimit | RPM限额 | RPM | serviceId,appId | |
| RPM | RPM | RPM | serviceId,appId | |
| AvailableRPM | RPM余量 | RPM | serviceId,appId | |
| QPS | QPS | QPS | serviceId,appId | |
| TimeToFirstTokenAVG | 首token时延均值 | ms | serviceId,appId | |
| LatencyAVG | 整句时延均值 | ms | serviceId,appId | |
| SuccessRequestCount | 调用成功量 | 次 | serviceId,appId | |
| FailureRequestCount | 调用失败量 | 次 | serviceId,appId | |
| CachedCount | Prompt cached次数 | 次 | serviceId,appId | |
| TotalTokens | 调用tokens量 | token | serviceId,appId | |
| InputTokens | 输入tokens量 | token | serviceId,appId | |
| OutputTokens | 输出tokens量 | token | serviceId,appId | |
| CacheTokens | Prompt cache tokens数 | token | serviceId,appId | |
| ResponseLatencyAVG | 响应时延 | ms | serviceId,appId | |
| OTPSAVG | 每秒输出的token数量 | tokens/s | serviceId,appId |
定制服务(Custom)
| 指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 | 备注 |
|---|---|---|---|---|
| SystemInternalErrorCode | 系统内部错误 | 次 | error_code,serviceId,appId | |
| AuthErrorCode | 鉴权错误 | 次 | error_code,serviceId,appId | |
| UserInputErrorCode | 用户输入错误 | 次 | error_code,serviceId,appId | |
| QuotaExceededErrorCode | 配额超限错误 | 次 | error_code,serviceId,appId | |
| PluginErrorCode | 插件错误 | 次 | error_code,serviceId,appId | |
| TokenizerErrorCode | Tokenizer错误 | 次 | error_code,serviceId,appId | |
| ImageTextErrorCode | 图文类错误 | 次 | error_code,serviceId,appId | |
| ServiceErrorCode | 其他服务错误 | 次 | error_code,serviceId,appId | |
| PromptOptimizationErrorCode | Prompt优化服务错误 | 次 | error_code,serviceId,appId | |
| TPMRateLimit | TPM限额 | TPM | serviceId,appId | |
| TPM | TPM | TPM | serviceId,appId | |
| AvailableTPM | TPM余量 | TPM | serviceId,appId | |
| RPMRateLimit | RPM限额 | RPM | serviceId,appId | |
| RPM | RPM | RPM | serviceId,appId | |
| AvailableRPM | RPM余量 | RPM | serviceId,appId | |
| QPS | QPS | QPS | serviceId,appId | |
| TimeToFirstTokenAVG | 首token时延均值 | ms | serviceId,appId | |
| LatencyAVG | 整句时延均值 | ms | serviceId,appId | |
| SuccessRequestCount | 调用成功量 | 次 | serviceId,appId | |
| FailureRequestCount | 调用失败量 | 次 | serviceId,appId | |
| CachedCount | Prompt cached次数 | 次 | serviceId,appId | |
| TotalTokens | 调用tokens量 | token | serviceId,appId | |
| InputTokens | 输入tokens量 | token | serviceId,appId | |
| OutputTokens | 输出tokens量 | token | serviceId,appId | |
| CacheTokens | Prompt cache tokens数 | token | serviceId,appId | |
| ResponseLatencyAVG | 响应时延 | ms | serviceId,appId | |
| OTPSAVG | 每秒输出的token数量 | tokens/s | serviceId,appId |
评价此篇文章
